介绍

  • Docspell 是一个个人文档组织者。或者有时称为 “文档管理系统”(DMS)。您需要扫描仪进行转换 您的论文到文件。然后,Docspell 可以协助组织 导致的混乱😉.它可以统一您的文件与扫描仪、电子邮件 和其他来源。它针对家庭使用,即家庭, 家庭以及较小的团体/公司。

  • 您可以关联标签、设置对应关系和许多其他内容 预定义和自定义元数据。如果您的文档与 这样的元数据,你可以稍后使用搜索快速找到它们 特征。但是手动添加它是一项繁琐的任务。Docspell 可以提供帮助 通过建议通讯员、猜测标签或查找日期 机器学习。它可以从现有文档中学习元数据,并且 使用 NLP 查找内容。这使得向文档添加元数据成为 容易多了。对于机器学习,它依赖于免费的 (GPL) 斯坦福核心 NLP 库。

  • Docspell 还可以在您的文档上运行 OCR(如果需要),可以提供 全文搜索,并具有出色的电子邮件集成。一切都是 可通过 REST/HTTP API 访问。移动友好的 SPA Web 应用程序 是默认用户界面。安卓 应用程序存在 方便地从您的手机/平板电脑和 CLI 上传文件。功能 概述列出了更多内容 点。

Docspell特点

  • 每个帐户多用户:每个帐户(集合体)可以有多个用户共享 相同的文件。例如,您家庭中的每个人都可以与您的 文件,同时使用自己的帐户和自己的设置。

  • 使用 OCR 提取文本:从所有文件中提取文本。对于扫描的文档/图像,OCR 通过使用 tesseract 来使用。对文本进行分析,并可用于全文检索。

  • 文本分析:使用 ML 算法分析提取的文本,以查找可以自动注释到文档的属性。

  • 支持多个文件:Docspell 可以读取多种文件类型。提取 ZIP 和 EML(电子邮件文件格式)文件并导入其内容。

  • 转换为 PDF:所有文件都转换为 PDF。不要担心原件。原始文件也被存储起来,可以原封不动地下载。从图像数据(通常从扫描仪返回)创建 PDF 时,生成的 PDF 包含提取的文本并且可搜索。

  • 全文搜索:所有文件的提取文本和某些属性(如名称和注释)都可用于全文搜索。全文搜索还可用于进一步约束搜索菜单的结果,您可以在其中按标签、通讯员等进行搜索。

  • 通过电子邮件发送:用户可以在应用程序中定义 SMTP 设置,然后能够通过电子邮件发送项目。这通常对与其他人共享很有用。当然,您的地址簿中有电子邮件地址补全。

  • 导入邮箱:用户可以定义 IMAP 设置,以便 docspell 可以导入他们的电子邮件。这可以根据计划定期完成。导入的邮件可以移出到另一个文件夹或删除。

  • 通知:用户可以通过电子邮件、Matrix 或 Gotify 收到定期执行的查询产生的文档通知。还可以为特定事件配置通知。

安装教程

docker-compose方式安装

  1. 演示以在群晖NAS系统上安装为例
    (其他系统请自行安装好最新版本Docker、docker-compose、git)

  2. 群晖套件中心安装Git Server套件(群晖上使用git clone命令需要安装这个)
    image-dgbe.png

  3. 打开群晖的SSH功能,使用终端软件进行连接,并切换到root状态下。

  4. 进入群晖的docker文件夹(你想将容器数据存储到哪就进哪个文件夹)

    cd /volume1/docker
  5. 复制下面的命令,粘贴到终端内,克隆项目文件到本地。

    git clone https://github.com/eikek/docspell
  6. 进入项目文件夹

    cd docspell/docker/docker-compose
  7. 如果你要修改默认的7880访问端口,可以继续下一步。(可选)
    编辑docker-compose.yml文件

    vi docker-compose.yml
  8. 按字母 i 键进入编辑模式,修改下面的配置文件,按Esc键退出编辑模式,输入 :wq 退出并保存。(可选)

    version: '3.8'
    services:
    
      # The restserver and joex containers defined here are configured
      # using env variables. Both must connect to the same database and
      # solr instance. More information on configuring can be found here:
      # https://docspell.org/docs/configure
      #
      # Please replace the values of the following with a custom secret
      # string:
      #
      # - DOCSPELL_SERVER_ADMIN__ENDPOINT_SECRET
      # - DOCSPELL_SERVER_AUTH_SERVER__SECRET
      # - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_HEADER__VALUE
      #   (use the same value at the consumedir container!)
      #
      # After creating an account, you may want to set signup mode to
      # "closed" or to "invite". When using invite, you must also set
      # DOCSPELL_SERVER_BACKEND_SIGNUP_NEW__INVITE__PASSWORD to some
      # secret.
      restserver:
        image: docspell/restserver:latest
        container_name: docspell-restserver
        restart: unless-stopped
        ports:
          - "7880:7880"    #第一个7880是容器外部访问端口,你可以自行修改。
        environment:
          - TZ=Europe/Berlin
          - DOCSPELL_SERVER_INTERNAL__URL=http://docspell-restserver:7880
          - DOCSPELL_SERVER_ADMIN__ENDPOINT_SECRET=admin123
          - DOCSPELL_SERVER_AUTH_SERVER__SECRET=
          - DOCSPELL_SERVER_BACKEND_JDBC_PASSWORD=dbpass
          - DOCSPELL_SERVER_BACKEND_JDBC_URL=jdbc:postgresql://db:5432/dbname
          - DOCSPELL_SERVER_BACKEND_JDBC_USER=dbuser
          - DOCSPELL_SERVER_BIND_ADDRESS=0.0.0.0
          - DOCSPELL_SERVER_FULL__TEXT__SEARCH_ENABLED=true
          - DOCSPELL_SERVER_FULL__TEXT__SEARCH_SOLR_URL=http://docspell-solr:8983/solr/docspell
          - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_ENABLED=true
          - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_ENABLED=true
          - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_HEADER__VALUE=integration-password123
          - DOCSPELL_SERVER_BACKEND_SIGNUP_MODE=open
          - DOCSPELL_SERVER_BACKEND_SIGNUP_NEW__INVITE__PASSWORD=
          - DOCSPELL_SERVER_BACKEND_ADDONS_ENABLED=false
        depends_on:
          - solr
          - db
    ###
    #演示只是复制一部分,后面的一部分就不复制在这里了,只修改上面的就行。
  9. 在当前路径下创建docs文件夹

    mkdir docs
  10. 执行命令,启动docker-compose文件,拉取镜像并创建容器。

    docker-compose up -d
  11. 查看正在运行的项目容器

    docker-compose ps

访问Docspell

  1. 打开浏览器,以群晖的IP+设置的端口进行访问。
    以本机为例:http://192.168.2.35:7880
    点击注册账户

  2. 自行注册一个账户

  3. 然后使用注册的账户进行登录
    image-uzxm.png

  4. 该系统是没有中文界面的,看不懂的浏览器翻译为中文。
    点击上传文件

  5. 上传完之后点击提交

  6. 若要查看上传的文件,可以点击左侧项目。

  7. 可以看到你的文件就在这显示,也可以进行其他操作。

  8. 其他的就自己看看吧,功能很简单。

项目地址

  • GitHub项目地址:https://github.com/eikek/docspell

功德+1(狗子).gif

👇👇👇