Docker安装Docspell文档管理系统(DMS)
介绍
Docspell 是一个个人文档组织者。或者有时称为 “文档管理系统”(DMS)。您需要扫描仪进行转换 您的论文到文件。然后,Docspell 可以协助组织 导致的混乱😉.它可以统一您的文件与扫描仪、电子邮件 和其他来源。它针对家庭使用,即家庭, 家庭以及较小的团体/公司。
您可以关联标签、设置对应关系和许多其他内容 预定义和自定义元数据。如果您的文档与 这样的元数据,你可以稍后使用搜索快速找到它们 特征。但是手动添加它是一项繁琐的任务。Docspell 可以提供帮助 通过建议通讯员、猜测标签或查找日期 机器学习。它可以从现有文档中学习元数据,并且 使用 NLP 查找内容。这使得向文档添加元数据成为 容易多了。对于机器学习,它依赖于免费的 (GPL) 斯坦福核心 NLP 库。
Docspell 还可以在您的文档上运行 OCR(如果需要),可以提供 全文搜索,并具有出色的电子邮件集成。一切都是 可通过 REST/HTTP API 访问。移动友好的 SPA Web 应用程序 是默认用户界面。安卓 应用程序存在 方便地从您的手机/平板电脑和 CLI 上传文件。功能 概述列出了更多内容 点。
Docspell特点
每个帐户多用户:每个帐户(集合体)可以有多个用户共享 相同的文件。例如,您家庭中的每个人都可以与您的 文件,同时使用自己的帐户和自己的设置。
使用 OCR 提取文本:从所有文件中提取文本。对于扫描的文档/图像,OCR 通过使用 tesseract 来使用。对文本进行分析,并可用于全文检索。
文本分析:使用 ML 算法分析提取的文本,以查找可以自动注释到文档的属性。
支持多个文件:Docspell 可以读取多种文件类型。提取 ZIP 和 EML(电子邮件文件格式)文件并导入其内容。
转换为 PDF:所有文件都转换为 PDF。不要担心原件。原始文件也被存储起来,可以原封不动地下载。从图像数据(通常从扫描仪返回)创建 PDF 时,生成的 PDF 包含提取的文本并且可搜索。
全文搜索:所有文件的提取文本和某些属性(如名称和注释)都可用于全文搜索。全文搜索还可用于进一步约束搜索菜单的结果,您可以在其中按标签、通讯员等进行搜索。
通过电子邮件发送:用户可以在应用程序中定义 SMTP 设置,然后能够通过电子邮件发送项目。这通常对与其他人共享很有用。当然,您的地址簿中有电子邮件地址补全。
导入邮箱:用户可以定义 IMAP 设置,以便 docspell 可以导入他们的电子邮件。这可以根据计划定期完成。导入的邮件可以移出到另一个文件夹或删除。
通知:用户可以通过电子邮件、Matrix 或 Gotify 收到定期执行的查询产生的文档通知。还可以为特定事件配置通知。
安装教程
docker-compose方式安装
演示以在群晖NAS系统上安装为例
(其他系统请自行安装好最新版本Docker、docker-compose、git)群晖套件中心安装Git Server套件(群晖上使用git clone命令需要安装这个)
打开群晖的SSH功能,使用终端软件进行连接,并切换到root状态下。
进入群晖的docker文件夹(你想将容器数据存储到哪就进哪个文件夹)
cd /volume1/docker
复制下面的命令,粘贴到终端内,克隆项目文件到本地。
git clone https://github.com/eikek/docspell
进入项目文件夹
cd docspell/docker/docker-compose
如果你要修改默认的7880访问端口,可以继续下一步。(可选)
编辑docker-compose.yml文件vi docker-compose.yml
按字母 i 键进入编辑模式,修改下面的配置文件,按Esc键退出编辑模式,输入 :wq 退出并保存。(可选)
version: '3.8' services: # The restserver and joex containers defined here are configured # using env variables. Both must connect to the same database and # solr instance. More information on configuring can be found here: # https://docspell.org/docs/configure # # Please replace the values of the following with a custom secret # string: # # - DOCSPELL_SERVER_ADMIN__ENDPOINT_SECRET # - DOCSPELL_SERVER_AUTH_SERVER__SECRET # - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_HEADER__VALUE # (use the same value at the consumedir container!) # # After creating an account, you may want to set signup mode to # "closed" or to "invite". When using invite, you must also set # DOCSPELL_SERVER_BACKEND_SIGNUP_NEW__INVITE__PASSWORD to some # secret. restserver: image: docspell/restserver:latest container_name: docspell-restserver restart: unless-stopped ports: - "7880:7880" #第一个7880是容器外部访问端口,你可以自行修改。 environment: - TZ=Europe/Berlin - DOCSPELL_SERVER_INTERNAL__URL=http://docspell-restserver:7880 - DOCSPELL_SERVER_ADMIN__ENDPOINT_SECRET=admin123 - DOCSPELL_SERVER_AUTH_SERVER__SECRET= - DOCSPELL_SERVER_BACKEND_JDBC_PASSWORD=dbpass - DOCSPELL_SERVER_BACKEND_JDBC_URL=jdbc:postgresql://db:5432/dbname - DOCSPELL_SERVER_BACKEND_JDBC_USER=dbuser - DOCSPELL_SERVER_BIND_ADDRESS=0.0.0.0 - DOCSPELL_SERVER_FULL__TEXT__SEARCH_ENABLED=true - DOCSPELL_SERVER_FULL__TEXT__SEARCH_SOLR_URL=http://docspell-solr:8983/solr/docspell - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_ENABLED=true - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_ENABLED=true - DOCSPELL_SERVER_INTEGRATION__ENDPOINT_HTTP__HEADER_HEADER__VALUE=integration-password123 - DOCSPELL_SERVER_BACKEND_SIGNUP_MODE=open - DOCSPELL_SERVER_BACKEND_SIGNUP_NEW__INVITE__PASSWORD= - DOCSPELL_SERVER_BACKEND_ADDONS_ENABLED=false depends_on: - solr - db ### #演示只是复制一部分,后面的一部分就不复制在这里了,只修改上面的就行。
在当前路径下创建docs文件夹
mkdir docs
执行命令,启动docker-compose文件,拉取镜像并创建容器。
docker-compose up -d
查看正在运行的项目容器
docker-compose ps
访问Docspell
打开浏览器,以群晖的IP+设置的端口进行访问。
以本机为例:http://192.168.2.35:7880
点击注册账户自行注册一个账户
然后使用注册的账户进行登录
该系统是没有中文界面的,看不懂的浏览器翻译为中文。
点击上传文件上传完之后点击提交
若要查看上传的文件,可以点击左侧项目。
可以看到你的文件就在这显示,也可以进行其他操作。
其他的就自己看看吧,功能很简单。
项目地址
GitHub项目地址:https://github.com/eikek/docspell
👇👇👇
- 感谢你赐予我前进的力量