在日常生活与工作中,我们常常需要阅读一些说明、使用、技术等超长的文档。
面对这些几十页的文档且在不熟悉的情况下,如果想查找其中一块内容,难免需要花费不少时间才能找到。
这时候,要是有一款能够帮我们阅读文档的 AI 问答工具,无疑极大地提高我们的效率。
无独有偶,最近我在 GitHub 上发现了一款能让你与文档进行对话的 AI 工具:kotaemon。
基于 RAG 技术,能够通过对话与文档内容进行交互,提供信息检索和生成的效率。
而且,支持多模态检索能够处理文本、图表和表格等不同类型的数据。
工具提供了简洁易用的问答界面,并支持使用本地 LLM 或主流 LLM API 提供商,还可通过脚本一键安装使用。
接下来,给大家详细介绍一下。
项目特点
-
提供简洁易用的文档问答 Web-UI;
-
支持多用户登录,文件可私有或共享;
-
支持协作和分享聊天记录;
-
支持本地 LLM 及主流 API 提供商(如 OpenAI、Azure、Ollama 等);
-
混合 RAG 管道,结合全文本与向量检索器,并进行重新排序,确保最佳检索结果;
-
支持多模态问答,可处理含图表的文档,支持多模态文档解析;
-
提供高级引用和文档预览功能,确保答案正确性;
-
支持复杂推理方法,能处理复杂或多步问题;
-
提供可配置 UI,可调整检索和生成设置,支持扩展与定制。
安装指南
-
到项目的 release 页面,下载最新的
kotaemon-app.zip
文件;
#
https://pan.quark.cn/s/427189ee6fd7
-
解压下载的文件;
-
进入到
scripts
文件夹,并找到适合你系统的安装脚本: -
Windows:
run_windows.bat
,双击运行该文件即可。 -
macOS:
run_macos.sh
-
右键单击文件并选择打开方式和其他。
-
启用所有应用程序并选择终端。
-
注意:如果始终想使用终端打开该文件,请选中始终打开方式。
-
接着,再双击该文件,就可以正常运行了。
-
Linux:
run_linux.sh
。在终端中使用bash run_linux.sh
运行脚本。 -
正常运行,将会默认在浏览器中打开一个窗口,看到如下加载界面。
注意:要是在初始设置或任何更改后启动应用程序,只需再次运行 run_*
脚本即可。
使用指南
完成以上安装步骤,顺利看到加载的界面后,再来看下基本的使用。
1、添加 LLM 模型:
进入到如下路径:Resources –> LLMs –> Add 进行模型的添加。
接着,你还需要添加 Embedding 模型,选择 Embedding Models
选项,重复如上截图步骤。
另外,你也可通过 .env
文件配置模型。
2、上传文件:
点击 File Index
选项,将文件拖拽或点击上传到方框当中,然后点击 Upload and Index
按钮,完成后会出现在右侧列表中,并允许删除。
3、开始与文档对话:
回到导航中的 Chat
选项中,默认情况下,会自动创建新对话,左侧可以选择你要对话的文件。
最后
以上,就是 kotaemon 工具的详细介绍。
有了该工具,当需要阅读超长的文档时,再也不用害怕,直接把文档扔给它,通过问答方式,快速找到我们想要的内容。
有这方面需求的同学不妨试试它。