这个开源 AI 神器,能让你与任何文档对话!

在日常生活与工作中,我们常常需要阅读一些说明、使用、技术等超长的文档。

面对这些几十页的文档且在不熟悉的情况下,如果想查找其中一块内容,难免需要花费不少时间才能找到。

这时候,要是有一款能够帮我们阅读文档的 AI 问答工具,无疑极大地提高我们的效率。

无独有偶,最近我在 GitHub 上发现了一款能让你与文档进行对话的 AI 工具:kotaemon。

基于 RAG 技术,能够通过对话与文档内容进行交互,提供信息检索和生成的效率。

而且,支持多模态检索能够处理文本、图表和表格等不同类型的数据。

工具提供了简洁易用的问答界面,并支持使用本地 LLM 或主流 LLM API 提供商,还可通过脚本一键安装使用。

接下来,给大家详细介绍一下。

项目特点

  • 提供简洁易用的文档问答 Web-UI;

  • 支持多用户登录,文件可私有或共享;

  • 支持协作和分享聊天记录;

  • 支持本地 LLM 及主流 API 提供商(如 OpenAI、Azure、Ollama 等);

  • 混合 RAG 管道,结合全文本与向量检索器,并进行重新排序,确保最佳检索结果;

  • 支持多模态问答,可处理含图表的文档,支持多模态文档解析;

  • 提供高级引用和文档预览功能,确保答案正确性;

  • 支持复杂推理方法,能处理复杂或多步问题;

  • 提供可配置 UI,可调整检索和生成设置,支持扩展与定制。

安装指南

  1. 到项目的 release 页面,下载最新的kotaemon-app.zip文件;

https://pan.quark.cn/s/427189ee6fd7

  • 解压下载的文件;

  • 进入到 scripts 文件夹,并找到适合你系统的安装脚本:

    • Windows:run_windows.bat,双击运行该文件即可。

    • macOS:run_macos.sh

      • 右键单击文件并选择打开方式和其他。

      • 启用所有应用程序并选择终端。

      • 注意:如果始终想使用终端打开该文件,请选中始终打开方式。

      • 接着,再双击该文件,就可以正常运行了。

    • Linux: run_linux.sh。在终端中使用bash run_linux.sh运行脚本。

  • 正常运行,将会默认在浏览器中打开一个窗口,看到如下加载界面。

注意:要是在初始设置或任何更改后启动应用程序,只需再次运行 run_* 脚本即可。

使用指南

完成以上安装步骤,顺利看到加载的界面后,再来看下基本的使用。

1、添加 LLM 模型:

进入到如下路径:Resources –> LLMs –> Add 进行模型的添加。

接着,你还需要添加 Embedding 模型,选择 Embedding Models 选项,重复如上截图步骤。

另外,你也可通过 .env 文件配置模型。

2、上传文件:

点击 File Index 选项,将文件拖拽或点击上传到方框当中,然后点击 Upload and Index按钮,完成后会出现在右侧列表中,并允许删除。

3、开始与文档对话:

回到导航中的 Chat 选项中,默认情况下,会自动创建新对话,左侧可以选择你要对话的文件。

最后

以上,就是 kotaemon 工具的详细介绍。

有了该工具,当需要阅读超长的文档时,再也不用害怕,直接把文档扔给它,通过问答方式,快速找到我们想要的内容。

有这方面需求的同学不妨试试它。

资源下载: