ChatGPT-Next-Web/docs/rag-cn.md
2024-04-08 12:42:10 +08:00

74 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# RAG 功能配置说明
> [!WARNING]
> 该功能目前在预览阶段,可能会有较多的问题,请在仔细阅读本文档后再使用。
## 效果图
![example](./images/rag-example.jpg)
## 原理
![example](./images/rag.png)
## 已知问题
- 由于接口中使用 nodejs 运行时,在 vercel 环境下接口可能会超时,建议使用 docker 部署
- 已开启的插件可能会影响到数据检索,可以关闭部分插件后再使用
- 已创建的向量数据不会删除
- 同一聊天窗口内即使“清除聊天”也可以访问已经上传的文件内容
- RAG 插件需要一定的话术来让模型触发查询
- 上传文件部分的 UI 交互可能会变更
- 暂不支持文档总结
## 支持的文件类型
- txt
- md
- pdf
- docx
- csv
- json
- srt
- mp3 (基于OpenAIWhisper)
## 配置
1. 登录 https://cloud.qdrant.io 并创建一个账户
2. 在控制面板中创建一个 Cluster
3. 获取 Cluster 的 Cluster URL 和 API Key
4. 完善下面的环境变量配置后即可使用
## 环境变量
### `ENABLE_RAG`
如果你想启用 RAG 功能,将此环境变量设置为 1 即可。
### `QDRANT_URL`
qdrant 服务的 Cluster URL。
### `QDRANT_API_KEY`
qdrant 服务的 ApiKey。
### `RAG_CHUNK_SIZE` (可选)
分割后文档的最大大小按字符数计算默认2000。
### `RAG_CHUNK_OVERLAP` (可选)
分割文档时块重叠数量默认200。
### `RAG_RETURN_COUNT` (可选)
检索时返回的文档数量默认4。
### `RAG_EMBEDDING_MODEL` (可选)
向量化时使用的向量模型默认text-embedding-3-large。
可选项:
- text-embedding-3-small
- text-embedding-3-large
- text-embedding-ada-002