本文给大家带来一个实用的RAG框架——RAGFlow。我们来看看它的自我介绍吧!
还是老规矩,它是什么?有什么用?这些官方文档都可以简单的查到(官方中文README_zh.md)。下面我带大家一步步安装并实现一个知识库问答吧!
(1)快速安装
1、拉取官方github上的ragflow仓库
git clone https://github.com/infiniflow/ragflow.git
2、进入ragflow下面的docker目录,执行docker compose命令进行本地安装
# 进入docker目录中
cd ragflow/docker
# 我们安装GPU版本的
docker compose -f docker-compose-gpu.yml up -d
3、网页输入localhost进入ragflow的使用界面
(2)设置默认模型
4、点击头像进入设置,在模型供应商里面配置大模型
5、 因为要使用本地部署的模型,所以选择Ollama是最简单的
6、embedding模型也可以选择qwen3:4b
【坑】这里添加失败了,原因是Ollama的服务默认不是所有地址都能访问的,所以我们要去设置一个HOST环境,让宿主机的IP也能访问Ollama的API。
7、先配置一下Docker的.env文件
8、在.env文件里面添加环境变量,这样Docker里面的ragflow就可以正确访问Ollama的API
# 配置Ollama服务的宿主机IP
OLLAMA_API_BASE_URL=http://10.170.151.170:11434
# 兼容OpenAI的API
CUSTOM_OPENAI_API_BASE_URL=http://10.170.151.170:8000
9、再去我自己的电脑(宿主机)去配置系统环境变量,允许ollama服务被所有地址访问
【坑】 配置好HOST之后一定要重启Ollama,不然不会生效
10、我们继续配置Ollama模型
11、默认已经安装了通义千问的向量模型,给它填入API KEY
【注】现在去阿里云百炼注册账号,可以获得每个模型免费100万的额度!!!跳转链接:阿里云百炼https://bailian.console.aliyun.com/
(3)创建知识库
12、点击上方的知识库去创建一个
13、添加文件成功之后,进行文本转向量处理
14、进行一些必要的配置(这些配置参数自行去官方doc里面查)
RAGFlow官方文档https://ragflow.io/docs/dev/
(4)创建基于RAG的聊天
15、点击上方的聊天,新建一个助理
16、测试RAG对话