【自然语言处理与大模型】Windows安装RAGFlow并接入本地Ollama模型

发布于：2025-05-19 ⋅ 阅读:(1701) ⋅ 点赞:(0)

本文给大家带来一个实用的RAG框架——RAGFlow。我们来看看它的自我介绍吧！

还是老规矩，它是什么？有什么用？这些官方文档都可以简单的查到（官方中文README_zh.md）。下面我带大家一步步安装并实现一个知识库问答吧！

1、拉取官方github上的ragflow仓库

git clone https://github.com/infiniflow/ragflow.git

2、进入ragflow下面的docker目录，执行docker compose命令进行本地安装

# 进入docker目录中
cd ragflow/docker

# 我们安装GPU版本的
docker compose -f docker-compose-gpu.yml up -d

3、网页输入localhost进入ragflow的使用界面

4、点击头像进入设置，在模型供应商里面配置大模型

5、因为要使用本地部署的模型，所以选择Ollama是最简单的

6、embedding模型也可以选择qwen3:4b

【坑】这里添加失败了，原因是Ollama的服务默认不是所有地址都能访问的，所以我们要去设置一个HOST环境，让宿主机的IP也能访问Ollama的API。

7、先配置一下Docker的.env文件

8、在.env文件里面添加环境变量，这样Docker里面的ragflow就可以正确访问Ollama的API

# 配置Ollama服务的宿主机IP
OLLAMA_API_BASE_URL=http://10.170.151.170:11434

# 兼容OpenAI的API
CUSTOM_OPENAI_API_BASE_URL=http://10.170.151.170:8000

9、再去我自己的电脑（宿主机）去配置系统环境变量，允许ollama服务被所有地址访问

【坑】配置好HOST之后一定要重启Ollama，不然不会生效

10、我们继续配置Ollama模型

11、默认已经安装了通义千问的向量模型，给它填入API KEY

【注】现在去阿里云百炼注册账号，可以获得每个模型免费100万的额度！！！跳转链接：阿里云百炼https://bailian.console.aliyun.com/

12、点击上方的知识库去创建一个

13、添加文件成功之后，进行文本转向量处理

14、进行一些必要的配置（这些配置参数自行去官方doc里面查）

15、点击上方的聊天，新建一个助理

16、测试RAG对话