前言
本文分享在华为云平台上部署 Dify LLM 平台的全流程教程,详细呈现如何在 Flexus X 实例上搭建平台。阐述该实例在算力、优化、成本、可靠性及部署等方面的突出优势,为各位小伙伴送上贴心指引,助其高效开发,诚邀大家体验便捷 AI 开发之旅。
华为云账号注册请参考文章:https://blog.csdn.net/weixin_62782025/article/details/147821539
官方部署文档:https://support.huaweicloud.com/dify-aislt/dify_01.html
部署方式:本文采用云服务器单机部署
注意: 本实验部署为按需计费模式,为了避免在实验的过程中出现部署失败等问题,建议确保账户余额充足(建议不低于10元),实验结束后,请及时删除资源,避免持续扣费。
什么是Dify-LLM
Dify-LLM
是一款开源的大语言模型应用开发平台,融合了后端即服务与 LLMOps 理念,通过可视化工作流编排、全面的模型支持、RAG 增强检索、Agent 智能体开发等功能,帮助开发者快速构建和部署生成式 AI 应用。
方案架构及资源规划(单机部署)
以下是云服务器单机部署所需要的资源:
- 创建1台华为云Flexus云服务器X实例,用于搭建Dify-LLM应用开发平台。
- 创建1个弹性公网IP EIP并关联FlexusX实例,提供访问公网和被公网访问能力。
- 创建1个安全组,通过配置安全组规则,为云服务器提供安全防护。
PS: 本次实验采用一键部署的方式,帮助用户快速部署出
Dify-LLM
应用开发平台
为什么选择华为云 Flexus X实例
华为云 Flexus X 实例作为 Dify 平台一键部署的核心算力底座,凭借擎天架构、智能加速引擎及全链路优化设计,为 AI 应用开发提供高性能、低成本、高可靠的基础设施支撑。 其核心优势具体表现为:
高性能架构与场景化加速:通过擎天 QingTian 架构实现 1.6 倍基准算力提升且单核性能较传统 x86 实例优化 60%,借助 X-Turbo 引擎深度优化数据库与缓存操作使 PostgreSQL 查询 TPS 达 1200(为传统实例 6 倍)、Redis 延迟 < 10ms,同时将向量检索速度提升至 5000 条 / 秒、模型推理吞吐量增加 35% 并支持单实例 15 路并发查询。
柔性算力与成本革新:通过 23 种 CPU 内存柔性配比(如 2:7)实现 95% 内存利用率,按需计费低至 0.95 元 / 小时(秒级计量 + 空闲停机),叠加瑶光云脑智能推荐规格,中小企业年算力成本综合下降超 30% 且单次测试成本较竞品降 55%。
旗舰级可靠性保障:依托跨可用区(AZ)容灾机制实现 45 秒内故障迁移与 99.995% 可用性,结合 OBS AES-256 加密、SSL/TLS 链路保护满足等保 2.0 合规,以刚性 SLA 承诺未达标最高获 300% 资源券赔偿。
极简部署与开发体验:15 分钟自动化完成 VPC/OBS 等依赖配置(较手动部署效率提升 90%),瑶光云脑自动优化资源与补丁实现零运维,支持单机到 CCE 集群平滑扩展使开发周期缩短 70%。
Flexus X实例 通过 「架构创新 + 智能调度 + 成本重构」 的三维协同,重新定义 AI 开发的算力基准,为
Dify 平台
提供**「高性能无感、成本可预测、可靠有承诺」**的新一代基础设施,助力开发者以更低门槛、更高效率落地智能应用解决方案。
准备工作
首次使用华为云时已注册的账号可直接使用,无需额外准备。
若使用 IAM 用户账户,需先确认是否属于 admin 用户组:
- 若已在 admin 组:可直接操作,无需额外权限配置。
- 若不在 admin 组:需由管理员为账号授予相关权限,并完成以下准备工作。
创建rf_admin_trust委托(可选)
访问华为云官网并登录账号,进入控制台管理界面后,将鼠标悬停在页面右上角的个人账号区域,在弹出的下拉菜单中选择 “统一身份认证” 选项。
进入统一身份认证服务(IAM) 页面,在左侧导航栏中找到并点击委派选项,待右侧页面跳转后,点击右上角的创建委派按钮。
在委托名称输入框中填入“
rf_admin_trust
”,将委托类型设定为“云服务”,并在对应输入框中输入“RFS”,确认信息无误后点击“完成”按钮。
如下图,委派创建成功,点击“立即授权”按钮进行后续操作。
第一步为策略选择操作:在搜索框内输入 “
Tenant Administrator
” 权限,勾选对应的搜索结果后,点击 “下一步
” 按钮。
第二步是配置最小授权范围:选择授权范围方案,并勾选“全部资源”选项,点击“确定”。
如下图,
授权成功
,但是由于系统设置原因,授权之后需要等待15-30分钟之后才可生效
当看到“委托”列表中显示“rf_admin_trust”委托条目时,即表示委托创建成功。
快速部署Dify-LLM(单机)
登录华为云解决方案实践页面,在方案列表中找到 “快速搭建 Dify-LLM 应用开发平台” 或 点击此处跳转 “快速搭建 Dify-LLM 应用开发平台”,根据需求
选择部署版本
(以单击部署为例),选择“可用区
”,点击 “一键部署(云服务器单机部署)
” 按钮,系统将跳转至解决方案的 “资源栈创建界面”。
第一步是进行模板选择操作,保持默认配置不变,然后点击页面右下角的“下一步”按钮。
第二步进行参数配置:在该步骤中,对云服务器密码进行设置(必填项),保持其他配置为默认状态,完成后点击页面右下角的 “下一步” 按钮。
如果有其他参数信息配置的需求,比如 Dify 版本等,可依据自身实际需求进行设置。
参数名称 | 类型 | 是否可选 | 参数解释 | 默认值 |
---|---|---|---|---|
vpc_name | string | 必填 | 虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 | dify-llm-application-development-platform-demo |
secgroup_name | string | 必填 | 安全组名称,该模板新建安全组,请参考安全组规则修改进行配置。取值范围:1-64个字符,支持字母、数字、中文、下划线(_)、中划线(-)、英文句号(.)。 | dify-llm-application-development-platform-demo |
ecs_name | string | 必填 | 云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 | dify-llm-application-development-platform-demo |
flexus_flavor | string | 必填 | 云服务器实例规格,支持弹性云服务器 ECS及华为云Flexus 云服务器X实例。Flexus 云服务器X实例规格ID命名规则为x1.?u.?g,例如2vCPUs4GiB规格ID为x1.2u.4g,具体华为云Flexus 云服务器X实例规格请参考控制台。弹性云服务器规格名称,具体请参考官网弹性云服务器规格清单。 | x1.8u.16g |
ecs_password | string | 必填 | 云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种,仅支持小写字母、数字、中划线(-)、英文句号(.)。修改密码,请参考重置云服务器密码登录ECS控制台修改密码。管理员账户默认root。 | 空 |
ecs_volume_size | number | 必填 | 云服务器系统盘大小,磁盘类型默认为高IO,单位:GB,取值范围为40-1,024,不支持缩盘。 | 100 |
bandwidth_size | number | 必填 | 弹性公网带宽大小,该模板计费方式为按流量计费。单位:Mbit/s,取值范围:1-300Mbit/s。 | 300 |
charging_mode | string | 必填 | 计费模式,默认自动扣费,取值为prePaid(包年包月)或postPaid(按需计费)。 | postPaid |
charge_period_unit | string | 必填 | 计费周期单位,当计费方式设置为prePaid,此参数是必填项。有效值为:month(包月)和year(包年)。 | month |
charge_period | number | 必填 | 计费周期,当计费模式设置为prePaid,此参数是必填项。可选值为:1-3(year)、1-9(month)。 | 1 |
此处弹出二级对话框,提示开启加密,点击“确定”按钮
第三步操作进行资源栈设置,从权限委托的下拉选项中选择 “
rf_admin_trust
” 委托(此步骤为可选操作,在次我们不进行选择),接着开启“回滚设置”开关,完成后点击 “下一步” 按钮。
- 如果使用华为主账号或admin用户组下的IAM子账户可不选委托
第四步进入配置确认环节,仔细核对所有设置无误后,点击页面右下角的 “创建执行任务” 按钮启动部署流程。
当系统弹出创建执行计划对话框时,自行设置执行计划名称(支持自定义内容),确认无误后点击 “确定” 按钮。
此时可观察到执行计划正在创建中,待其创建成功后,点击 “部署” 按钮启动部署流程。
可以看到执行计划创建成功,点击“部署”按钮,
点击 “部署” 按钮后,系统将弹出执行计划确认对话框,此时请点击对话框中的 “执行” 选项完成操作。
点击 “事件” 标签,可查看当前创建任务的状态详情,了解是否完成创建。
待“事件”中出现“
Apply required resource success
”,表示该解决方案已经部署完成。
手动刷新页面,在 “输出” 区域中查看 Dify-LLM 应用开发平台的访问说明。当堆栈部署状态显示成功后,Dify 应用搭建脚本将自动开始执行,请耐心等待 5 至 10 分钟(具体耗时可能因网络波动而略有差异)。
开始使用
安全组规则: 可以进行修改,该解决方案使用
80
端口用来访问Dify,默认全放通。获取地址:参照快速部署单机版访问地址(通常在堆栈部署成功后的 “输出” 栏显示);
登录注册:在浏览器输入该地址,进入 Dify 界面后,点击 “注册” 按钮,依次填写邮箱、账号(自定义用户名)、密码(需符合复杂度要求),完成管理员账号创建后即可登录。
打开浏览器并访问您部署的 Dify 平台地址(可在堆栈 “输出” 中查询),进入登录界面后,依次输入前序步骤中注册的邮箱和密码,点击 “登录” 按钮即可进入 Dify 平台。
如下图,我们已经成功在华为云平台部署了Dify-LLM平台,接下来就可以进行各种开发操作了。
至此 Dify-LLM 应用开发平台(单机版)部署成功。
Dify-LLM 应用开发平台的卸载
访问华为云资源编排服务(RFS)控制台,在资源栈列表中定位到通过该解决方案创建的资源栈,点击资源栈名称右侧的 “删除” 按钮执行删除操作。
在弹出的删除资源栈确认弹窗中,将删除方式选取为 “删除资源”,在确认输入框中键入 “Delete”,点击 “确定” 按钮,即可完成该解决方案的卸载操作。
注意事项
在Dify-LLM平台部署的过程中,我们需要注意一下几点问题:
- 账号与权限管理
需确保账号具备 ECS/RFS 资源创建权限,IAM 子账号需提前创建「rf_admin_trust」委托并授予
Tenant Administrator
权限(创建后需等待 15-30 分钟生效),同时保证账户余额≥10 元(按需计费模式),避免因权限延迟或余额不足导致部署中断。
- 实例与网络配置
Flexus X 实例规格需匹配业务需求(开发选 x1.2u.4g,生产选 x1.8u.16g),优先选择 2:7 等柔性内存配比;安全组需放行 80(HTTP)、22(SSH)、5432(PostgreSQL)、6379(Redis)端口,生产环境建议添加 IP 白名单;公网带宽开发环境≥10Mbit/s,生产环境根据并发量调整(50-300Mbit/s),避免带宽瓶颈。
- 参数配置规范
云服务器密码需包含大小写字母、数字、特殊字符(至少三种),长度 8-26 位(如
Huawei_2025!
);使用 IAM 子账号部署时需正确选择「rf_admin_trust」委托,主账号可忽略,确保参数格式正确、权限匹配,避免部署失败。
- 部署后优化操作
部署成功后需在资源栈「输出」栏获取 Dify 访问 URL,首次登录需注册并验证邮箱;手动优化 PostgreSQL(如
shared_buffers=4GB
)和 Redis(启用内存压缩)参数,开启 Flexus X 实例「向量检索优化」功能,提升知识库检索速度至 5000 条 / 秒以上。
- 成本与资源管控
实验结束后需通过 RFS 控制台删除资源栈并选择「删除资源」模式,释放所有关联资源;开发测试选择按需计费(0.95 元 / 小时起),长期使用切换为包年包月(成本降 30%+),避免「僵尸资源」持续扣费。
总结
在这次
华为云 Dify - LLM 平台
全流程部署中,我在华为云 Flexus X 实例上顺利搭起大语言模型应用开发平台。Flexus X 实例优势满满,高性能架构似强劲引擎,大幅提升算力;X - Turbo 引擎如技艺精湛的“优化师”,优化数据库与缓存操作,让系统响应更快。柔性算力与成本革新帮咱们精打细算,降低算力成本。旗舰级可靠性保障像忠诚卫士,守护系统稳定。极简部署体验如同贴心助手,15 分钟搞定依赖配置,缩短开发周期。从账号权限管理到部署后优化,它全程助力,让部署高效便捷。合理管控成本与资源,满足需求又省钱。华为云 Flexus X 实例就是那把开启高效 AI 开发大门的金钥匙,用它来搭建 Dify 平台,能让你更快地投身到创新开发中,轻松打造出惊艳的生成式 AI 应用,快来试试吧!