华为云 Flexus 与 DeepSeek-V3/R1 的深度整合,构建了一套 “弹性算力 + 智能引擎” 的协同体系。
Flexus 系列云服务器基于柔性计算技术,通过动态资源调度(如 Flexus X 实例)实现 CPU / 内存的实时弹性分配,尤其适合大模型推理阶段的负载波动需求。而 DeepSeek-V3/R1 作为深度求索的旗舰模型,采用混合专家架构(MoE)与强化学习技术,在通用能力与专业推理间形成差异化定位:V3 以 6710 亿参数覆盖多模态任务(文本、图像、音视频),支持 128K 长上下文窗口和高吞吐量处理;
R1 则通过动态门控专家调度与自进化知识库(1.2 亿条推理链),在数学推理(MATH-500 得分 97.3%)、代码生成(HumanEval 72.8%)等场景达到 GPT-4o 级性能,且推理成本仅为其 1/50。
一、华为云 ModelArts Studio 平台上,两者的协同体现为三层优化:
全栈技术融合:
昇腾 AI 处理器与 DeepSeek 模型的深度适配,使推理速度提升 30%,训练效率提高 45%;
服务化升级:
通过 “模型即服务” 模式,用户可直接调用千亿级 Token 优化的预训练模型,并享受从调优到监控的全生命周期服务;
生态化协同:
Dify-LLM 低代码开发平台支持一键部署 DeepSeek 模型,通过可视化编排界面快速构建智能客服、多模态交互等应用,3 天内即可完成从开通到上线的全流程。
二、开通DeepSeek-V3/R1商用服务
2.1、点击进入到ModelArts Studio大模型即服务平台页面 https://www.huaweicloud.com/product/modelarts/studio.html
2.2、点击在线推理菜单——开通服务
2.3、根据你自身的业务需要开通相关的服务,例如: DeepSeek-V3-32K、DeepSeek-R1-32K。
DeepSeek-V3-32K模型是DeepSeek-V3-32K 是深度求索(DeepSeek)公司推出的高性能混合专家(MoE)架构大语言模型,参数量为671B。
DeepSeek-R1-32K模型是是深度求索(DeepSeek)推出的第一代高性能推理大模型,专注于复杂推理任务(如数学、代码生成和逻辑推理),参数量为671B。
三、开发接口信息调用
API地址
https://api.modelarts-maas.com/v1/chat/completions
模型名称
DeepSeek-V3
获取API Key
在调用MaaS的模型服务时,需要填写API Key用于接口的鉴权认证。请创建新的API Key或使用已有API Key,前往 API Key管理
步骤二: 复制调用示例并替换接口信息、API Key
# coding=utf-8
import requests
import json
if __name__ == '__main__':
url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址
api_key = "yourApiKey" # 把yourApiKey替换成已获取的API Key
# Send request.
headers = {
'Content-Type': 'application/json',
'Authorization': f'Bearer {api_key}'
}
data = {
"model":"DeepSeek-V3", # 模型名称
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "你好"}
],
# 是否开启流式推理, 默认为False, 表示不开启流式推理
"stream": True,
# 在流式输出时是否展示使用的token数目。只有当stream为True时改参数才会生效。
# "stream_options": { "include_usage": True },
# 控制采样随机性的浮点数,值较低时模型更具确定性,值较高时模型更具创造性。"0"表示贪婪取样。默认为0.6。
"temperature": 0.6
}
response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
# Print result.
print(response.status_code)
print(response.text)
四、DeepSeek-V3/R1商用服务使用方式
4.1 在线体验
点击已开通的模型进行在线体验Flexus+DeepSeek从技术协同到产业赋能的实践探索,如下图所示。
响应速度非常的快速
五、全面了解ModelArts Studio产品架构
六、生态协同与未来展望
华为云与 DeepSeek 的合作不仅是技术层面的整合,更构建了开放共赢的产业生态:
开发者赋能:ModelArts Studio 提供千万 Token 免费额度与沙箱环境,配合详实的教学文档,使新手也能快速上手;
行业解决方案:针对金融、医疗等领域,联合推出 “模型 + 场景” 的预集成方案,例如 DeepSeek-R1 与 Flexus 企业搜索服务结合,可构建行业知识图谱,实现 “驱邪” 到 “挂菖蒲” 等语义联想检索;
成本创新:通过动态知识蒸馏技术,模型迭代周期缩短至 72 小时,结合 Flexus 的绿色计算碳积分激励,企业可进一步降低算力成本达 30%。
七、最后总结
本次深度体验华为云 DeepSeek-V3/R1 商用大模型服务,整体流程丝滑流畅,推理能力堪称惊艳,在智能问答、代码生成、企业知识库构建等场景中展现出卓越适配性。特别值得推荐的是,开发者可将其与 Dify 平台深度结合,让 AI 应用开发效率实现飞跃式提升,轻松解锁更多智能化场景新可能~