华为云Flexus+DeepSeek征文|DeepSeek-V3/R1商用服务体验全流程

发布于:2025-05-28 ⋅ 阅读:(17) ⋅ 点赞:(0)

华为云 Flexus 与 DeepSeek-V3/R1 的深度整合,构建了一套 “弹性算力 + 智能引擎” 的协同体系。
Flexus 系列云服务器基于柔性计算技术,通过动态资源调度(如 Flexus X 实例)实现 CPU / 内存的实时弹性分配,尤其适合大模型推理阶段的负载波动需求。而 DeepSeek-V3/R1 作为深度求索的旗舰模型,采用混合专家架构(MoE)与强化学习技术,在通用能力与专业推理间形成差异化定位:V3 以 6710 亿参数覆盖多模态任务(文本、图像、音视频),支持 128K 长上下文窗口和高吞吐量处理;
R1 则通过动态门控专家调度与自进化知识库(1.2 亿条推理链),在数学推理(MATH-500 得分 97.3%)、代码生成(HumanEval 72.8%)等场景达到 GPT-4o 级性能,且推理成本仅为其 1/50。

一、华为云 ModelArts Studio 平台上,两者的协同体现为三层优化:

全栈技术融合:
昇腾 AI 处理器与 DeepSeek 模型的深度适配,使推理速度提升 30%,训练效率提高 45%;
服务化升级:
通过 “模型即服务” 模式,用户可直接调用千亿级 Token 优化的预训练模型,并享受从调优到监控的全生命周期服务;
生态化协同:
Dify-LLM 低代码开发平台支持一键部署 DeepSeek 模型,通过可视化编排界面快速构建智能客服、多模态交互等应用,3 天内即可完成从开通到上线的全流程。

二、开通DeepSeek-V3/R1商用服务

2.1、点击进入到ModelArts Studio大模型即服务平台页面 https://www.huaweicloud.com/product/modelarts/studio.html
1111
2.2、点击在线推理菜单——开通服务
在这里插入图片描述

2.3、根据你自身的业务需要开通相关的服务,例如: DeepSeek-V3-32K、DeepSeek-R1-32K。
DeepSeek-V3-32K模型是DeepSeek-V3-32K 是深度求索(DeepSeek)公司推出的高性能混合专家(MoE)架构大语言模型,参数量为671B。
DeepSeek-R1-32K模型是是深度求索(DeepSeek)推出的第一代高性能推理大模型,专注于复杂推理任务(如数学、代码生成和逻辑推理),参数量为671B。

在这里插入图片描述

三、开发接口信息调用

API地址

https://api.modelarts-maas.com/v1/chat/completions

模型名称

DeepSeek-V3

获取API Key
在调用MaaS的模型服务时,需要填写API Key用于接口的鉴权认证。请创建新的API Key或使用已有API Key,前往 API Key管理
步骤二: 复制调用示例并替换接口信息、API Key

# coding=utf-8

import requests
import json

if __name__ == '__main__':
    url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址
    api_key = "yourApiKey"  # 把yourApiKey替换成已获取的API Key 
    
    # Send request.
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {api_key}' 
    }
    data = {
        "model":"DeepSeek-V3", # 模型名称
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "你好"}
        ],
        # 是否开启流式推理, 默认为False, 表示不开启流式推理
        "stream": True,
        # 在流式输出时是否展示使用的token数目。只有当stream为True时改参数才会生效。
        # "stream_options": { "include_usage": True },
        # 控制采样随机性的浮点数,值较低时模型更具确定性,值较高时模型更具创造性。"0"表示贪婪取样。默认为0.6。
        "temperature": 0.6
    }
    response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)

    # Print result.
    print(response.status_code)
    print(response.text)

四、DeepSeek-V3/R1商用服务使用方式

4.1 在线体验
点击已开通的模型进行在线体验Flexus+DeepSeek从技术协同到产业赋能的实践探索,如下图所示。
在这里插入图片描述

响应速度非常的快速

在这里插入图片描述

五、全面了解ModelArts Studio产品架构

在这里插入图片描述

六、生态协同与未来展望

华为云与 DeepSeek 的合作不仅是技术层面的整合,更构建了开放共赢的产业生态:
开发者赋能:ModelArts Studio 提供千万 Token 免费额度与沙箱环境,配合详实的教学文档,使新手也能快速上手;
行业解决方案:针对金融、医疗等领域,联合推出 “模型 + 场景” 的预集成方案,例如 DeepSeek-R1 与 Flexus 企业搜索服务结合,可构建行业知识图谱,实现 “驱邪” 到 “挂菖蒲” 等语义联想检索;
成本创新:通过动态知识蒸馏技术,模型迭代周期缩短至 72 小时,结合 Flexus 的绿色计算碳积分激励,企业可进一步降低算力成本达 30%。

七、最后总结

本次深度体验华为云 DeepSeek-V3/R1 商用大模型服务,整体流程丝滑流畅,推理能力堪称惊艳,在智能问答、代码生成、企业知识库构建等场景中展现出卓越适配性。特别值得推荐的是,开发者可将其与 Dify 平台深度结合,让 AI 应用开发效率实现飞跃式提升,轻松解锁更多智能化场景新可能~