OpenAI 开源模型 gpt-oss 正式上线微软 Foundry 平台-易微帮

微软宣布，OpenAI 首个开放权重模型 gpt-oss 已正式上线微软 Azure AI Foundry（国际版）与 Windows AI Foundry（国际版），标志着 AI 开源生态与商业平台的深度融合迈入全新阶段。此次发布不仅为开发者提供了更灵活的模型选择，更通过微软全栈 AI 平台的赋能，推动 AI 技术从云端到边缘设备的全场景落地。

双模并进：1200亿参数推理引擎与轻量级工具

此次发布的 gpt-oss 系列包含两款重量级模型，分别针对不同场景优化：

gpt-oss-120b：高性能推理引擎采用稀疏架构设计，拥有1200亿参数，在数学计算、代码生成、专业问答等复杂任务中表现卓越，性能可媲美闭源模型 o4-mini，但模型体积更小、部署成本更低。即使是在单个数据中心级 GPU 上，也能高效运行，尤其适合对安全性与性能要求极高的金融、医疗等行业场景。
gpt-oss-20b：轻量级工具调用专为代码执行、智能体（Agent）任务优化，支持在16GB以上显存的独立GPU上流畅运行，完美适配 Windows 生态。其低延迟、高兼容性的特性，使其成为构建本地智能助手、嵌入业务流程的理想选择，即使在网络受限的工业物联网（IIoT）场景中也能稳定发挥。

两款模型均计划与 Responses API 兼容，开发者可无缝替换至现有系统，大幅降低技术迁移成本。

微软全栈平台赋能：从云端到边缘的全场景覆盖

依托微软 Azure AI Foundry（国际版）、Windows AI Foundry（国际版）及 Foundry Local（国际版）三大核心平台，gpt-oss 实现了云-边-端的全链路覆盖：

Azure AI Foundry：企业级模型开发与部署中枢作为已汇聚超11,000个模型的开放平台，Azure AI Foundry 为开发者提供统一环境，支持模型评估、微调、部署及混合模型调度。通过几行CLI命令，即可在云端快速启动gpt-oss推理服务，并结合企业自有数据进行定制化训练（如LoRA、QLoRA等技术），满足垂直行业需求。
Windows AI Foundry：深度融合本地生态针对客户端场景，Windows AI Foundry 将gpt-oss-20b深度优化至本地设备，支持CPU、GPU、NPU多硬件架构，并通过CLI、API、SDK提供一致调用体验。无论是离线环境、内部部署还是边缘设备，均可实现“可选上云”的灵活架构。
Foundry Local：开源模型本地化运行通过容器化技术，Foundry Local将主流开源模型适配至本地设备，支持模型蒸馏、量化、剪裁等优化，使AI模型可运行于边缘GPU甚至高性能笔记本，降低对云端资源的依赖。

开放权重：重构AI开发与部署逻辑

gpt-oss的开放权重打破了传统闭源模型的“黑盒”限制，为开发者提供了定制空间。

对开发者而言，可深入解析模型架构，通过参数微调、注意力模式审计等方式，精准适配业务场景。例如，金融团队可仅训练模型的风险评估层，快速迭代版本（从数周缩短至数小时）。
对决策者而言，开放模型意味着更高的可控性与成本优化。企业可根据数据敏感度选择部署方式（云端/本地），同时通过混合模型策略平衡性能与合规需求。

作为微软中国南区核心合作伙伴及HKCSP 1T首批授权云服务商之一，领驭科技正积极整合Azure OpenAI的强大功能，包括先进的自然语言处理、分析和推理能力，到其产品和行业解决方案中。

Azure OpenAI服务通过其大规模生成式AI模型，支持企业客户根据特定需求和场景，开发创新应用，涵盖辅助写作、代码编写、多媒体内容生成以及数据分析等多个领域，为互联网、游戏、金融、零售、医药等行业以及自动驾驶和智能制造等前沿技术领域带来深远影响。

OpenAI 开源模型 gpt-oss 正式上线微软 Foundry 平台

双模并进：1200亿参数推理引擎与轻量级工具

微软全栈平台赋能：从云端到边缘的全场景覆盖

开放权重：重构AI开发与部署逻辑

微信公众号

今日签到

热门文章

最新发布