刚刚,华为开源了2个盘古大模型,百度开源了23个ERNIE 4.5 大模型

发布于:2025-08-07 ⋅ 阅读:(21) ⋅ 点赞:(0)

大家好,我是 Ai 学习的老章

看两个大模型世界的新闻

1 是华为正式开源了上个月就公布的盘古大模型

2 是百度开源了 23 个不同尺寸(0.3B-300B)和不同用途(文本生成、推理和多模态)的 ERNIE 4.5 大模型

华为盘古大模型

开源链接:https://gitcode.com/ascend-tribe

 

  • • 1 是昇腾原生的分组混合专家模型--盘古 Pro Moe-72B:https://gitcode.com/ascend-tribe/pangu-pro-moe
  • • 2 是昇腾高性能 Moe 模型推理系统:https://gitcode.com/ascend-tribe/ascend-inference-system
  • • 3 是灵活切换快慢思考的高效 7B 模型--盘古 7B Embedded:https://gitcode.com/ascend-tribe/pangu-embedded

不是很敢做评价,单看华为技术文件给出的测评,貌似是很能打

基于 MoGE 架构,构建了总参数量 720 亿、激活参数量 160 亿的盘古 Pro MoE 模型,并针对昇腾 300I Duo 和 800I A2 平台进行了系统性优化。在昇腾 800I A2 上,盘古 Pro MoE 单卡推理吞吐量达到 1,148 tokens/s,通过推测加速等技术可进一步提升至 1,528 tokens/s,显著优于同等规模(32B 和 72B 参数量)的稠密模型。

基于 MoGE 架构,构建了总参数量 720 亿、激活参数量 160 亿的盘古 Pro MoE 模型,并针对昇腾 300I Duo 和 800I A2 平台进行了系统性优化。在昇腾 800I A2 上,盘古 Pro MoE 单卡推理吞吐量达到 1,148 tokens/s,通过推测加速等技术可进一步提升至 1,528 tokens/s,显著优于同等规模(32B 和 72B 参数量)的稠密模型。

总结一句话:昇腾 NPU 完全支持盘古 Pro MoE 的大规模并行训练。多个公开基准测试结果表明,盘古 Pro MoE 在千亿参数以下量级模型中处于领先地位。

总之,遥遥领先就完事儿了

话说,现在很多公司,除了头部各大互联网公司还有渠道可以大规模搞到英伟达 GPU,很多央国企、中小公司只能选择华为。

华为也是照这硬件、推理引擎、大模型我全都要打路子在走,完全与老美不沾边,甚至连模型文件都只在 gitcode 发,技术文件都有中文版。各互联网大厂发布大模型多是在 huggingface,技术文件也都只有英文。

我所在公司明年再新采购算力服务器,大概率也要、也只能选华为了

后续我也准备好好学习一下华为的整套大模型技术栈,后面会陆续分享✊

百度也开源了一大堆大模型

大家是不是把大模型全村的希望、起个大早赶个晚集的百度忘记了?

老章一致打趣李总曾发表的雷人言论,这一次不能再打趣了

它信守承诺了,日期分毫不差

https://mp.weixin.qq.com/s/nqTQS5CGalMwjmx36T-LFw

https://mp.weixin.qq.com/s/nqTQS5CGalMwjmx36T-LFw

文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。

23 款 ERNIE 模型主要是 A47B 和 A3B 系列的 MoE 模型,还包括一些 0.3B 的稠密小模型,涵盖文本模型和视觉语言模型,上下文窗口均为 128K。每个模型都采用了监督微调(SFT),直接偏好优化(DPO)或改进的强化学习方法统一偏好优化(UPO)进行后训练。

 23 款 ERNIE 模型主要是 A47B 和 A3B 系列的 MoE 模型,还包括一些 0.3B 的稠密小模型,涵盖文本模型和视觉语言模型,上下文窗口均为 128K。每个模型都采用了监督微调(SFT),直接偏好优化(DPO)或改进的强化学习方法统一偏好优化(UPO)进行后训练。

感觉国产大模型除了 DeepSeek 和阿里(DeepSeek 也识货,蒸馏都选 Qwen3),很难见到其他可以扑出水花的模型了,像腾讯、kimi、minimax、字节最近开源的模型,都没什么热度。

百度这些,我暂未产生兴趣。也可能实力不够,它旗舰模型 ERNIE-4.5-300B-A47B 跑起来需要 16 张 80GB 显存的 GPU,搞不动。

史上最全!371 张速查表,涵盖 AI、ChatGPT、Python、R、深度学习、机器学习等


网站公告

今日签到

点亮在社区的每一天
去签到