从算法革新到基础设施升级,从行业渗透到地域布局,人工智能算力正以 “规模扩张 + 效率提升”双轮驱动中国数字经济转型。中国智能算力规模将在 2025 年突破 1000 EFLOPS,2028 年达到 2781.9 EFLOPS,五年复合增长率 46.2%,成为全球算力增长的核心引擎。
一、算法与模型:AI 算力的核心驱动力
算法创新是算力需求的 “指挥棒”,以 DeepSeek R1 为代表的大模型,通过大规模强化学习和多头注意力机制实现双重突破:在 AIME 数学竞赛、博士级科学问答中性能接近 OpenAI o1 模型,同时将训练算力压缩至 Llama3 的 1/10,推理阶段缓存数据量降低 50 倍,7 天活跃用户破亿,验证了 “效率提升反而刺激算力需求” 的杰文斯悖论。
规模法则(Scaling Law)从预训练延伸至后训练与推理阶段:通过强化学习、思维链技术在推理阶段追加算力投入,可显著提升模型逻辑深度。这直接推动全球 AI 服务器市场扩张 ——2024 年规模 1251 亿美元,2028 年将达 2227 亿美元,生成式 AI 服务器占比从 29.6% 升至 37.7%。
模型技术路线呈现三大特征:
轻量化:混合专家模型(MoE)如浪潮源 2.0-M32,单 Token 算力仅为 Llama-70B 的 1/19,极大降低了运算负担,使得模型在资源有限的情况下也能高效运行。以图像识别任务为例,采用 MoE 的模型能在低配置设备上快速准确地识别复杂图像,识别速度提升 30%。
开源化:2025 年 55% 企业将采用开源模型开发应用,DeepSeek 等开源方案使部署成本降低 60%。开源社区的蓬勃发展,让众多中小企业和开发者能够基于开源模型进行二次开发和创新,加速了 AI 技术的普及和应用。例如,某小型电商企业利用开源模型搭建智能客服系统,成本较自主研发降低 80%,且开发周期从半年缩短至两个月。
多模态:从文本向图像、视频融合演进,在自动驾驶、远程医疗等场景实现跨模态理解。在自动驾驶场景中,多模态模型能够同时处理摄像头采集的视觉图像、雷达反馈的距离数据以及车辆传感器收集的其他信息,从而更精准地判断路况,做出安全的驾驶决策,有效减少事故发生率。
二、算力基础设施的多元与绿色
中国算力基建呈现 “四元特征”,支撑算力规模爆发式增长:
(一)芯片与服务器:高性能与高效能双升级
芯片多元化:GPU 仍是训练主力,但 ASIC(推理)、FPGA(动态加速)占比提升至 35%,多类型芯片混合部署成主流。不同类型芯片在不同任务中发挥独特优势,GPU 擅长大规模并行计算,适用于深度学习训练;ASIC 针对特定算法优化,在推理任务中表现卓越;FPGA 则可根据需求灵活配置,实现动态加速。例如,在语音识别系统中,ASIC 芯片能够快速准确地将语音信号转换为文本,识别准确率高达 98%。
服务器演进:72 块 GPU 集群支持万亿参数模型训练,“预填充 - 解码解耦” 架构使推理延迟降低 40%,2028 年推理工作负载占比将达 73%。新型架构的服务器不断涌现,采用先进的散热技术和高速内存,提升了计算性能和稳定性。
(二)液冷技术破解高能耗
AI 数据中心能耗呈指数级增长,2025 年 IT 能耗将达 77.7 太瓦时(2023 年的 2 倍),液冷技术成为核心解决方案。
技术路径:冷板液冷使 PUE 降至 1.15,浸没式液冷达 1.1,单机柜功率密度提升至 400kW。冷板液冷通过直接接触发热部件,快速带走热量;浸没式液冷则将电子元件完全浸没在冷却液中,利用冷却液的相变特性高效散热。某大型数据中心采用浸没式液冷技术后,每年可节省电费数百万元,且数据中心的空间利用率也得到显著提高。
市场规模:2028 年中国液冷服务器市场将达 105 亿美元,五年复合增长率 48.3%。随着技术的成熟和成本的降低,液冷服务器市场需求持续增长,越来越多的数据中心和企业开始采用液冷技术来降低能耗和提升算力。
(三)存储与网络:支撑海量数据处理
分布式存储:支持 EB 级扩展与并行访问,配合 NVMe-oF 技术,实现 10PB 数据秒级检索。分布式存储将数据分散存储在多个节点上,不仅提高了存储容量,还提升了数据访问速度和可靠性。在大型互联网公司的海量数据存储场景中,分布式存储系统能够快速响应用户的查询请求,确保数据的高效利用。
高速网络:400G 以太网普及,RDMA 技术使跨节点延迟 < 10 微秒,1.6T 以太网进入规划。高速网络技术的发展,使得数据在不同设备和节点之间的传更加迅速和稳定。在大规模 AI 集群中,高速网络能够保证数据的实时传输,避免因数据传输延迟导致的计算效率低下问题。科研机构的 AI 计算集群采用 400G 以太网后,数据传输速度提升,大大缩短科研项目的计算周期。
(四)PC 集群:中低端算力性价比方案
在 AI 算力需求呈指数级增长的背景下,#PC 集群(#PC农场/#PC Farm)作为中低端算力场景的核心基础设施,以其成本优势与灵活性,成为中小企业、边缘计算等场景的主流选择。2024 年中国 PC 集群算力市场规模达 120 亿元,年增长率 35%,预计 2028 年将突破 350 亿元,成为智能算力体系的重要补充。
PC 集群基于 x86 处理器(如 Intel Xeon Platinum 8480H、AMD EPYC 7763)构建,单机节点算力约 20-50 TFLOPS,通过分布式软件栈(Hadoop、Spark、TensorFlow)实现算力聚合且降低硬件投入成本。
典型应用场景包括云游戏、中小企业轻量化 AI 部署、边缘计算实时处理、学术研究与算法验证。
大型智算中心普遍采用 “GPU 集群(训练)+ PC 集群(推理)” 的混合部署模式。某云服务商将 30% 非实时推理任务(如日志分析、批量数据标注)迁移至 PC 集群,算力成本降低 40%,同时释放 GPU 资源用于大模型训练,呼应文中 “算力负载调度优化” 的技术路径。
PC 集群兼容开源框架(PyTorch、TensorFlow、Ray),以 MoE(混合专家模型)为例,PC 集群通过开源推理引擎(如 MLPerf Inference)优化稀疏激活机制,使单 Token 算力消耗降至 Llama-70B 的 1/19,进一步强化 “轻量化模型” 的落地可行性。
PC 集群通过 “低成本 + 高兼容性” 填补了中低端算力市场空白,与高端算力设施形成互补,共同构成中国 AI 算力 “金字塔” 架构。随着异构加速技术与开源生态的成熟,其在 “算力平权” 与 “绿色计算” 中的价值将进一步凸显,成为推动 AI 技术普惠的关键力量。
三、算力服务与行业渗透
(一)服务模式创新降低算力门槛
智算服务市场以 57.3% 的复合增长率扩张,2028 年规模达 266.9 亿美元,形成多元供给体系:
IaaS 服务:按需弹性调度,支持万卡集群分钟级扩缩容。企业可以根据自身业务需求,灵活调整算力资源的使用量,避免资源浪费。游戏公司可在新游戏上线初期,通过 IaaS 服务快速扩展算力,满足大量玩家同时在线的需求;在游戏运营平稳期,则减少算力使用,降低成本。
算力租赁:按推理次数计费,成本低至每百万 Token 1 元。算力租赁模式让中小企业和个人开发者能够以较低的成本获取算力资源,开展 AI 项目。初创企业通过算力租赁平台,以合理的价格租用算力进行模型训练,成功开发出创新AI 应用,节省大量前期硬件投资。
智算中心:政府项目单期算力规划超 1000P,企业级万卡集群落地应用。智算中心的大规模建设,为地区和行业的 AI 发展提供了强大的算力支撑。智算中心吸引众多 AI 企业入驻,形成产业集聚效应,推动当地数字经济的快速发展。
(二)应用场景深度落地
互联网:领跑大模型研发,AI agent 覆盖客服、视频生成等场景,资源利用率提升。互联网公司凭借丰富的数据资源和技术实力,在 AI 应用方面走在前列。利用 AI agent 实现智能客服自动化,能够快速响应用户咨询,提高解决问题的准确率且节省大量人力成本。
金融:算力助力风险识别和交易决策。智能风控系统能够实时监测交易行为,及时发现潜在风险;量化交易借助AI 算法优化策略,提高交易效率和收益。采用大模型辅助信贷审批,大大缩短审批时间且降低不良贷款率。
运营商:5G 网络优化、预测性维护,故障处理效率提升。运营商通过 AI 算力对 5G 网络进行优化,提高网络覆盖和信号质量。预测性维护则利用 AI 算法提前预测设备故障,及时进行维修,减少网络中断时间。
制造:AI 视觉检测能够精准识别产品缺陷,提高产品质量;通过优化生产参数,提升生产效率和降低成本。
政府:智慧城市管理、交通预测,北京、上海等城市已实现秒级路况响应。政府利用 AI 算力提升城市管理水平,实现交通流量预测、智能安防等功能。智能交通系统,能够实时监测路况,及时调整交通信号,缓解交通拥堵,为市民提供更加便捷的出行服务。
四、地域格局与挑战
(一)算力梯队
第一梯队:北京(105 款备案大模型、2.2 万 P 公共算力)、杭州、上海。这些城市凭借丰富的科研资源、人才优势和政策支持,在 AI 算力领域处于领先地位。北京拥有众多高校和科研机构,为 AI 发展提供了强大的智力支持;杭州作为互联网之都,互联网企业的创新活力推动了 AI 算力的应用和发展;上海则凭借国际化的金融和贸易中心地位,吸引了大量的 AI 企业和投资。
快速追赶:深圳(10 亿级 AI 专项基金)、成都(算力券机制)、厦门(2025 年算力达 1.1 EFLOPS)。这些城市通过出台优惠政策、设立专项基金等方式,加大对 AI 算力的投入和支持,快速提升自身的算力水平。深圳的 AI 专项基金吸引了众多优质 AI 项目落地,推动当地 AI 产业的快速发展;成都的算力券机制降低了企业使用算力的成本,激发了企业的创新活力。
(二)挑战与破局
瓶颈:49% 企业认为计算架构限制规模化应用,43% 面临算力资源不足。当前的计算架构在面对大规模、复杂的 AI 计算任务时,存在性能瓶颈,无法满足企业的需求;同时算力资源的紧张也制约了企业的发展,导致部分项目无法顺利推进。
破局:“扩容 + 提效” 并行 —— 扩大智算中心规模(万卡集群),通过模型剪枝、分布式计算提升效率,目标将算力成本降低。加大对智算中心的建设投入,扩大算力规模;通过技术创新,优化计算架构和算法,提高算力利用效率,降低企业的算力使用成本,在不影响模型性能的前提下,大大减少了计算资源的需求。
五、算力电力协同发展
算力电力协同发展是数字经济与能源转型的核心纽带,需以数据为支撑构建系统性解决方案。
(一)强化算电协同政策支撑
1、完善体制机制与跨部门协同
2023 年 12 月《“东数西算” 实施意见》首次明确 “算力电力协同”,要求国家枢纽节点新建数据中心绿电占比超 80%。截至 2023 年底,八大枢纽节点机架数占全国七成以上,其中京津冀(21.5%)、长三角(24.5%)在用机架占比集中,张家口数据中心用电量占全社会比重从 2019 年的 6.8% 升至 2023 年的 20.1%,局部电网扩容压力显著。
资金支持量化方案:设立 “算电协同专项基金”,按算力规模分档补贴:
单期算力≥100P 的政府项目,补贴 0.2 元 / 千瓦时(参考宁夏中卫 8.4 万架算力中心年用电量约 80 亿千瓦时,补贴规模约 16 亿元);
企业自建分布式光伏项目,按装机容量给予 1.5 元 / W 一次性补贴(如腾讯天津数据中心 10.54MW 光伏系统可获 1.58 亿元补贴)。
2. 建立算力电力协同评价指标
核心 KPI 设定:将 “绿电占比”“PUE 值”“弃风弃光率” 纳入地方政府考核,要求 2028 年:国家枢纽节点新建数据中心绿电占比从 80% 提升至 90%;全网算力中心平均 PUE 从 1.5 降至 1.25,其中液冷项目占比超 60%;西部枢纽节点弃风弃光率从 2024 年的青海 9.7%、甘肃 8.7% 降至 5% 以下。
(二)构建算电协同标准体系
1. 技术标准体系细化
供配电技术标准:
制定《算力中心高可靠供电规范》:
UPS 系统备用时间≥30 分钟,柴油发电机切换时间≤10 秒;
2026 年起新建算力中心采用 10kV 柔性直流供电(如中关村科学城双环网架构),供电可靠性达 99.999%。
算力负载调度标准:
发布《算力电力时空协同调度协议》:
延迟容忍型负载(如图像处理)时空调度响应时间≤15 分钟;
跨区域调度通信延迟≤50ms(参考阿里巴巴南通 - 张北调度实验)。
2. 检测认证体系建设
绿电溯源认证:依托区块链建立 “绿电 - 算力” 溯源平台:
每 1MWh 绿电对应发放 1 个绿证,可追溯至具体风光电站;数据中心绿电消费需通过平台备案,2027 年实现 100% 可核查(当前仅 11% 数据中心具备独立计量能力)。
(三)培育算电协同产业生态
1. 关键技术攻关路线图
储能技术:2026 年实现全钒液流电池储能系统:循环寿命≥15000 次,成本降至 1.0 元 / Wh(当前 1.8 元 / Wh);响应速度≤200ms,支持 MW 级算力中心调峰(参考谷歌 St. Ghislain 数据中心锂电池改造)。
源网荷储一体化:制定园区级建设标准:新能源装机容量与算力负载比≥1.2:1(如广西来宾风电数据中心);储能配置容量≥算力中心峰值负荷的 30%,放电时长≥4 小时。
2. 产学研用协同
建立 “算电协同创新联盟”:成员包括三大运营商、华为 / 浪潮等设备商、华北电力大学等科研机构;2026 年前攻克 “算力调度 - 电力市场” 接口协议,实现算力价格与电价联动(如峰谷电价差≥0.5 元 / 千瓦时触发负载迁移)。
(四)营造公平高效市场环境
1. 绿电交易机制创新
2027 年前建成 “西电东算” 专用输电通道:新增张北 - 北京、酒泉 - 上海等 5 条特高压线路,输送容量合计 20GW;跨省绿电交易手续费从当前 0.05 元 / 千瓦时降至 0.02 元 / 千瓦时(参考世纪互联太仓项目省间交易模式)。
2028 年实现绿电现货交易占比达 30%(当前不足 5%),要求:日内交易时段划分≤15 分钟;深圳、山西等试点地区推出 “算力负荷 - 绿电现货” 联动合约。
2. 价格激励与需求响应
设定 “算力电力协同电价”:低谷时段(23:00-7:00)电价下浮 30%,激励 60% 以上延迟容忍型负载错峰(当前仅 25%);新能源大发时段(如西北风电高峰 19:00-22:00)电价下浮 15%。
算力中心参与调峰可获补贴:削峰补贴 0.8 元 / 千瓦・次,填谷补贴 0.5 元 / 千瓦・次;目标 2028 年参与率达 70%(当前不足 30%),年调峰量超 500 亿千瓦时。
中国 AI 算力正从 “规模扩张” 向 “质效并重” 转型,算法创新、绿色基建、服务模式与行业需求的深度耦合,将推动其在 2028 年成为全球最大智能算力市场。这场变革不仅重构 IT 产业格局,更将为制造业升级、智慧城市建设等领域注入 “智能动能”,成为数字经济高质量发展的核心支撑。
#AI算力#智能算力#EFLOPS #大模型#混合专家模型#开源模型#多模态#芯片#GPU#ASIC#FPGA#液冷#PUE#分布式存储#IaaS服务#算力租赁#智算中心#算力资源#PC农场#PC集群#PC Farm
来源:IDC及中国信息通信研究院