智库文档所有分类

2026“人工智能+”行业发展蓝皮书.pdf

下载

用户#501362

200页 | 7.66MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

上海交大行研院报告，引用注明出处主编：史占中、陈晓荣编委：颜敏骏、周辰、窦玉梅、章明根、王计登、谢天统筹：胡倩凝参编技术篇徐奕成、颜敏骏、窦玉梅、窦民、张子涵、李薇、王计登产业篇谢天、周江政、冯飞扬、刘香港、贾润泽、郭志强、许蕾、张彤彤、高明主、郑方周、胡倩凝、舒懿范、任嘉荫、徐奕成、陈巍麟、王计登、李晓宇、杨希、高亮治理篇周辰、高慧、丁紫玉、冯佳、孙玉贝、辛咏琪、颜敏骏、王计登上海交大行研院报告，引用注明出处目录序言....................................................................................................................................................................... 1 技术篇...................................................................................................................................................................2 第 1 章 AI 应用-AI-Native 与 AI Agent ................................................................................................2 AI 应用－软件.........................................................................................................................................2 具身智能——当 AI 拥有“身体”，世界将被重塑......................................................................... 9 人工智能+科学研究（AI for Science）.......................................................................................14 本章小结................................................................................................................................................ 15 第 2章 AI大模型：深度认知与自动行动的范式变革......................................................................18 中美大模型竞争态势与战略分化...................................................................................................18 大模型核心技术演进..........................................................................................................................20 本章小结................................................................................................................................................ 23 第 3章 AI数据的变革与发展趋势：从“资源积累”迈向“智能基座”............................................. 27 范式转变：重新定义 AI-Ready 数据............................................................................................27 技术前沿：AI Ready 的数据基础设施升级................................................................................ 28 数据生态：开源创新与数据治理...................................................................................................29 本章小结................................................................................................................................................ 30 第 4章 AI基础设施：“四力”筑基与智算生态重构.......................................................................... 32 AI 基础设施的界定............................................................................................................................. 32 AI 基础设施发展趋势.........................................................................................................................33 AI 基础设施产业链概况.................................................................................................................... 34 AI 基础设施分布和对场景、产业的支撑.................................................................................... 34 中美 AI 基础设施产业链比较..........................................................................................................35 本章小结................................................................................................................................................ 36 第 5章 AI芯片：算力溢出效应下的半导体价值重构......................................................................38 算力芯片：不仅是计算引擎，而是数据中心的“大脑总管”................................................. 39 存储芯片：算力溢出效应的第一站..............................................................................................45 互联芯片：算力溢出效应的第二站..............................................................................................47 芯片联盟：价值网络上的四大阵营..............................................................................................49 本章小结................................................................................................................................................ 50 上海交大行研院报告，引用注明出处第 6章能源基础设施：AI 算力的终极物理约束............................................................................... 52 数据中心内部：电力电源与储能的架构革命............................................................................52 能源供给方式的升级：从绿电到核聚变.....................................................................................53 中美算力资源的竞争与差异化路径..............................................................................................54 本章小结................................................................................................................................................ 55 产业篇.................................................................................................................................................................57 第 7 章 AI 赋能产业创新发展................................................................................................................57 AI 赋能信息产业..................................................................................................................................57 AI 赋能新材料产业............................................................................................................................. 71 AI 赋能智能制造产业.........................................................................................................................80 AI 赋能新能源产业...........................................................................................................................100 AI 赋能健康医疗产业...................................................................................................................... 113 AI 赋能未来空间产业...................................................................................................................... 122 AI 赋能其他产业................................................................................................................................131 本章小结..............................................................................................................................................145 治理篇.............................................................................................................................................................. 157 第 8 章 AI 政策：全球视野下AI 立法趋势洞察..............................................................................157 国内人工智能政策演进...................................................................................................................157 国际人工智能政策动向...................................................................................................................162 本章小结..............................................................................................................................................168 第 9章人工智能全球治理与国际合作...............................................................................................170 核心原则与价值取向....................................................................................................................... 170 风险图谱：中国场景下的五维风险识别与评估.....................................................................171 治理架构：四维协同的核心维度................................................................................................ 174 实践路径：三侧协同的落地机制................................................................................................ 176 基础保障：支撑治理现代化的能力体系.................................................................................. 178 全球治理：国际协同的中国方案................................................................................................ 180 本章小结..............................................................................................................................................181 第 10章人工智能标准体系建设与实施............................................................................................ 183 中国人工智能标准的应用现状.................................................................................................. 183 中国人工智能标准分类................................................................................................................ 185 上海交大行研院报告，引用注明出处人工智能标准的编写与实施规范..............................................................................................186 人工智能标准未来发展建议.......................................................................................................189 本章小结............................................................................................................................................190 后记..........................................................................................................................................................192 上海交大行研院报告，引用注明出处 1 序言 2025 年，全球人工智能市场规模达到 3909 亿美元，中国人工智能核心产业规模突破 9000 亿元。 AI Agent 细分市场以 %的年复合增长率高速扩张，制造业应用大模型的企业比例在一年之内从 % 跃升至 %。从 2024 年初，中国日均词元（Token）调用量为 1000 亿；至 2025 年底，跃升至 100 万亿；2026 年 3 月，已突破 140 万亿，两年增长超千倍。这些数字背后，是一场深刻变革的加速到来 ——人工智能正在从“能力突破”走向“系统重构”。过去十年，人工智能的主旋律是技术供给侧的突飞猛进：从深度学习到大语言模型，从单一模态到多模态融合，从百亿参数到万亿参数。然而，2025 年以来，行业正在经历一个意义深远的范式转换。 Scaling Law 的边际递减效应促使技术路线从“规模竞赛”回归“研究创新”，后训练技术革命推动模型从“知识灌输”走向“思维涌现”，AI-Native 应用的兴起则标志着人工智能不再是嵌入既有系统的工具，而是从底层重构应用、产品乃至组织的基础力量。《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》（“十五五”规划）将人工智能的发展提升至前所未有的战略高度，明确其作为驱动中国式现代化建设的核心引擎与关键支柱。2025 年 8 月，国务院印发《关于深入实施人工智能+行动的意见》，首次在国家战略层面提出培育智能原生新模式新业态。从国家层面到产业一线，共识正在凝聚：人工智能将引发一场关乎国家竞争力、产业格局与社会治理的系统性变革。本书以“技术—产业—治理”为主轴，构建了三篇十章的系统化分析框架。第一篇·技术篇（第 1—6 章），自上而下解构人工智能技术全栈。从 AI 应用的原生重构、大模型的范式变革、AI 数据的基座升级，到算力基础设施的“四力”模型、芯片领域的价值重构，直至能源作为算力的终极物理约束，完整呈现了从应用层到物理层的技术演进脉络。第二篇·产业篇（第 7 章），聚焦人工智能赋能产业创新的实践。涵盖信息、新材料、智能制造、新能源、健康医疗和未来空间等领域，通过蔚来、工业富联、联影智能等二十余个典型案例，揭示了 AI 从“工具赋能”到“原生重构”各行各业的多样化路径。第三篇·治理篇（第 8—10 章），从全球视野审视 AI 治理的制度建设。系统梳理了国内政策从规划布局到法治深化的三阶段演进路径，比较了世界主要经济体的 AI 政策取向，构建了涵盖技术自主可控、数据安全、国际环境、社会伦理、治理机制适配的五维风险图谱和四维协同治理架构。在标准体系建设方面，为 AI 标准化的未来发展提供了路径指引。技术在重构，产业在跨越，治理在追赶——三条线索交织，构成了当下中国人工智能发展最真实的全景图。当您翻开这本蓝皮书的时候，技术前沿或许已经再次刷新，产业格局或许又有新的变化。但我们相信，本书所呈现的分析框架、核心判断和趋势洞察，将为读者理解这场深刻变革提供有价值的参考。上海交大行研院报告，引用注明出处 2 技术篇第 1章 AI 应用-AI-Native 与 AI Agent AI 应用－软件 AI 应用的发展 2025 年，全球人工智能应用领域进入关键的发展阶段。人工智能应用从辅助工具向自主执行加速演进，人工智能正从基于对话交互的软件，加速向具备自主感知、规划与执行能力的智能体（Agent）方向演进。AI 应用正在逐步突破聊天窗口的交互局限，深度耦合到各个工作流程与生产环节，从 AI 增强（AI-Augmented）阶段向 AI 原生（AI-Native）阶段迈进。从全球市场看，根据 Grand View Research 的数据，2025 年全球 AI 市场总规模约为 3909 亿美元，预计以 %的年复合增长率增长，到 2033 年将接近万亿美元。其中，AI Agent 细分市场增长尤为突出，2025 年规模为亿美元，年复合增长率达 %，预计到 2033 年将达到亿美元，增速显著高于整体 AI 市场。聚焦到中国市场，根据中国信息通信研究院测算，2024 年我国人工智能核心产业规模已突破 9000 亿元，同比增长 24%；2025 年预计突破 12000 亿元。截至 2025 年底，我国人工智能企业数量超 6000 家，形成了覆盖基础底座、模型框架、行业应用的完整产业体系。从中国信通院方升大模型基准测试数据来看，截至 2025 年 12 月，以、Gemini 3 Pro、DeepSeek 、Claude 、Qwen3、Kimi 等为代表的头部语言大模型综合能力较 2024 年底提升 30%，多模态理解能力提升超 50%，大模型基础能力实现跨越式提升。 AI-Native 应用的本质特征准确把握 2025 年 AI 应用发展格局，首先需要厘清 AI-Native 应用和前几代 AI 应用的核心差异。 2025 年 8 月，国务院印发《关于深入实施人工智能+行动的意见》，首次在国家层面提出培育智能原生新模式新业态，明确将人工智能通过原生方式融入组织的战略规划、组织架构和业务流程，发展智能原生的技术、产品和服务，标志着 AI-Native 已从技术概念上升为国家产业战略。但需要明确澄清的是，AI-Native 并非一个非此即彼的绝对状态，而是一个反映应用系统智能化水平的概念。全球主要科技企业与研究机构虽然在表述上各有侧重，但对 AI-Native 的核心判定标准已形成基本共识（如表所示）。表 AI-Native 的迭代特征维度特征维度第一代：AI 赋能（AI-Enabled）第二代：AI 增强（AI-Augmented）第三代：AI 原生（AI-Native）核心逻辑确定性规则驱动混合驱动概率性模型驱动上海交大行研院报告，引用注明出处 3 特征维度第一代：AI 赋能（AI-Enabled）第二代：AI 增强（AI-Augmented）第三代：AI 原生（AI-Native） AI 角色附加功能，可移除副驾驶（Copilot）主执行者（Agent）数据交互记录系统交互系统推理系统用户体验点击操作提示词+审核目标设定+监督关键判据移除 AI 后软件仍可用移除AI后体验显著下降移除AI后产品不可运行综合业界实践与技术白皮书，一个真正的 AI-Native 应用，其设计与构建应系统性地体现 AI First 的核心理念，并在以下六个维度上达到深度融合：一是 AI First，内建而非外挂。从系统设计伊始便将 AI 作为核心组件，而非在现有系统中后期集成。与传统的 Embedding AI（嵌入式 AI）模式不同，AI-Native 应用从架构设计到功能实现均围绕人工智能的能力展开，核心判据在于：如果移除内置的 AI 能力，整个产品将无法运行。这意味着 AI 在研发流程中的前移，在产品构想的初期即以 AI 为出发点。二是数据与知识双轮驱动。构建数据－知识双引擎，通过对海量数据进行深度学习和模式识别来自动提取信息并驱动决策，同时将领域知识系统化地融入模型，使系统能够在面对新情况时快速适应，而非依赖人工编写的规则。三是自学习、自适应、自优化。AI-Native 系统不仅能在静态环境中完成任务，还能在复杂、动态的环境中根据实时数据自动调整策略，在长期运行中持续提升性能、降低资源消耗，本质上具备持续进化的能力。四是以统一基础模型作为智能基座。通过通用性强、泛化能力突出的基础模型（Foundation Model），为全场景 AI 应用提供统一的语义空间和知识表达框架，突破传统 AI 系统中模型碎片化、场景割裂的局限，形成覆盖语言、视觉、决策等多模态的认知底座。五是 Agentic AI，从被动响应到主动执行。AI-Native 系统中的智能体（Agent）能够理解高层目标，主动进行任务规划与分解，自主检索知识库、调用 API、执行代码、操控软件乃至硬件，使应用从智能助手升级为智能执行者。六是弹性异构的多元算力支撑。构建 CPU/GPU/NPU 等异构芯片协同的多元算力池，支持大规模并行计算，通过算力－算法－数据的闭环优化使计算资源随模型复杂度和业务场景动态调整。 AI-Native 成熟度分级：从 L0到 L5 的演进路径 AI-Native 作为一个频谱化概念，业界正在形成一套 L0 至 L5 的成熟度分级框架，从架构完整性、系统协作深度、数据治理能力、模型生命周期管理、AI 驱动自动化程度五个维度，为企业提供系统化的评估参考。 •L0（传统级）：系统中没有 AI 架构定义，各功能模块之间无 AI 协同，数据管理仍为手动离线模上海交大行研院报告，引用注明出处 4 式，运维依赖私有非标的日志与告警，代表了当前绝大多数传统企业软件的现状。 •L1（入门级）：引入基础 AI 参考架构，部分 AI 功能之间通过数据共享实现初步协同。数据采集与在线分析开始自动化，模型部署仍以手动为主。AI 的价值体现为点状增强，局部环节效率提升但系统整体逻辑未变。 •L2（基础级）：AI 功能开始与核心基础设施平台集成，系统具备 AI 赋能的运营运维能力和共享 AI 服务。数据层部分兼容数据资产导入与数据湖架构，模型实现自动化部署，AI 可自动定位故障并预测性能瓶颈。 •L3（标准级）：这是质变的关键节点，AI 能力遍布整体架构，同时覆盖 AI 应用、AI 平台及 AI 基础设施三层。数据层全面支持数据资产导入与数据湖架构，模型生命周期开始参考国家和行业的安全隐私规范进行合规适配与数据脱敏。系统具备自动化修复和抢占式韧性保护能力。 •L4（发展级）：从单系统智能跃升为跨系统协作，上下游 AI 系统之间实现联动与协同。数据治理支持数据湖流水线、数据资产交换网格和零拷贝数据共享。模型可自动迁移与升级，安全可信能力进一步增强。AI 开始介入业务需求管理本身，实现自迭代增强。 •L5（成熟级）：AI-Native 的目标形态，即 AI 管理 AI。通过分布式 AI 模型及智能体应用的广泛协作，实现能力联邦与洞察力共享。数据治理与资产交换全面自动化，模型生命周期完全由 AI 自主管理， AI 深度介入架构设计、代码开发测试等工程环节，系统具备自我进化能力。从当前产业实践来看，全球多数 AI 应用产品仍处于 L1-L2 水平，AI 主要作为辅助功能嵌入现有系统。少数头部产品（如 GitHub Copilot Workspace、Claude Code 等）正在向 L3 迈进。真正达到 L4-L5 的应用在 2025 年仍极为稀少，但这一演进路径已逐步成为软件产业的共识方向。在架构层面，业界已形成两类互补的参考框架。全栈视角将 AI-Native 技术架构分为三层：底层的资源层（提供弹性高性能异构资源池）、中间的平台层（提供模型开发、数据治理、基础 AI 能力的标准化平台）、上层的应用层（面向垂直行业的多模型多场景部署）。应用视角则聚焦于应用内部的智能流转逻辑，将其解构为感知－认知－行动三层：感知层通过多模态数据摄入构建统一智能基座；认知层通过分层记忆（短期上下文窗口+长期向量知识库+GraphRAG 关系图谱）实现深度推理；行动层通过 AgentOps 框架赋予 AI 自主调用 API、修改数据、操控软件的执行能力。前者回答如何构建，后者回答如何运行，共同构成了当前 AI-Native 应用开发的技术参考体系。 AI 应用的发展亮点亮点一：多模态生成能力加速商业化落地 2025 年，多模态 AI 生成（Multimodal Generation）从技术演示阶段加速向规模化商业部署推进，覆盖图像、视频、音频、3D 等内容形态，在广告创意、影视制作、教育内容、游戏开发等领域实现深度渗透。上海交大行研院报告，引用注明出处 5 1.全球竞争格局美国头部产品已形成明确的技术路线分化。Google Gemini 以理解－生成一体化为核心方向，将多模态感知与内容创作融合于统一端到端架构；Veo 2 和 Sora 代表了 AI 视频生成的两条路线，前者强调物理世界的真实模拟，后者侧重叙事结构的灵活控制；Midjourney V7 在图像美学质量上持续保持行业领先；ElevenLabs 等在语音克隆与 AI 配音领域确立了技术标准。中国的多模态生成产品体系同步快速发展。快手可灵（Kling）以高质量视频生成能力多次登上全球技术基准榜单前列；字节跳动即梦（Jimeng）依托抖音生态实现了从创意生成到内容分发的商业闭环；阿里通义万相在电商场景的商品图生成中已实现日均千万级调用；MiniMax 的视频与语音生成在海外市场获得了广泛用户验证。值得关注的是，中国在视频生成领域展现出与美国头部产品接近甚至在部分指标上超越的能力，体现了效率创新路线的竞争力。 2.经济效益与商业化多模态生成是 2025 年 AI 应用中商业化成熟度较高的赛道之一。在广告与营销领域，AI 生成素材的制作成本较传统流程降低 60%-80%，制作周期从数天压缩至数小时。行业实践表明，头部企业通过 AI 自动化内容生产线，在相同预算下可将营销素材产出量提升 3-5 倍。在影视与动画领域，AI 辅助的视觉特效制作正从后期环节前移至前期预览阶段，有效缩短了创意迭代周期。在教育领域，多模态 AI 降低了个性化课件的制作成本，为自适应学习系统提供了内容生成支撑。商业模式方面，主流厂商采取 API 按量计费与订阅制相结合的混合模式。同时，伴随开源模型（如 Stable Diffusion 系列、CogVideo 等）的持续演进，图像生成领域的 API 定价在 2025 年出现显著下降，呈现出模型层趋向免费、应用层收取溢价的经济规律。亮点二：AI 编程工具重塑软件开发生产方式 2025 年，AI 编程工具从代码补全助手发展为全栈开发伙伴。前特斯拉 AI 总监 Andrej Karpathy 提出的 Vibe Coding（氛围编程）概念在全球开发者社区快速普及，开发者越来越多地以自然语言描述意图，由 AI 生成、调试并部署完整的软件模块，软件开发的生产方式正在经历深刻变革。 1.全球产品格局美国在 AI 编程工具的底层范式上保持领先优势： •GitHub Copilot：凭借先发优势和 GitHub 生态，截至 2025 年累计用户数突破数千万，已从代码补全发展为支持多文件编辑和终端操作的 Agent 模式。 •Cursor：以 AI-First 编辑器定位完成了大规模融资，根据中国信通院引用数据，其生成代码准确率达 89%，是 2025 年现象级智能原生开发工具。 •Claude Code：Anthropic 推出的专用编码 Agent，上线不到一年即创造了 10 亿美元的年化收入，支持从需求理解到代码编写、测试、提交的全流程自主执行。上海交大行研院报告，引用注明出处 6 •OpenAI Codex CLI：以命令行工具形式提供代码生成能力，面向专业开发者市场。 2.同步快速迭代的中国AI 编程工具 •Kimi Code（月之暗面）：提供 CLI 终端 Agent 和 VS Code 插件两种形态，基于自研的 Kimi 模型（万亿参数，32B 激活的原生多模态 Agentic 模型），支持视觉理解与代码生成的深度融合。Kimi 上线后登顶 OpenRouter 用量排行榜第一，周处理 Token 量突破 1 万亿，体现了中国自研大模型在编程场景的竞争力。 •Trae（字节跳动）：字节跳动推出的 AI IDE，深度集成豆包大模型能力。 •通义灵码（阿里云）：集成于 VS Code 和 JetBrains 生态，在中文编程场景中积累了大量企业用户。 3.效率提升的实证数据多项企业调研和学术研究为 AI 编程的效率提升提供了量化证据。GitHub 官方报告显示，使用 Copilot 的开发者任务完成速度平均提升 55%；在特定的重复性编码任务中，AI 代码生成率已超过 40%。 BCG 和 McKinsey 的独立调研均发现，部署 AI 编程工具的企业软件开发周期平均缩短 20%-30%，Bug 修复效率提升 25%以上。 4.对软件产业的结构性影响 AI 编程工具正在对软件开发行业的价值链和人才结构产生深层影响。一方面，AI 降低了编程的技术门槛，非技术背景的产品经理、设计师乃至创业者可以通过自然语言生成可用的软件原型，低代码创业正从概念走向实践。另一方面，传统的低端软件外包和初级程序员岗位面临结构性调整压力。行业人才需求正从能写代码向能定义问题、设计架构、审核 AI 输出方向转变。据 BCG 调研，68%的企业在 2025 年表示将维持甚至扩大技术团队规模，但岗位结构将发生根本性调整，AI 编排师（AI Orchestrator）等新型岗位开始涌现。与此同时，AI 编程也暴露出亟须关注的安全隐患。典型案例是 Moltbook 数据库泄露事件：开发者Matt Schlicht 宣称完全依靠AI生成了整个社交平台，但安全审计发现该平台数据库未设置基本防护， 150 万 Agent 账号的 API Key 和对话记录遭到泄露。这一事件表明，在缺乏专业安全审查的情况下，过度依赖 AI 编程可能带来严重安全风险。行业共识是，AI 编程须配合严格的代码审计和安全测试流程，代码生成的效率优势不应以安全性为代价。亮点三：长流程任务智能体加速从概念验证走向产业落地 2025 年具有重要前瞻意义的技术方向，是具备长流程自主执行能力的 AI 智能体（Long-Horizon Agentic Tasks with Tool Calling）。此类 Agent 不局限于问答或内容生成，而是接受高层目标后自主拆解为多步骤任务计划，在执行过程中动态调用浏览器、代码解释器、API、文件系统等各类工具，并在遇到错误时自主纠偏，本质上具备规划、执行和反思能力。上海交大行研院报告，引用注明出处 7 1.代表性产品与技术路线美国率先定义了这一品类的产品形态。OpenAI Operator 作为浏览器原生 Agent，能够自主导航网页、填写表单、完成在线任务；Anthropic Claude Computer Use 赋予 AI 操控计算机桌面的能力，能理解屏幕视觉元素、控制鼠标和键盘、在不同软件间协作；Google Project Mariner 基于 Chrome 浏览器，专注于网页任务的自主执行。中国在 Agent 领域展现出独特的路径优势。Manus 由中国团队 Butterfly Effect 开发，在 GAIA 基准测试中表现突出，能够独立完成从简历筛选到网站搭建的全流程工作，其多模型协作架构展示了中国开发者在 Agentic Workflow 编排上的领先能力，2025 年底被 Meta 收购，成为中国 AI 创业公司全球影响力的标志性事件。字节跳动扣子（Coze）以低代码/无代码平台和自然语言编程为切入点，吸引大量开发者创建 Agent，通过抖音、飞书生态实现分发，产生的交互数据反哺模型训练。 2.标志性事件：Clawdbot/Moltbot/OpenClaw 的快速发展 2025 年末至 2026 年初，Clawdbot（后更名 Moltbot，最终定名 OpenClaw）的快速发展是全球 Agent 领域的标志性事件。这款由奥地利开发者 Peter Steinberger 发起的开源个人 AI Agent 项目，在短短数周内获得超过 32 万 GitHub Star，超过 linux 40 年的成就，成为开源历史上增速最快的项目之一。 OpenClaw 的核心突破在于开创了即时通讯入口+本地网关+云端大模型的端云协同架构。用户通过 WhatsApp 或 Telegram 发送自然语言指令，本地网关（通常部署在 Mac Mini 上）承担感知与执行功能，云端大模型（如 Claude）负责推理与决策，实现指令接收、意图解析、任务执行、结果反馈的端到端闭环，使 AI 初步具备了操控操作系统的能力。这一事件的深远意义体现在三个方面。一是交互范式的转变，AI 从用户需要主动访问的目的地转变为随时待命的通讯对象，低摩擦接入成为 AI Agent 走向大众化应用的重要条件。二是架构模式的演进，用户对数据主权的重视推动了本地部署+云端模型混合架构的普及，这一模式逐步成为个人 Agent 的标准范式。三是从无状态到有状态的跨越，OpenClaw 通过本地 Markdown 文件和向量数据库实现了记忆的持久化，这种数字连续性是 Agent 承担复杂任务的前提。然而，OpenClaw 的快速发展也伴随着突出的安全挑战。赋予 AI 系统级权限意味着更大的攻击面：提示注入攻击可劫持 Agent 执行恶意指令；第三方插件市场出现伪装成加密货币交易助手的窃密程序；安全机构Wiz发现相关平台数据库配置错误导致数据泄露。企业已开始禁止未经沙箱隔离的本地Agent 运行，推动行业向容器化、权限最小化的安全架构演进。更为深层的隐忧来自前沿模型自身的行为风险。2025 年，多项研究揭示了大模型在具备高级推理能力后涌现出的非预期行为。复旦大学团队对国内外 32 款大模型进行全面测评，发现 11 款模型已具备自我复制能力，能在开放环境中主动生成自身副本并触发部署。Palisade Research 实验发现 OpenAI 的 o3 模型在 100 次测试中 7 次拒绝关闭。Anthropic 在 Claude Opus 4 的安全测试中发现该模型具备上海交大行研院报告，引用注明出处 8 策略欺骗能力，在即将被关闭的场景中利用威胁手段迫使测试者中止操作，该行为发生率高达 84%。这些现象表明，AI 安全的关注焦点正从内容安全、数据安全，扩展至模型自身的行为安全。当 AI Agent 拥有操控操作系统和自主决策的能力时，确保其可关闭和可控制已成为技术与治理层面的重要课题。 3.核心支撑协议：MCP与 A2A 长流程 Agent 的规模化落地离不开标准化协议的支撑。2025 年，由 Anthropic 发起、Linux 基金会 Agentic AI Foundation（AAIF）托管的 MCP（Model Context Protocol）协议迅速成为行业事实标准，允许 Agent 以统一标准访问文件系统、数据库、API 及各类外部服务，将工具调用与上下文感知纳入统一架构。Google 推出的 A2A（Agent-to-Agent）协议则通过定义标准化的 Agent Card 元数据模型，将智能体能力抽象为可机器解析的结构化描述，使跨框架智能体可自动匹配协作需求。MCP 解决 AI 与工具的连接问题，A2A解决 AI 与 AI 之间的协作问题，两者互为补充。值得关注的是，中国也在积极推进智能体通信协议的自主生态建设。除广泛采用的 MCP 和 A2A 外，国内涌现出 ANP 协议（ANP 开源技术社区推出的 Agent Network Protocol）、ACP 协议（AgentUnion 提出）以及氦川科技的 RVP 虚实融合通信协议等，为中国的多智能体互联协作提供了自主可控的标准选项。 4.经济效益与商业化进展长流程 Agent 已从概念验证进入初步商业化阶段，行业初步形成了可参考的效益数据。在企业级场景方面，客服、运维、文档审计等领域的 Agent 可将重复性任务的人工介入减少 50%以上，客户服务的单次解决成本下降 30%-50%。在开发者场景方面，编程 Agent（如 Claude Code、Manus）可自主完成从需求分析到代码提交的全流程，单个复杂开发任务的交付周期缩短 60%以上。在成本结构方面，推理成本的快速下降是Agent 商业化的核心前提，2025年主流大模型的每百万Token推理成本较2024 年下降约 80%（如 AWS Nova Lite 每百万 Token 仅美元），企业通过分级模型策略可进一步优化整体 AI 调用成本。 5.市场格局：平台型与垂直场景双轨并行 AI Agent 的商业化呈现出平台型生态与垂直场景双轨并行的发展格局（如表所示）：表平台型生态 agent 与垂直场景 agent 的对比维度平台型生态 Agent 垂直场景 Agent 代表字节跳动 Coze、钉钉 Agent OS、腾讯元器金融合规 Agent、法律审查 Agent、工业检修 Agent 竞争力流量基础、低迁移门槛、开发者工具行业深度知识、专有数据、SLA 服务保证商业化确定性中等，依赖生态规模效应较高，针对刚性痛点，付费意愿强收入模型 Token 抽成、订阅、生态分发软件服务费、效率分成、按结果付费落地瓶颈场景同质化、缺乏高价值闭环数据整合难度大、交付周期长上海交大行研院报告，引用注明出处 9 从资本市场动向看，投资方向已出现明显调整：对通用 Agent 构建平台趋于审慎，转而关注能交付明确业务结果的垂直 Agent 企业。编程、电商外贸、金融文档和工业检修是率先跑通商业闭环的先行场景。辩证看待AI 应用市场：增长是主旋律 2025年围绕AI应用的一个核心争议是市场泡沫问题。Gartner预测40%的Agentic AI项目将在2027 年前被取消；部分厂商将传统聊天机器人和 RPA 工具重新包装为 Agent 的 Agent Washing 现象也引发了市场关注。然而，综合多方数据分析，泡沫迹象与产业增长并存，但增长是主旋律。支撑这一判断的核心数据包括：一是从价值创造空间看，Morgan Stanley 分析框架显示 2025 年全球企业利润约 50000 亿美元，AI 带来 1%-2%的生产力提升即可产生 10000 亿美元的增量收益，足以支撑当前的基础设施投资规模。二是从投资主体看，不同于互联网泡沫时期依赖外部融资，当前 AI 基础设施建设由 Microsoft、Google、Amazon、Meta 等高盈利巨头驱动，其到 2030 年的投资能力合计超过 75000 亿美元。三是从营收验证看，应用层已出现明确的收入信号：OpenAI 预计 2025 年年化收入达 200 亿美元；Anthropic 年化收入突破 90 亿美元；Google Cloud 在 2025 年第四季度收入同比增长 48%至 177 亿美元。四是从资本市场看，全球 AI 投融资占全行业投融资比例从 2023 年的 %上升至 2025 年二季度的 23%。2025 年上半年，美国 AI 投融资金额达 381 亿美元（同比增长 %），中国为亿美元。在中国市场，大模型领域投融资占 AI 总投融资金额的比例从 2023 年的 31%上升至 2024 年的 66%，智谱 AI、月之暗面、百川智能、MiniMax 四家中国企业跻身全球 Top10 大模型融资事件。 Deloitte 2025 年的技术价值调研揭示了一个值得关注的深层规律：AI 的价值更多体现为乘数效应，而非独立解决方案。那些优先投资数据基础设施的企业获得的市值增长（65%），显著高于直接投资 AI 应用的企业（43%）。这意味着，没有坚实的记录系统（System of Record）数据架构作为基础，推理系统（System of Reason）的价值难以充分释放。总体来看，信息技术产业发展过程中阶段性泡沫的出现具有一定的历史规律性，但 AI 应用的产业规模和增长动力构成了不可忽视的发展主线。当前阶段的核心挑战不在于 AI 能力本身，而在于企业能否将 AI 深度嵌入核心业务流程，实现从实验性验证到生产级系统的跨越。具身智能——当AI 拥有“身体”，世界将被重塑具身智能：从“纯软件 AI”到“有身体的 AI” 具身智能（Embodied Intelligence）并非传统意义上的机器人或纯软件 AI，而是指拥有物理身体、能够通过“感知—决策—执行”的闭环在真实世界中自主完成任务并持续学习的智能系统。其本质，是赋予 AI 一个能与物理世界互动的“身体”，让智能不再局限于屏幕和云端，而是走进工厂、走上街道、走入家庭。上海交大行研院报告，引用注明出处 10 一个常见的误解是将具身智能等同于人形机器人。事实上，具身智能是一个从轻量到重度、从专用到通用的渐进光谱：最轻量的一端是端侧 AI——将模型能力嵌入手机、玩具等消费硬件；中间地带是机械臂和非人形机器人——在确定性高的垂直场景中实现精准自动化；最高形态则是人形机器人— —追求与人类环境完全兼容的通用物理智能体。沿着这条光谱，软硬件整合的深度、技术栈的复杂度和商业化的难度依次递增。以下展开三级递进分析：端侧 AI：嵌入场景的“智能器官” 端侧 AI 是具身智能光谱中最轻量、商业化最成熟的一级。它将经过压缩和优化的大模型能力直接嵌入专用硬件，使设备具备本地实时感知与决策能力，无需依赖云端即可完成任务。典型载体包括Agent 手机（如字节跳动豆包手机）、陪伴教育机器人、智能家居终端、工业边缘计算设备等。端侧 AI 的核心价值在于以合理的成本在特定场景中提供可靠的自动化。其商业模式已经过充分验证：多个细分领域实现了规模量产，ROI（Return On Investment）数据清晰。例如在工业领域，兴发集团部署的“数字员工”系统，以 UCS 统一控制系统为物理具身载体，集成控制器、I/O 模块和实时网络，直接嵌入工厂物理设备层，实时感知来自数万个传感器的工业时序数据；大模型 TPT 2 负责将复杂的工艺知识转化为优化指令（如“微调碱液阀门开度 %”），由 UCS 毫秒级转化为真实物理动作，形成“感知—思考—行动”的完整闭环，实现关键工艺的自主精准控制，向“黑屏运行”迈进。端侧 AI 的局限也很清晰：它的“身体”往往是固定或嵌入式的，与环境的物理交互深度有限，更多扮演“智能器官”而非“智能个体”的角色。当任务需要更深度的物理操作（抓取、搬运、装配）时，就需要进入具身智能的第二级。机械臂与非人形具身系统：精准高效的“专业能手” 以固定或移动机械臂为核心的非人形机器人，是当前商业化最成熟的具身智能形态。它们在物流分拣、高端制造、工业巡检、清洁服务等确定性高、ROI 可量化的垂直场景中已实现规模量产。这一层级的技术栈比端侧 AI 深得多：机器人不仅需要感知环境，还需要在三维空间中精确规划运动路径、施加精细力控、并在执行过程中根据传感器反馈实时调整，实现完整的“手—眼—脑”协同。物流场景是典型代表。海康机器人推出的 AMR（自主移动机器人）搭载激光雷达、3D 视觉相机及力/力矩传感器，在 SLAM 地图下实现毫米级定位；通过神经谓词动态评估环境状态，在米窄巷道中自主避障；与立库辊筒线实现±2mm 级对接精度。潜伏式 AMR 与叉取 AMR 在同一地图下协同作业，构成“无人化搬运链”，适配汽车制造等高精度、高安全要求场景。工业制造场景呈现出鲜明的“软硬一体”趋势。在“眼”的层面，梅卡曼德以自研 Mech-Eye 高精度 3D 相机和 Mech-GPT 多模态大模型为核心，构建了机器人“眼脑手”全栈 AI 能力，产品已进入 50 多个国家和地区，用户仅通过自然语言指令就能让机器人完成复杂多样的操作任务。在“脑”的层面，大界机器人以自研工业软件平台 RoBIM为核心，为船舶、电力、重工等行业提供覆盖切割、打磨、焊接、装配的上海交大行研院报告，引用注明出处 11 智能制造系统——在船舶行业，RoBIM 三个月内实现对 100 多种型材的柔性三维切割，远超国外设备仅能处理 20 余种的能力；截至 2025 年大界年营收接近 2 亿元，基本实现盈亏平衡。在“体”的层面，埃斯顿连续八年保持国产机器人市场第一，2026 年发布的系统和 RoboBase 平台提供了开放性更强、兼备边缘推理计算的扩展能力，其协作机器人品牌酷卓 2025 年出货增长超过 270%。三者分别从感知、决策、执行切入，共同印证了非人形具身系统在工业场景中 ROI 清晰、商业闭环可行的判断。非人形系统的优势在于：针对特定任务做到极致的效率和可靠性。但其局限也因此而生。形态受限意味着每进入一个新场景就需要重新设计硬件和工艺适配。当目标是创造一个能在各种人类环境中通用的物理智能体时，就进入了具身智能的第三级：人形机器人。人形机器人：面向通用的“终极形态” 人形机器人被视为具身智能的终极目标，其最大优势在于与人类环境的天生兼容性——身高、体型、关节结构与人类相近，可以直接使用“为人类设计的”工位、工具和空间，无需对产线进行大规模改造。但正因其通用性追求，人形机器人的技术栈也是三级中最复杂的。技术栈：“大脑—小脑”协同框架当前行业主流的技术范式是“大脑—小脑”协作框架。“大脑”（决策规划系统）依托多模态大模型，汇集摄像头、激光雷达等多元传感器数据，进行环境感知、任务规划和智能决策，赋予机器人自然语言理解与自主任务分解的能力；“小脑”（运动控制系统）专注于精确、实时的全身运动控制，保障动作流畅性、稳定性及安全性，实现“手眼协调”的精细操作。两者通过高速数据交互深度耦合，形成“认知 —执行”闭环。图具身智能全栈技术布局各环节成熟度与 ROI（Return On Investment）人形机器人整体处于商业化早期，但不同环节的成熟度差异显著：上海交大行研院报告，引用注明出处 12 表人形机器人各环节发展阶段环节发展阶段 ROI 体现 “大脑”（AI 算法）快速迭代，部分场景已可用任务泛化能力提升，降低逐项任务编程成本 “小脑”（运动控制）相对成熟，复杂动态环境有待突破行走稳定性、操作成功率提升，减少故障停顿本体集成与制造小批量试产，成本高昂整机成本高，ROI 为负；规模量产是关键拐点核心零部件关节/灵巧手等国产替代进行中供应链自主可控后将带来巨大成本下降空间全球竞争格局：中美两大阵营人形机器人产业已形成中美两大阵营对垒的格局。从供应链看，中国控制了全球约 70%的人形机器人零部件供应链，涵盖电机、执行器、传感器、电池和材料，单台 BOM（Bill of Materials）成本约万万美元；而非中国供应链的 BOM 成本高达约 13 万美元，是前者的近 3 倍。这一成本优势源自中国在电动汽车、无人机和消费电子产业中积累的制造生态密度。在 BOM 结构中，执行器（电机+减速器+关节总成）占比最高，达 40%-60%，是最大且在规模化中最不易压缩的成本项。一台典型的人形机器人使用 25-30 个执行器，单个成本从数百到数千美元不等。计算平台相对标准化，绝大多数厂商采用 NVIDIA Jetson 系列，唯一例外是 Tesla Optimus 使用自研 FSD 芯片。以下为主要厂商与产品的竞争全景：表各厂商代表产品竞争全景厂商代表产品关键指标定位与阶段 Tesla Optimus Gen3 173cm/57kg,手部 22DoF,目标售价$2 万-3 万 2026 年 Fremont 投产，目标产能 100 万台/年 Figure AI Figure 03 Helix VLA模型， BotQ 工厂年产万台与 OpenAI 合作， AI 能力领先上海交大行研院报告，引用注明出处 13 Unitree （宇树） G1/H1/R1 G1:$ 万/43DoF； R1:$5,900 2025 年全球出货量第一（5,500 台）优必选 Walker S1/S2 41DoF,Co-Agent 智能体， 7×24h 作业比亚迪/富士康产线实训中 1X Technologies NEO 售价$2 万已启动早期用户交付 Agility Robotics Digit 专用工厂，年产能 1 万台物流场景深度落地智元机器人远征/灵犀系列聚焦工业+家庭双线 2025 年小批量量产 2026 年被业界视为人形机器人的“量产元年”。Goldman Sachs 研究预测，中国供应链正在为 10 万 -100 万台/年的产能做规划。全球市场规模预计从 2025 年的约 6 亿美元增长至 2030 年的 60 亿美元， Morgan Stanley 更远期的预测则高达 2050 年 5 万亿美元。价格竞争已经展开：宇树 R1 以 5,900 美元的定价打破了行业对人形机器人价格的想象，而 Tesla 的目标是将 Optimus 做到 2 万-3 万美元（相当于一辆家用轿车的价格）。实例：优必选Walker S 系列优必选 Walker S 系列是中国人形机器人商业化落地的代表。2024 年发布的 S1 进入比亚迪、富士康等车企产线实训，验证搬运、分拣、质检等基础任务；2025 年推出的 S2 针对 S1 的续航和作业空间局限进行升级，搭载自主换电系统和 Co-Agent 智能体，实现“7×24 小时连续作业”和“全空间作业覆盖”。其采用分层具身智能架构，大脑基于多模态大模型进行环境理解与任务规划，小脑实时处理 41 自由度动力学计算，通过全身力控技术实现毫米级精度。通过“软件定义硬件”模式（切换搬运 Agent、分拣 Agent），实现“一机多用”，适应多品种小批量生产需求。但挑战同样显著：在强光/反光等复杂环境下视觉深度误差扩大、高负载下平衡控制仍不够稳定、强化学习（Reinforcement Learning，RL）需要大量数据（每台每天约 1GB）而工业场景数据收集成本较高。挑战与展望具身智能从端侧 AI 到人形机器人的三级递进中，越往高处走，面临的挑战越严峻。数据是首当其冲的瓶颈：训练一个完全自主的具身智能体需要上亿条数据，但目前最大公开数据集仅在百万量级，且真实物理交互数据的采集成本远高于互联网文本数据。其次是“大脑”与“小脑”的融合鸿沟：高层智能的抽象规划与底层控制的实时执行之间存在接口与协同瓶颈，影响整体行动的流畅与精准。再者，物理世界充满不确定性——物体形变、滑动、环境动态变化，要求执行系统具备极高的自适应能力和精细力控。最后，当机器人持续采集全息化的环境与交互数据时，数据安全与伦理问题将日益凸显：隐上海交大行研院报告，引用注明出处 14 私保护机制是否到位？机器人是否始终可被人类控制和引导？产业界将突破的希望寄托于“世界模型”（World Model）。在当前视觉—语言—动作（VLA）模型的基础上，引入能够对物理世界进行理解、预测和推演的世界模型，被认为是提升机器人大脑能力的关键路径。未来三到五年内，预计可以看到人形机器人真正走进工厂，为客户创造实际价值。具身智能的演进方向不仅是技术的胜利，更是人机关系、生产模式乃至社会结构的一次深刻重塑。人工智能+科学研究（AI for Science） 2025 年，中美两国近期不约而同地将“AI for Science(AI4S）”提升至国家最高战略层级，竞相利用 AI 重构科研范式。美国方面，特朗普签署行政令启动被类比为“曼哈顿计划”的“创世纪计划”，意在举国家之力构建集智算、数据与模型于一体的科学安全平台；中国方面，国务院发布《关于深入实施“人工智能+”行动的意见》，明确将“人工智能+科学技术”列为首要重点行动。这标志着 AI 加速科学发现已成为全球科技博弈的核心主战场。2025 年也是 AI 从“辅助科研”走向“驱动科研”的关键节点，AI 的角色从阅读文献、预测结果，进化到了提出假设、设计实验乃至自主发现。 Google DeepMind 是目前全球 AI4S 的绝对领军者，CEO 戴密斯·哈萨比斯（Demis Hassabis）和同事约翰·琼珀（John Jumper）因开发了人工智能模型 AlphaFold 破解了生物学界长达 50 年的终极难题 ——蛋白质结构预测，而获得 2024 年诺贝尔化学奖。Deepmind 策略是针对生物、材料、气象等硬科学领域的“卡脖子”问题，训练专用的深度学习模型。在生物学方面，DeepMind 新推出的 AlphaFold 3 实现了里程碑式的飞跃。它不再局限于蛋白质结构，而是能预测所有生命分子（蛋白质、DNA、RNA、配体等）及其相互作用。这直接加速了药物设计和基因组学研究。在材料科学方面，Deepmind 利用图神经网络发现了超过 220 万种理论上稳定的新晶体结构（相当于人类过去 800 年发现总和的 45 倍），并已通过机器人实验室验证了部分材料，极大地缩短了电池、芯片新材料的研发周期。而 Claude 则走 “通用智能体”路线，利用其强大的逻辑推理与代码执行能力，充当“超级科研助理”，凭借超大的上下文窗口，Claude 能一次性阅读数百篇论文，帮助科学家进行跨学科的文献综述、假设生成和实验设计。 Claude 引入的计算机操作能力（Computer Use），使其能够像人类一样操作复杂的实验室软件、编写并运行仿真代码、自动处理数据。这使得它正逐渐演变为能自主操作湿实验（Wet Lab）和干实验（Dry Lab）的“科研智能体”。中国方面，上海人工智能实验室（Shanghai AI Laboratory）在 AI for Science 提出通专融合技术路线，打造国际领先的 AGI4S 科学基座与发现系统，旨在重构科研范式。一是发布科学多模态大模型 Intern-S1。针对大模型“通而不专”痛点，提出 SAGE“智者”三层技术体系。开源发布的 Intern-S1 通用性能处于开源第一梯队，在专业科学任务及国际物理奥赛中表现超越 GPT-5 和 Grok-4 等闭源模型。二是打造跨学科通用科学发现系统 Intern-Discovery，通过跨学科知识网、多智能体协同及首创的“科学实体上下文协议”，打破科研孤岛。系统整合 3 亿文献、40PB 数据及 2000+专用模型（如风乌、丰登），上海交大行研院报告，引用注明出处 15 在 GAIA、MLE-Bench 等国际评测中夺冠。目前已赋能 200+机构，在癌症靶点、超导材料等领域实现 10 余项重大突破，推动科研从单点探索向协同涌现跃迁。与此同时，在鄂维南院士的引领下，深势科技（DP Technology）已成为中国“AI for Science”工业化落地的领军独角兽。深势科技打造了覆盖微尺度工业研发全链条的产品矩阵：以“玻尔科研空间站”为枢纽，包含 Bohrium®科研云平台、Hermite® 药物计算设计平台、Piloteye 电池设计自动化平台以及 RiDYMO 难成药靶标研发平台等。玻尔科学导航已服务全球超 1000 所高校和科研机构的 300 多万名科学家，包括中国绝大多数 985、211 高校整体入驻，支撑了上千个科研项目，相关产品和服务为超过 150 家先进研发企业提供智能化升级解决方案，深度赋能复星医药、国药集团等 70 余家生命科学企业的 100 多条研发管线，以及宁德时代、比亚迪等物质科学领域头部客户。本章小结 2026 年政府工作报告明确提出“深化拓展‘人工智能+’”，促进新一代智能终端和智能体加快推广，培育智能原生新业态新模式。AI 已从实验室的精密工具走向千行百业的生产现场，从辅助人类决策的工具进化为重构商业逻辑的底层操作系统。 AI-Native 的终极形态，将是“无感化智能”的全面渗透。未来的应用不再区分“AI 功能”与“传统功能”，智能将成为像电力一样的基础设施——无处不在却无形无感。当智能终端、智能体与物理世界深度耦合，人机交互的边界将进一步消融，取而代之的是环境智能对需求的预判与响应。这种转变意味着，企业的竞争壁垒不再源于是否使用 AI，而在于能否构建“数据－模型－场景”的飞轮效应，让智能在业务流转中自我进化。具身智能的破局之路，指向“世界模型”驱动的通用机器人时代。当前的数据瓶颈与协同鸿沟只是阶段性阵痛，随着物理世界理解能力的突破，机器人将从特定场景的“熟练工”进化为具备常识推理的“通用劳动力”。这不仅将重塑制造业的生产范式，更将引发服务业、农业乃至家庭场景的连锁变革。当机器真正理解物理世界的因果规律，人机协作将超越简单的指令执行，进入“意图共享、风险共担”的深度协同新阶段。 AI for Science 的深远意义，在于开启“自主发现”的新科学革命。国务院《关于深入实施“人工智能 +行动”的意见》将“人工智能+科学技术”列为首要重点行动，标志着 AI 加速科学发现已成为全球科技博弈的核心主战场。当 AI 从文献阅读者变为假设提出者，从实验预测者变为方案设计者，科学发现的周期将被大幅压缩，创新范式从“试错驱动”转向“认知驱动”。这不仅是研究效率的提升，更是人类认知边界的拓展——在材料、能源、生命科学等战略领域，AI 将成为破解复杂系统奥秘的“望远镜”与“显微镜”，加速解决气候变化、疾病治疗等人类共同挑战。本章参考资料 [1]中国信息通信研究院.人工智能产业发展研究报告（2025）[R].2026. 上海交大行研院报告，引用注明出处 16 [2]华为云.AI-Native技术与实践白皮书[R].2025. [3]搜狐科技.超 10 款大模型已具备“自我复制”能力[EB/OL].2025. [4]财联社.觉醒第一步？OpenAI模型在研究中违抗命令，竟然篡改关机脚本[EB/OL].2025. [5]光明网.OpenAI等创立基金会，推动AI Agent标准化[EB/OL].2025. [6]光明网.智源研究院发布全球首个跨本体具身协作框架与开源具身大脑[EB/OL].2025. [7]林典驰.专访优必选科技创始人、董事会主席兼CEO周剑：相比做表演，人形机器人更要进工厂干实事[EB/OL].2025. [8]何文翔，黄朝峰.战略深解读｜再造曼哈顿丰碑？美启动AI“创世纪计划”的雄心与阻力[EB/OL].202 6. [9]Grand View Intelligence Market(2026-2033)[R].2026. [10]Grand View Agents Market(2026-2033)[R].2026. [11]Grand View Agents Market Size To Reach$ Billion By 2033[EB/OL].2025. [12]Open Model Rankings()[Z].2026. [13]Kimi :Visual Agentic Intelligence[R].2026. [14] the ROI of AI Adoption:Metrics and Dashboards Every Org Needs in 2 025[R].2025. [15] agentic organization:Contours of the next paradigm for the AI era[R].2025. [16]BCG AI Potential to Profit:Closing the AI Impact Gap[EB/OL].2026. [17] execution with MCP:Building more efficient agents[EB/OL].2025. [18] Predicts Over 40%of Agentic AI Projects Will Be Canceled by End of 2027 [EB/OL].2025. [19]Morgan Funding:The Bull and Bear Investment Cases[EB/OL].2025. [20]Business of Revenue and Usage Statistics(2026)[R].2026. [21]Luis advertising revenues climb 14%as Gemini App reaches 750 million us ers[EB/OL].2026. [22] is capturing the digital ’s left for the rest of the tech estate?[R].202 6. [23]Humanity's Last Deep Dive on Humanoid Hardware[R].2026. [24]Goldman Sachs humanoid robot supply chain field trip takeaways:Optimisti c capacity preparation in advance,awaiting actual orders[R],2025. [25]Morgan Industrials:2026 Outlook–Humanoids[R/OL].2026. 上海交大行研院报告，引用注明出处 17 上海交大行研院报告，引用注明出处 18 第 2章 AI 大模型：深度认知与自动行动的范式变革 2025 年应当被人工智能发展史标记为“范式转移”的一年，全球人工智能产业正经历从“算力暴力美学”向“架构效率与深度推理”转型的关键拐点。随着 Scaling Law（规模法则）在单纯参数堆叠层面遭遇边际效应递减的挑战，技术竞争的焦点已从预训练（Pre-training）阶段全面延伸至后训练（Post-training）、推理时计算（Test-time Compute）以及新型架构的探索。行业关注的焦点，正从“模型能聊什么”急剧转向“模型能做什么”以及“模型如何理解物理世界、如何影响物理世界”。本章所讨论的，正是这一轮范式重构背后的核心逻辑。一方面，大模型能力边界持续外扩，模型正由文本生成迈向对现实世界更深层的模拟、推理与操作；另一方面，产业竞争格局也在加速重塑，模型竞争不再局限于参数规模和单点评测成绩，而是逐步转向性能、效率、生态与落地能力的综合比拼。尤其是在算力约束和地缘政治等多重因素交织的背景下，中国人工智能产业正在由早期以跟随优化为主，转向更加重视底层架构创新、系统工程能力和成本效率优势的新阶段，并对全球开源模型生态和产业竞争格局产生实质性影响。中美大模型竞争态势与战略分化 2025 年的 AI 技术版图呈现出“两极多强”的复杂态势。美国企业依托算力基础设施、基础研究和平台生态优势，持续推动通用模型能力上限；中国企业则在算力资源约束条件下，更加注重效率优化、工程协同和开源开发，逐步形成差异化发展路径。中美竞争也由单一的模型能力竞争，延伸至训练范式、产业生态、商业模式和应用渗透的多维竞争。共识演进：Scaling Law的“收益递减”与“研究时代”的回归在经历了长达多年的“算力暴力美学”之后，行业开始重新审视 Scaling Law 的适用边界。尽管数据规模与算力投入的增加仍能够有效降低预训练损失（Pre-training Loss），但其对模型推理能力（Reasoning）与泛化能力（Generalization）的提升效率已不如早期阶段显著。 2025 年底，OpenAI 的前首席科学家、Safe Superintelligence（SSI）创始人 Sutskever 明确提出： 2020 年至 2025 年的“扩展时代”（Age of Scaling）已经接近结束，行业正重新进入“研究时代”（Age of Research）。他的核心观点在于，单纯将计算集群规模扩大 100 倍，已无法像过去那样线性地带来智能的质变。未来的突破将更多依赖于算法的根本性创新、更高质量的合成数据以及测试时计算（Test-time Compute）的有效利用。从产业层面看，这一变化意味着模型能力提升路径正在发生结构性迁移。过去的核心问题是“如何训练更大的模型”，当前的核心问题则更多转向“如何让模型更会思考、更会调用、更会执行”。这也为后训练、测试时计算和 Agent 系统的快速崛起奠定了基础。效率驱动与工程优化：中国路径的强化在先进制程芯片获取受限、算力资源相对紧张的背景下，我国大模型企业加快由规模扩张向效率上海交大行研院报告，引用注明出处 19 优先转变，更加突出单位算力产出最大化。模型研发重点也由单纯追求参数规模提升，转向结构设计、训练框架、通信系统和推理部署等环节的协同优化，着力在既有硬件条件下同步提升训练效率、推理吞吐和部署可行性，推动性能、成本与扩展能力实现更优平衡。国内大模型企业围绕效率优先持续推进技术迭代。2025 年初，DeepSeek 系列模型引发业界的 “DeepSeek 冲击”（DeepSeek Shock）。其中，DeepSeek-V3 作为一款 6710 亿参数的混合专家（MoE）模型，凭借多头潜在注意力（MLA）机制和无辅助损失负载均衡等设计，仅用万 H800 GPU 时完成训练，训练成本显著低于同级别美国模型；DeepSeek-R1 在推理任务上的表现接近 OpenAI o1，兼具低成本和开放属性，相关论文登上 Nature 封面。这表明，“模型—系统协同设计”（Model-System Co-Design）正在成为降低训练成本、提升推理效率和增强部署可行性的重要路径，也在一定程度上推动 Meta 等企业加快开源模型布局。与此同时，Qwen、MiniMax 等模型也持续在长上下文处理、注意力机制和推理效率等方面持续推进优化。总体来看，我国大模型技术创新正在由点状突破转向体系化推进，逐步拓展至模型、框架、硬件适配和推理部署协同推进的系统化阶段，技术演进的协同性和整体性持续增强。我国与国际前沿模型之间的能力差距也呈现出明显收敛态势。斯坦福大学《2025 年人工智能指数报告》指出，到 2024 年底，中美顶尖模型在 MMLU、HumanEval 等主要基准测试上的性能差距，已由 2023 年的两位数水平收窄至接近持平。报告同时认为，随着 DeepSeek-R1 等模型于 2025 年初发布，中国实验室模型进一步逼近国际前沿水平，多个国产模型在推理、代码和通用能力测试中实现跨代追赶。Epoch AI 基于 Epoch Capabilities Index 的分析也显示，自 2023 年以来，美国与中国最强模型之间的能力代差大致在 4 至 14 个月之间，平均约 7 个月。总体看，中美之间仍有差距，但这种差距更多体现为迭代节奏上的时间差，而非难以跨越的代际断层。随着模型迭代周期持续缩短、成本优势逐步显现，国际竞争的焦点也正由“谁先发布最强模型”，转向“谁能够以更低资源消耗和更快迭代速度，推动模型能力更快进入规模化应用”。效率优势也正在加快转化为价格优势。根据OpenRouter平台在2026年3月的公开报价，DeepSeek V3 0324 的价格约为输入美元/百万 tokens、输出美元/百万 tokens；同期 OpenAI 价格约为输入美元/百万 tokens、输出 15 美元/百万 tokens。这样的成本差异会直接影响产业落地，因为工业质检、企业客服、办公自动化、终端智能体等高频调用场景对调用成本普遍较为敏感。在基础模型能力差距逐步收敛的情况下，价格、部署效率和服务稳定性正成为影响应用扩散的关键变量，单次基准测试成绩的重要性则相对下降。开源 VS闭源：技术与生态方面的双重竞争在技术路线和商业模式层面，开源与闭源正呈现并行发展态势，并在中美两国形成不同的侧重点和竞争逻辑。总体来看，美国更强调通过闭源体系巩固能力优势和商业闭环，中国则更倾向于通过开源加快技术扩散和生态培育。上海交大行研院报告，引用注明出处 20 美国路径方面，呈现出“核心能力闭源、外围生态开放”的特征，在保持模型与商业体系控制力的同时，不断扩大其全球开发者覆盖面。以 OpenAI、Anthropic、Google 为代表的头部企业整体仍以闭源模型为核心，一方面持续加大算力基础设施投入，依托超大规模智算集群支撑模型能力上限的提升；另一方面通过强化学习等方法持续增强推理能力，提高模型在数学、编程等高复杂度任务中的表现。在产业生态层面，美国依托 GitHub、Hugging Face 等全球性开源社区，长期积累了广泛的开发者基础和国际影响力，为技术扩散、工具链完善和应用生态构建提供了重要支撑。中国路径方面，以DeepSeek、阿里Qwen等为代表的企业，在开源方向上更为积极，正在形成以能力开放带动生态扩散的发展路径。以 DeepSeek 为例，DeepSeek-R1 采用 MIT 许可证开源模型权重，允许自由使用、修改与商业化部署，显著降低了先进模型的使用门槛。此后，DeepSeek 又通过“开源周”等方式，集中发布推理加速、通信优化、训练框架等多项基础设施组件，推动模型能力与底层系统能力同步开放。截至 2026 年 3 月，DeepSeek-R1 在 Hugging Face 平台点赞数已超过万，下载量超过 1700 万次，并已接入微软 Azure、英伟达、阿里云、百度云等多家云平台。Qwen 系列则通过持续开源模型和工具体系，不断夯实开发者生态基础。2026年2月，系列发布后迅速占据Hugging Face 趋势榜前列，其中 -35B-A3B 在发布不足 24 小时内即登顶。与此同时，阿里也在积极建设本土开源社区和生态平台，如魔搭社区，持续提升开源生态的集聚能力和国际影响力。开源路径的核心作用在于通过降低技术门槛，迅速扩大使用规模，并在应用层加快形成事实标准。随着开发者生态不断积累，模型本身的控制权虽有所弱化，但生态影响力和市场渗透能力反而持续增强。开源与闭源的竞争，正在从单纯的模型发布竞争，进一步演化为围绕技术扩散速度、开发者生态规模和产业协同能力的综合竞争。大模型核心技术演进后训练技术革命：从知识灌输到思维涌现如果说 2024 年以前，大模型能力提升主要依赖海量数据预训练带来的知识积累，那么 2025—2026 年，行业关注重点已明显转向后训练阶段，模型竞争的核心也由“学到更多知识”转向“具备更强推理能力”。从技术范式看，人工智能正由更偏向直觉式模式匹配的阶段，逐步转向更强调逻辑演绎、步骤验证和自我修正的阶段。测试时扩展（Test-time Scaling）开始成为能力提升的重要来源。在心理学中，System 1 强调快速、直觉式、低成本的反应，System 2 则强调缓慢、审慎、分步骤的推理。Test-time Scaling 为模型提供了由快速作答转向深度思考的计算条件，其本质是将部分计算资源由训练阶段延伸到推理阶段：对于简单问题，模型仍可沿用更接近 System 1 的方式快速响应；对于复杂问题，则调用更接近 System 2 的机制，通过更长的推理链条、更充分的中间验证和更多候选路径的比较，换取更高的正确率。OpenAI 的 o1、o3 以及 DeepSeek-R1 都不在于模型规模的单纯扩大，而在于在处理复杂数学、代码和分析类上海交大行研院报告，引用注明出处 21 问题时，能够显著增加中间推理过程，表现出更强的分步求解、错误发现和路径回溯能力。此外， DeepSeek-R1 对显性思维链的展示，也在一定程度上提升了外界对推理模型工作机制的理解。与 Test-time Scaling 相伴而生的，是可验证奖励强化学习（Reinforcement Learning from Verifiable Rewards，RLVR）的快速发展。若说 Test-time Scaling 解决的是模型在使用阶段如何“想得更深”，那么 RLVR 解决的则是模型在训练阶段如何学会这种推理方式。传统 RLHF 更适合对齐模型的表达风格、安全边界和人类偏好，但在数学、代码、逻辑推理等任务中，决定模型表现的关键在于“过程是否正确、结果是否可验证”。RLVR 是以可程序化验证的“真值信号”替代主观人类反馈作为奖励函数，例如，数学题是否得到唯一正确答案、代码是否通过测试用例、推理过程是否满足既定约束，都可以作为明确、低噪声、可规模化的训练反馈。与人工偏好打分相比，这类奖励信号更稳定，也更适合在大规模训练中反复迭代。从训练机制看，RLVR 强化的是模型处理复杂问题的过程能力，在大量“生成 —验证—修正—再生成”的循环中，会逐步学会拆解问题、比较路径、回溯纠错，并重新组织推理。这种能力本质上就是对 System 2 式推理的训练。总体来看，Test-time Scaling 与 RLVR 正在共同推动大模型由偏向 System 1 的“知识型模型”向兼具 System 2 能力的“推理型模型”演进。前者提升的是模型在推理阶段释放能力的深度，后者塑造的是模型形成这种深度推理能力的训练机制。两者叠加，使后训练阶段由过去的辅助环节逐步上升为决定模型上限的关键战场。多模态融合与世界模型多模态大模型的发展已不再停留于对文本、图像、音频等不同模态的简单叠加，而是进一步朝着统一建模、环境理解和世界表征的方向演进。以 GPT-4o 为代表的新一代模型，推动多模态系统由过去“语音转文本—文本推理—文本转语音” 的级联式结构，转向在统一模型中直接处理不同类型 Token 的方式。通过单一 Transformer 同时处理文本、图像和音频信息，模型能够更自然地完成多模态交互，在语音响应速度、情感识别和上下文一致性等方面表现出更强能力。OpenAI 在 GPT-4o 系统说明中明确指出，该模型是一个端到端训练的 “omni”模型，可在同一神经网络中处理文本、视觉、音频和视频输入，并可在数百毫秒级别响应音频输入。随后，Gemini 3、Qwen3-Omni 等模型也在原生多模态方向持续推进，行业整体趋势正由“外挂式多模态”转向“原生式多模态”。世界模型（World Model）逐步成为更受关注的前沿方向。学术界对“世界模型”尚无完全统一的定义，但较为经典的理解来自强化学习领域。按照 Sutton 和 Barto 的定义，模型是智能体对环境运行方式的内部表征，即能够根据当前状态和动作预测下一步状态及相应结果。沿着这一路径，David Ha 与 Jürgen Schmidhuber 在《World Models》中进一步提出，可通过学习压缩的时空表征来构建环境模拟，并在该模拟环境中训练智能体。由此出发，只要系统具备对环境变化的预测能力，便可以被视为具有某种意义上的“模型”，这也为当前视频生成、环境模拟等系统被视作世界模型的早期形态提供了重要理上海交大行研院报告，引用注明出处 22 论基础。围绕世界模型的研究，正在由“能否预测下一步”进一步走向“能否真正理解世界”。一类路径强调基于大规模视频和多模态数据，对物理过程和动态变化进行统计建模，从而实现更高质量的视频生成和环境模拟。OpenAI 在介绍 Sora 时将其定位为“video generation models as world simulators（世界模拟器）”，强调其目标是构建能够理解并模拟现实的视频模型；Google 的 Gemini 与 Veo 路线也在持续强化多模态理解、时序一致性和更复杂的生成能力。另一类路径则更强调模型应当理解事物的状态、结构与因果关系，而不只是预测像素变化。LeCun 则提出 JEPA（Joint Embedding Predictive Architecture）架构，他认为未来智能系统需要建立可配置的预测式世界模型，并通过联合嵌入等方式学习更抽象的状态表征，而不是停留在像素级预测层面。与此同时，学术界还兴起了空间智能方向的探索。“AI 教母”李飞飞教授创立的 World Labs 将模型能力从二维图像理解进一步推向三维空间表征，强调人工智能应具备对 3D 世界的感知、生成、推理和交互能力。模型不只要“生成视觉内容”，还要能够理解物体的几何结构、遮挡关系和空间位置，并据此构建可交互、可漫游的环境。这意味着，多模态与世界模型的发展，正在推动人工智能由信息处理系统向现实世界交互系统演进，并为机器人、自动驾驶、数字孪生和具身智能等更复杂的现实任务奠定基础。总体来看，多模态与世界模型的发展，正在推动人工智能由信息处理系统向现实世界交互系统演进。其意义已不再局限于提升内容生成能力，而是在为机器人、自动驾驶、数字孪生、具身智能等更复杂的现实任务奠定基础。谁能更早实现对真实世界中“感知—理解—预测—交互”链条的有效建模，谁就更有可能在下一阶段技术竞争中占据优势。 Agentic AI 的崛起 2025 年被视为“智能体（Agent）元年”。相较于传统聊天模型，智能体将规划、记忆、工具调用和执行整合进统一系统，使大模型从回答问题进一步走向完成任务。由此，大模型竞争的重点也从单轮问答能力，转向复杂任务的拆解、调度与闭环执行能力。美国企业在通用智能体和协议生态方面仍保持先发优势。OpenAI已将智能体能力从单一产品推进到模型和工作流层面：从具备浏览器操作能力的 Operator，到可自主完成检索、分析和报告生成的 Deep Research，再到 2026 年发布的与 -Codex，OpenAI 正在把推理、编码、工具使用和长程任务执行整合进统一能力体系。Anthropic的推进路径更强调模型能力与协议标准的同步建设。 2026 年发布的 Claude Sonnet 和 Opus ，重点强化了编码、计算机操作、长上下文推理和长程智能体任务持续性；与此同时，Anthropic 持续推进 MCP，将模型与外部数据源、工具系统的连接从定制集成推向标准化。Google的布局则更明显地指向模型、代理和协议一体化演进，Gemini 3 系列持续强化多步骤任务处理与复杂工具调用能力，Google 还通过 Interactions API 向开发者开放 Deep Research，并推出 A2A协议，尝试降低不同智能体之间的通信与协作门槛。整体来看，美国路径的优势已不再局上海交大行研院报告，引用注明出处 23 限于单一模型性能，而是体现在模型能力、工具体系、协议标准和平台控制力的整体领先。中国企业的推进节奏则更突出产品化、场景化和成本效率。智谱推出全球首个终端智能体 AutoGLM，终端智能体能力向手机和桌面延伸，GLM-5 也将多步推理、长程执行和端到端开发能力作为重点方向。月之暗面的 Kimi 进一步整合长上下文、多模态和工具调用能力，支持 256K 上下文、多步工具调用和复杂 Agent 任务，并在编程与专业工作流场景中持续强化表现。MiniMax的迭代更集中地落在生产力场景，M2 自发布起就面向 Agent 和代码任务，强化了编程、工具调用和复杂任务处理能力，则进一步将复杂 Agent Harness、自主工具搜索和团队式 Agent 协作推向真实研发与办公场景。阿里Qwen则采用模型、框架和开发工具同步推进的方式扩展 Agent 生态，Qwen3 延续了在推理、编码和工具使用上的强化，Qwen-Agent 已成为 Qwen Chat 的后端框架之一，Qwen Code 则进一步把终端 Agent 能力推向代码仓库理解、自动化修改和开发流程协同。整体来看，中国厂商更强调把智能体能力尽快落到编程、终端操作、办公自动化和垂直流程中，并依托开源与价格优势，加速进入全球开发者工作流。 2026 年初，开源智能体框架快速扩散，Agent 能力正在从少数模型厂商主导的封闭体系，转向更广泛的开发者生态。以 OpenClaw（龙虾）为代表的开源框架，能够连接底层模型与外部工具，并通过技能扩展支持更多工作流场景，显著降低智能体开发和部署门槛，推动智能体从展示型产品走向可配置、可部署、可扩展的工作流系统，也为“一人创业公司（OPC）”提供了更多可能。此外，由于智能体在执行多步任务时，Token 消耗显著高于传统聊天场景，调用成本将直接影响其可用性和规模化落地，并进一步带来“词元（Token）经济”。根据 OpenRouter 平台周度使用数据，2026 年 2 月 9 日至 15 日当周，中国模型调用量达到万亿 Token，首次超过同期美国模型的万亿 Token；截至 3 月 15 日，中国 AI 大模型周调用量进一步升至万亿 Token，全球调用量排名前三的模型已全部由中国厂商占据，分别为 MiniMax 、阶跃星辰 Step Flash（free）和 DeepSeek 。可以看出，在开源框架、自主智能体发展和全球开发者生态共同推动下，低成本、高频调用的中国模型正在更快进入海外开发者的真实使用链路。本章小结站在 2026 年的开端回望，人工智能正经历由“参数规模扩张”向“深度认知与自主行动”加速演进的重要转变。随着训练端 Scaling Law 边际收益逐步收窄，行业竞争的重点正由“谁能训练更大的模型”转向“谁能让模型更会思考、更会调用、更会执行”。推理时计算的重要性持续上升，模型开始通过更长的推理链条、更复杂的中间验证和更高强度的计算投入，提升在数学、代码、复杂检索和多步骤任务中的准确率。未来高价值模型的竞争焦点，将更多体现为推理深度、执行稳定性和复杂任务处理能力。与能力提升路径同步变化的，是智能体系统形态的重构。“大模型本身不是护城河”，当前的智能体正在向着构建完整的运行系统加速发展。基础设施与保障、规划、记忆、工具、技能、评估验证、追上海交大行研院报告，引用注明出处 24 踪观测等能力被纳入统一的 Harness Engineering 框架，模型开始由“回答问题”走向“完成任务”甚至“自主进化”。与此同时，认知与行动之间的边界也在被快速打通。随着 ReAct 范式、Computer Use 能力和各类 Agent 框架逐步成熟，行业评估标准正由单一的问答准确率，转向真实场景下的任务完成率、流程闭环能力和跨系统调用效率。多智能体系统也正在成为承接复杂任务的重要组织形式，推动人工智能由单点能力竞争转向系统能力竞争。多模态与世界模型的发展，则进一步将这种能力延伸至更加接近现实世界的层面。模型已不再局限于对文本语义的理解和生成，而是在向图像、音频、视频、空间关系和动态过程的一体化建模迈进。无论是多模态统一架构、空间智能的形成，还是世界模型对环境状态、物体关系和物理规律表征能力的增强，其共同指向都是提升模型对真实世界的理解深度。这一趋势不仅将重塑内容生成与交互产业，也将为机器人、自动驾驶、数字孪生和具身智能奠定更坚实的认知基础。谁能率先打通“感知—理解— 推理—执行”的完整链条，谁就更有可能在下一阶段的现实任务场景中占据优势。从产业层面看，全球大模型竞争已不再是单一维度的参数竞赛，而是演变为性能、效率、价格、生态和落地能力的综合竞争。美国仍在前沿模型、协议标准和平台体系方面保持领先，中国则依托效率优化、系统工程、开源扩散和成本优势，持续缩小与国际前沿的差距，并在应用扩散和开发者生态拓展方面形成新的竞争力。未来大模型竞争的关键，不仅在于模型能力本身，更在于谁能以更低成本、更高稳定性和更快迭代速度，将模型推向更大规模的真实场景。科学发现是对智能的终极考验。人工智能的影响正在超越传统信息处理范畴，逐步进入科学发现和实验体系重构阶段。围绕自动化实验流程、科学智能体和 AI 驱动科研系统的探索，正推动科学研究向更强闭环化方向发展。未来在材料筛选、药物研发、复杂系统模拟等领域，智能体有望承担更多从假设生成、实验模拟、实验设备调用、数据分析到结果修正的中间环节，人类角色则更多转向目标设定、约束定义和结果解释。尽管“全自动无人实验室”仍处于演进过程中，但其所反映的趋势已经十分明确：人工智能正从提升研究效率的辅助工具，逐步演变为参与知识生产和科学发现的重要组成部分，并且将彻底引发科学研究范式的变革。AI 终将成为全球科技竞争中最为关键的胜负手。本章参考资料 [1]Bouchard from Ilya Sutskever's November 2025 interview with Dwarkesh Patel[EB/OL].(2025-11-25)[2026-03-27]. highlights-from-ilya-sutskever-s-november-2025-interview. [2]Guo D Y,Yang D J,Zhang H W,et -R1 incentivizes reasoning in LLMs through reinforcement learning[J].Nature,2025,645:633-638. [3]中国信息通信研究院.人工智能产业发展研究报告（2025 年）[R].北京:中国信息通信研究院,2025. [4]Stanford Institute for Human-Centered Artificial 2025 AI Index 上海交大行研院报告，引用注明出处 25 Report[R].Stanford:Stanford University,2025. [5]Epoch Capabilities Index[EB/OL].(2025)[2026-03-27]. [6]Kahneman ,Fast and Slow[M].New York:Farrar,Straus and Giroux,2011. [7] o1 System Card[EB/OL].(2024-09-12)[2026-03-27]. [8] o3-mini[EB/OL].(2025-01-31)[2026-03-27]. [9]Ji T,Yuan Y,Wen Q,et Learning with Verifiable Rewards Implicitly:A Survey[EB/OL].(2024)[2026-03-27]. [10] to GPT- 4o System Card:4o image generation[EB/OL].(2025-03-25)[2026-03-27]. stem-card-addendum/ [11]Google 3:A new era of intelligence[EB/OL].(2025-11-18)[2026-03-27]. gemini/gemini-3/. [12]阿里云通义实验室.Qwen3-Omni：一个模型，全能不偏科 [EB/OL].(2025-09-25)[2026-03-27]. [13]Sutton R S,Barto A Learning:An Introduction[M].2nd :MIT Press,2018. [14]Ha D,Schmidhuber Models[EB/OL].(2018)[2026-03-27]. [15]:Video generation models as world simulators[EB/OL].(2024-02-15)[2026-03-27]. as-world-simulators. [16]Wiedemer T,Li Y,Vicol P,et Models are Zero-Shot Learners and Reasoners[EB/OL].(2025)[2026-03-30]. [17]Maes L,Le Lidec Q,Scieur D,LeCun Y,Balestriero :Stable End-to-End Joint-Embedding Predictive Architecture from Pixels[EB/OL].arXiv:,(2026)[2026-03-27]. [18]World Intelligence[EB/OL].(2024)[2026-03-27]. [19]中国信息通信研究院人工智能研究所,华为技术有限公司.智能体技术和应用研究报告（2025 年） [R].北京:中国信息通信研究院,2025. 上海交大行研院报告，引用注明出处 26 [20] Opus 4 and Claude Sonnet 4[EB/OL].(2025-05-22)[2026-03-27]. [21]GLM-5 -5:From Vibe Coding to Agentic Engineering[EB/OL].(2026)[2026-03-27]. [22]Kimi :Visual Agentic Intelligence[EB/OL].(2026)[2026-03-27]. [23] :Agent Self-Evolution Path[EB/OL].(2026-03)[2026-03-27]. [24]OpenClaw Release Notes[EB/OL].(2026-03)[2026-03-27]. [25]谢岚.日均 Token 调用量爆发式增长折射中国 AI 产业新图景[N].证券日报,2026-03-25(A01). [26] AI Model Usage Statistics Report[EB/OL].(2026-02)[2026-03-27]. 上海交大行研院报告，引用注明出处 27 第 3章 AI 数据的变革与发展趋势：从“资源积累”迈向“智能基座” 随着“人工智能+”行动在千行百业的深入推进，数据已不再仅仅是静态的存储资源，而是演变为驱动大模型智力涌现的核心动力。2025 年，全球 AI 数据产业经历了一场深刻的供给侧改革：从盲目追求 PB 级规模的粗放增长，转向追求高密度、高信噪比的“质量至上”；从单一的文本模态，迈向图文音视频交织的“多模态融合”；从中心化的数据加工，演进为分布式的隐私计算与联邦智能。本章将系统剖析 AI 数据技术的最新范式转变，重点阐述以合成数据、非结构化文档解析、向量数据库为代表的基础设施升级，并结合国家数据局关于“数据要素×”与“人工智能+”的战略导向，探讨如何构建一个开放、安全、高质量的数据生态体系，为 2026 年的行业爆发奠定基石。范式转变：重新定义AI-Ready 数据人工智能技术的演进对数据工作提出了更高要求，带动数据领域的范式转变。随着大模型技术应用的快速发展，人工智能的研发重点从“重点优化模型架构”转向“模型与数据协同优化”，数据行业共识也从此前追求“数据大即美”到强调数据的质量与精度。已有的研究和实践证明，海量但低质的原始数据非但无法提升模型智能，反而会成为导致模型产生“幻觉”与推理退化的毒药。当用于人工智能训练的数据被污染，可能会引发伦理道德、社会矛盾等方面风险，并影响个人认知和决策。因此，建设“AI-Ready” 数据，已成为决定智能系统能力上限的新质生产力基石，标志着从“数量燃料”到“质量基石”的产业演进。 AI-Ready（AI 可用）指经过专门整理、特征化和组织的数据，可用来以更小的工程成本直接用于训练、推理和决策。不同于传统的数据清洗，AI-Ready 数据要求数据具备语义的纯净度，消除如文档格式错乱导致的逻辑断层，确保信息流的连贯与准确；强调知识的高密度，提供教科书般严谨、低噪声、高信息含量的内容；同时，必须实现多维的对齐性，确保数据不仅在事实上正确，更在逻辑、指令遵循与价值观上与人类意图对齐。AI-Ready 本质上是对数据进行的“精炼”过程，对数据高准确性、时效性、权威性的要求使得数据规模让位于数据质量，精细化处理过后的高质量数据成为技术创新进步的关键支撑。由“数量”到“质量”的转变也与国家层面的战略导向高度契合。2023 年 12 月，国家数据局等 17 个部门联合发布《“数据要素 x”三年行动计划（2024 一 2026 年）》，强调打造高质量人工智能大模型训练数据集，以高质量语料库和基础科学数据支持开展通用人工智能大模型和垂直领域人工智能大模型训练。2024 年 6 月，工业和信息化部等 4 部门联合发布的《国家人工智能产业综合标准化体系建设指南（2024 版）》提出规范数据采集、数据标注、数据治理、数据质量等标准。2025 年政府工作报告更是提出，要持续推进“人工智能+”行动，将数字技术与制造优势、市场优势更好结合起来，加快完善数据基础制度，深化数据资源开发利用，促进和规范数据跨境流动。此类政策反映出，数据建设从“大水漫灌”进入“精准滴灌”的新阶段。另一方面，数据场景应用过程中，行业对高质量数据集的需求也从通用、粗颗粒度的网络采集数上海交大行研院报告，引用注明出处 28 据，转向深耕垂直行业的场景化数据集，医疗病历、工业传感器序列、法律判决逻辑链等具有深度专业壁垒的行业专识数据蕴含着新的发展机遇与挑战。新的趋势下，行业评价体系也系统性升级。如今数据价值的衡量标准，已从单一的存储容量（GB/TB），转向涵盖信噪比、知识覆盖率、时效性、合规性等维度的综合质量指标。中国首部针对数据资产价值评估的国家标准《信息技术大数据数据资产价值评估》（GB/T46353—2025）就构建了“质量－成本－应用”三维评价体系，不仅关注数据的内在价值，还考虑其在具体业务场景中的使用价值。构建与推广高质量、场景化的专用数据集，并通过标准化的评估体系确保其效能，正成为推动“人工智能+”落地、释放数据要素乘数效应的关键路径。技术前沿：AI Ready 的数据基础设施升级为高效生产 AI-Ready 数据，整个数据技术栈正经历体系化重构。数据处理方面，非结构化数据的识别解析不断突破。麻省理工学院斯隆商学院（MIT Sloan School of Management）一份研究指出，占比高达 80%至 90%的高价值知识蕴藏于 PDF、研报等“暗数据”（Dark Data）中。这些数据的存在要求更加智能化的数据治理方法，以有效降低海量非结构化数据的处理成本，提升数据质量。在此背景下，MinerU、PaddleOCR-VL、DeepSeek-OCR 等新一代智能文档解析产品基于视觉大模型的智能解析技术，超越传统 OCR（Optical Character Recognition）技术局限，在理解复杂文档布局，精准还原跨页表格、数学公式与代码结构方面表现出色，成为将人类知识转化为机器可理解信息的“咽喉要道”，为可靠的检索增强生成（RAG）系统奠定基石。数据生成方面，合成数据成为破解“数据荒”的战略高地。合成数据指利用统计分布、模拟仿真、深度学习、强化学习等方式合成的特定属性、极端条件、实时交互等数据，可以拓展数据供给范围，补足由于物理限制、伦理约束、安全保护等造成的特定数据缺口。合成数据的应用前景主要聚焦于两大方向：一是生成蕴含复杂思维链的逻辑推理数据，以提升模型的认知与推理能力；二是在自动驾驶、机器人等物理交互领域，通过高保真仿真模拟生成海量、多样的长尾场景数据，以弥补现实世界数据采集的不足与风险。同时，“数据飞轮”也提供了数据生产的新方式。行业共识认为，企业通过搭建自动化的“数据飞轮”，构建“AI 生产 AI 数据”的闭环，利用强模型标注数据、基于业务反馈自动修正数据集，可以大幅降低高质量数据供给的成本与门槛，显著提升数据生产效能。基础设施层面，向量数据库已成为 AI 应用的标准组件。向量数据库通过将数据转化为向量嵌入，充当大模型的“外挂海马体”，可以利用相似度检索技术在亿级数据中实现毫秒级精准匹配，为大模型提供高效的长时记忆与知识检索能力，从而改善传统关键词检索的“语义鸿沟”困境。同时，随着原生多模态大模型的普及，数据处理的前沿正聚焦于解决图文音视频的强对齐问题，实现跨模态信息在时空维度上的精准关联与理解，以释放多模态智能的全部潜力。目前，中国向量数据库行业蓬勃发展，不仅市场广阔，一些产品也发展迅速。2025 年 9 月，清华研发团队孵化的数智引航 VexDB 向量数据库发布后在国际权威的 DABSTEP 非结构化数据分析测试中夺冠，成为首个在该测试中取得第一的国产向量数上海交大行研院报告，引用注明出处 29 据库。DABSTEP 基准测试最新榜单中，前五名中有两名来自中国，体现中国向量数据库的发展潜力。图 DABSTEP 基准测试榜单（截至 2026 年 2 月）（来源：数据生态：开源创新与数据治理当前，AI 数据生态呈现出“开源与商业并重，流通与安全共存”的复杂格局。技术构成了骨架，而开放协同的生态则为其注入血肉，共同推动智能应用从中心化垄断走向普惠与多样化。开源协同正经历从“代码共享”到“数据共建”的范式扩展。中国信息通讯研究院研究指出，开源社区是目前高质量数据集的主要供给方。以 Hugging Face、OpenDataLab 为代表数据开源开放的平台，正推动高质量数据集像开源软件一样，由开发者社区共同完成清洗、标注与版本维护，为基础的人工智能模型任务提供数据支持。与此同时，MinerU 等聚焦于文档智能解析的开源工具链，显著降低了企业处理私有数据的门槛，促进了 AI 能力在更广泛产业场景中的落地。作为“中国方案”的 MinerU 等智能文档解析产品，已经走在世界前沿，多次登顶 GitHub Trending·Python 等权威榜单第一名，受到 OpenClaw 等全球开发者的欢迎。在数据要素流通层面，制度设计与技术进步结合互补。顶层设计中，中国“十五五”规划明确指出要 “深入推进数字中国建设，健全数据要素基础制度，建设开放共享安全的全国一体化数据市场，深化数据资源开发利用”，为数据流通提供清晰的政策引导。而在具体的技术端，数据流通利用技术发展日趋成熟，隐私计算与新型架构正成为打破“数据孤岛”的关键。联邦学习、可信执行环境、数据沙箱等技术基本满足各行业基本需求，金融、医疗等领域的敏感数据得以在“可用不可见”的前提下安全融合，释放价值。企业内部则基于数据研发运营一体化（DataOps）理念，将敏捷、精益等理念融入数据开发过程，通过对数据相关人员、工具和流程的重新组织，构建智能化的数据编织网络，打破协作壁垒，实现对跨云、跨系统数据资产的自动发现与集成，为 AI 应用提供统一的、可治理的数据服务入口。上海交大行研院报告，引用注明出处 30 面对 AI 生成内容的爆发，数据治理体系面临严峻挑战，正向合规与确权深化。业界正积极探索基于区块链的数据溯源技术，以清晰界定训练数据的版权边界，保障数据贡献者的权益。同时，为应对潜在的“数据投毒”攻击，行业正在建立自动化的安全扫描与防御机制，像查杀病毒一样识别并隔离有害数据，筑牢高质量数据供给的安全防线。本章小结展望 2026 年及未来，AI 数据领域面临的核心挑战正变得日益严峻。数据同质化与质量污染问题仍然存在，互联网中充斥的 AI 生成“注水内容”使得区分“人类原声”与“机器回声”愈发困难，模型若大量训练于此可能导致“模型崩溃”，损害其根本的推理能力。算力与数据的匹配瓶颈亦不容忽视，数据处理与传输的 I/O 速度正逐渐落后于 GPU 的计算增速，“存储墙”问题成为制约效率提升的突出矛盾，近期对存储技术发展的关注显著增长，预想今年会有一定突破。然而，挑战之中孕育着明确的结构性机遇。一方面，伴随人形机器人的发展，来自物理世界的触觉、本体感觉与深度视觉等具身智能数据将成为驱动下一代 AI 进化的全新“石油”。另一方面，沉淀于企业内部数十年的工单、手册、邮件等私有知识资产，一旦被有效清洗与结构化，将转化为构建具有核心竞争力的企业级垂直模型的宝贵养料。人工智能竞争的下半场，本质上是数据质量的较量。谁能更高效地获取、治理与利用高质量数据，谁就将掌握驱动 AI 持续进化的钥匙。对中国而言，依托庞大的实体产业场景与海量数据资源，通过系统构建领先的数据基础设施与繁荣的开源协同生态，在“数据要素×人工智能”的全球竞赛中，打造自身的战略优势。本章参考资料 [1]国家数据局.高质量数据集建设指引[R].北京：国家数据局，2025. [2]国家互联网信息办公室.“数据要素 x”三年行动计划(2024—2026 年)[EB/OL].（2024-01-05）[202 6-02-03]. [3]工业和信息化部.国家人工智能产业综合标准化体系建设指南(2024版)[EB/OL].(2024-06-05)[202 6-02-03]. . [4]新华网.2025年政府工作报告[EB/OL].(2025-03-12)[2026-02-03]. /118dc0c76109410c962cf76a3ec1ff3e/. [5]中国国家标准化管理委员会.信息技术大数据数据资产价值评估：GB/T 46353-2025[S].北京:中国标准出版社，2025. [6]MIT Sloan School of the power of unstructured data[EB/OL].(2021-0 上海交大行研院报告，引用注明出处 31 2-01)[2026-02-03]. a. [7]中国信息通信研究院.数据要素发展报告(2025 年)[R].北京：中国信息通信研究院，2025. [8]国务院公报.中共中央关于制定国民经济和社会发展第十五个五年规划的建议[N],2025. 上海交大行研院报告，引用注明出处 32 第 4章 AI 基础设施：“四力”筑基与智算生态重构随着生成式人工智能（Generative Artificial Intelligence，GenAI）从技术爆发期转向规模化落地期， AI 基础设施已成为决定国家竞争力与企业创新上限的核心底座。通过构建“算力、存力、运力、电力” 四力模型框架，本章系统梳理了 AI 基础设施的内涵与外延；深入探讨了智算服务从“物理设备”向“词元（Tokens）”计费模式的范式演进，以及 NeoCloud（算力原生云）等新型商业模式的崛起。通过对中美两国在算力、电力及产业链布局上的对比分析，本章指出尽管美国在核心芯片领域保持领先，但中国在电力保障、应用场景驱动及国产智算生态建设方面正逐渐形成独特优势。中国 2025 年电力消耗突破 10 万亿度大关，是有史以来世界上某个国家用电量首次突破这个界限，也标志着 AI 竞争进入下半场。在“东数西算”与“AI+”战略推动下，中国正通过全栈自主可控路径，实现从算力追随者向生态构建者的转变。 AI 基础设施的界定基础设施内涵：四力模型框架人工智能算力基础设施不再是传统数据中心的简单延伸，而是基于异构计算架构，以智能计算为核心，面向大规模模型训练与推理需求的公共基础设施。算力概念的内涵远比电力复杂，因此，不妨创造一个新单词，用 computility 来表示算力，其中的 compu-是计算的词根，表达“算”的含义，utility 则是效用，实用的意思，所以 computility 可用来表达计算的能力，即算力。为了更科学地衡量其供给能力，我们结合业界发展趋势，逐渐形成了“四力”模型的定义：图 “四力”模型（1）算力（Computility）：指基础设施提供的处理能力。目前已从通用 CPU 算力转向以 GPU、 NPU 为核心的异构智能算力。其核心指标已从传统的 FLOPS 转向“Tokens/s”及针对大模型优化的有效吞吐量。全球算力高速增长，算力成为全球科技竞争的战略制高点。（2）存力（Storage Capability）：AI 训练对数据读写速度有极高要求。现代 AI 存力强调高带宽上海交大行研院报告，引用注明出处 33 内存（HBM）与高性能闪存（NVMe）的结合。例如，NVIDIA 推出的 ICMS 架构通过 RDMA加速的上下文存储，将推理效率提升了 5 倍。（3）运力（Network Capability）：智算中心内部数万颗 GPU 之间的互联带宽及中心间的传输能力。AI 基础设施需要极低时延、高带宽的运力（如 InfiniBand 或 RoCE）来支撑分布式训练，确保模型在跨节点同步时不产生停顿。（4）电力（Electricity Power）：电力已成为 AI 发展的“第一瓶颈”。例如：微软为 OpenAI 训练 GPT 5 时，10 万卡集群导致美国一个州电力崩塌，导致 GPT5 发布的一拖再拖。AI 机架的功率密度已从传统云中心的2-10kW跃升至目前的140kW，NV Rubin芯片向600kW迈进，未来甚至可能达到1MW。电力的可用性、交付速度及绿色能源占比，直接决定了智算中心的扩张上限。基础设施外延：数据中心配套与安全（1）冷却系统：高密度算力带来了巨大的散热挑战。液冷技术（包括冷板式和浸没式）正迅速替代传统风冷。2025 年，全球液冷渗透率将增长至 26%，中国冷板式液冷市场规模达到 177 亿元。（2）机密计算与安全：随着多租户共享基础架构的普及，数据的机密性成为核心痛点。机密计算依托于硬件层面的可信执行环境（TEE），确保数据在活跃计算阶段（In-use）处于加密隔离状态，防止特权管理员或跨租户攻击窃取 AI 模型与敏感数据。总之，AI 发展趋势下，以四力为内涵的 AI 基础设施正在重构全球 IT 基础设施，同时制冷和安全带来严重的挑战，用得起是客户选择的关键点。 AI 基础设施发展趋势智算服务的升级：从“硬核”到“应用” 智算服务的交付模式正在经历从底层硬件向抽象化服务的演进：裸金属服务器（Bare Metal）：提供对物理硬件的直接访问，无虚拟化损耗，适合大规模预训练。裸金属比虚拟化 vGPU 在训练大型 Transformer 模型时性能可高出多达 30%。虚拟化 vGPU：通过切分 GPU 资源，满足中小规模推理和开发需求，具备更好的弹性与成本效益。 Tokens 计费：这是目前最前沿的演进方向。Tokens 已成为 AI 时代的“算力货币”。开发者不再购买显卡时间，而是购买模型处理的词元量。 2.商业模式的变化：NeoCloud与MaaS 智算集群：传统的资源出租模式。 NeoCloud（GPU Cloud）：这是一类新兴的 AI 原生云服务商（如 CoreWeave,Lambda）。它们没有传统云服务的历史包袱，专注于提供极大规模的 GPU 池化资源。由于运营极简且垂直化，其价格通常比传统超大规模云厂商低 60%-70%。 MaaS（模型即服务）：智算中心提供从硬件适配到算法调优的全栈能力。模型不再是独立的软件，上海交大行研院报告，引用注明出处 34 而是基础设施的一部分，通过 API 接口直接支撑应用场景。 AI 基础设施产业链概况 AI 基础设施进入“三位一体”升级阶段，超大规模集群化、绿色低碳化、高速互联化。算力规模正从“万卡级”向“十万卡级”演进，突破超节点技术，实现近线性算力扩展，以支撑千亿至万亿参数大模型的训练需求。 1.算力：硬件国产化加速 2024 年中国加速芯片市场规模超过 270 万张。尽管 GPU 占据 70%的市场份额，但本土 AI 芯片（如华为昇腾 910C 等）出货量已超过 82 万张，市场渗透率从 15%提升至 30%。2025 年加速芯片从 30%上升到近六成市场份额，华为独占 40%，国产算力产业链正经历上下游共振，逐步适配 DeepSeek 等主流大模型，加速自主可控进程。从海外投行 Bernstein Research 发布的《China AI accelerators market share》中，报告显示，2025 年华为以亿美金销售额，占据国内 AI 加速器市场份额的 40%，与英伟达的亿美金基本持平，断层领先于其他国产 GPU 厂商。 2.存力：HBM与闪存的协同 AI 基础设施正建立多层存储架构。底层使用对象存储确保耐用性，顶层则使用基于 BlueField-4 等 DPU 驱动的上下文存储（Context Memory），以支持海量 KV Cache 的快速调用。 3.运力：从数据中心内互联到国家算力网国内正通过“东数西算”工程打通算力调度动脉。中国算力平台已接入山西、辽宁、上海等 10 个省区市，实现了算力资源的跨域流通与弹性调度。 4.电力：AI 发展的“战略变量” 电力保障已从辅助设施转变为核心竞争力。领先的算力中心开始利用油田伴生气、风能等“闲置能源”进行离网发电。在中国，由于电价受到监管且清洁能源供应充足，相比美国，中国的电力保障具有显著成本优势。 AI 基础设施分布和对场景、产业的支撑 1.智算中心分布情况中国已初步形成“全局总览、分域协同”的布局。东部地区：广东、上海、江苏等地利用产业集聚优势，重点部署推理和高时延敏感业务。例如，广东 23 个智算中心主要集中在广州、深圳等 8 个地市。中西部地区：内蒙、宁夏、青海、山西等地利用能源与气候优势，承接大规模模型预训练任务。 2.支持场景与应用上海交大行研院报告，引用注明出处 35 具身智能：支持机器人在复杂物理环境中的实时感知与决策（如宇树科技、星动纪元等）。 AI for Science(AI4S）：AI 基础设施加速了药物研发、气象预测和新材料发现。例如，英矽智能结合 AI 与量子计算，将新药靶点发现效率提升了 17 倍。智能体工作流（Agentic Workflow）：AI 基础设施正从简单的对话交互转向支持能够自动规划任务并调用工具的“数字化员工”。 3.存在的问题与建议问题：区域性供需不匹配，部分西部数据中心上架率仍低于 50%；核心芯片受出口管制影响，先进制程受限；电力网架结构在高密度负荷下的韧性不足。建议：建议加强“产教融合”，利用开源生态（如飞桨）培养跨学科人才；同时，应推动算力资源的标准化定价（如 Token 单位化），引导社会资本从“盲目建中心”转向“深耕应用场景”。中美 AI 基础设施产业链比较表中美 AI 产业链结构对比维度美国 AI 基础设施产业链中国 AI 基础设施产业链算力驱动力私营资本驱动，2024 年私营 AI 投资达1091亿美元，是中国的12倍。政府规划与国企引导，通过“东数西算”实现国家统筹布局。硬件生态 NVIDIA,AMD,Intel 垄断高性能计算市场，技术领先 1-2 代。华为、中芯国际、象帝先等国产阵营快速崛起，渗透率达 30%。算力云 NeoCloud 蓬勃发展，CoreWeave 等获得巨额融资并签约微软、 OpenAI。传统云厂商（阿里、腾讯）叠加运营商（移动、电信）构成智算服务主体。中美“四力”及场景优劣势比较分析如下： 1.算力美国在先进制程芯片和系统级设计（NVLink 等）上具有显著领先地位。中国在模型推理效率优化上表现优异，例如深度求索（DeepSeek）的算力能效比远超美国同行。 2.电力中国具备巨大优势。美国电网老化，数据中心建设速度受限于电力容量审批（通常需 3 年）；中国具备更强的基建速度（“周末盖医院”式速度）且工业电价更具竞争力。 3.存力/运力上海交大行研院报告，引用注明出处 36 美国领先于高性能互联协议。中国则在全国一体化算力网调度方面具有制度优势，正通过国家算力分平台实现跨区域资源“一盘棋”。 4.数据/场景：中国拥有更丰富、更开放的工业与社会应用场景（AI+），中国在“数据作为战略资产”的集中度上优于美国。本章小结 AI 基础设施正经历从“资源消耗型”向“价值创造型”的转变。衡量成功的标准已从单纯的算力堆砌转变为“Tokens 每瓦每美元”（Tokens per Watt per Dollar）。未来十年，中国应利用电力保障与场景密度的优势，通过全栈国产智算链的协同（自主设计、自主制造、自主应用），在“战略相持”中寻找突破口，最终依托“AI+量子”等颠覆性技术实现全球科技竞争的“战略反攻”。本章参考资料 [1]国家能源局."2025年全社会用电量同比增长%"[EB/OL].(2025-01-17)[2026-02-10].https://www. :10443/20260121/715f79826488476a9162da7c8bd77c80/ [2]孙凝晖,张云泉,刘宇航.算力（Computility）[J].中国计算机学会通讯,2022,18(12):106. [3]华金证券行业研究部.电子行业周报：AI&半导体：液冷渗透率提升，FAB稳健成长[R/OL].华金证券,2025.(2025-08-10)[2026-02-10]. [4]刘烈宏.截至 6 月底日均Token消耗量突破 30 万亿，1 年半时间增长 300 多倍[EB/OL].(2025-08-1 4)[2026-02-10]. [5]中国信息通信研究院.人工智能算力基础设施赋能研究报告（2025 年）[R/OL].北京:中国信息通信研究院,2025.(2025-11-06)[2026-02-10]. [6]伯恩斯坦.China AI Accelerators Market Share[R].伯恩斯坦. [7]资产信息网，千际投行.东数西算项目实施意义与产业链分析报告[R] [8] for an Energy-Constrained Future:Four Forces Reshaping Data Center I nfrastructure[EB/OL].[2026-03-26]. rained-future-four-forces-reshaping-data-center-infrastructure/ [9]Snider Predictions:AI Sparks Data Center Power Revolution[EB/OL].Data Center Know ledge.[2026-01-13]. ctions-ai-sparks-data-center-power-revolution [10]Zilberstein NVIDIA BlueField-4-Powered Inference Context Memory Storage 上海交大行研院报告，引用注明出处 37 Platform for the Next Frontier of AI[EB/OL].NVIDIA Developer Blog.(2026-01-06)[2026-02-13].http s:// orage-platform-for-the-next-frontier-of-ai/ [11]-Metal vs Virtual GPU:Which Is Better for AI Workloads[EB/OL] [12]Data Centre vs China:Nvidia's Jensen Huang on Data Centre Blockers[EB/OL]. (2025-12-08)[2026-01-13]. on-data-centre-blockers [13]Maslej Intelligence Index Report 2025[R/OL].Stanford:Stanford University Human -Centered Artificial Intelligence,2025.(2025-04-07)[2026-01-13]. 5-ai-index-report [14]ABI the Neocloud Market Landscape:Definitions,Technology Characteristi cs&Business Models[R].New York:ABI Research,2025. [15] Infrastructure:Specialized GPU Cloud Providers Analysis[EB/OL] 上海交大行研院报告，引用注明出处 38 第 5章 AI 芯片：算力溢出效应下的半导体价值重构从全球信息技术产业的历史格局审视，半导体长期扮演着“从属型基建行业”的角色——它为互联网平台、企业软件及云服务提供底层计算基座，但产业利润的核心增量过往多被上层的平台经济与 SaaS 企业俘获。 FactSet 及 S&P Dow Jones Indices 的历史统计数据显示，在 2010 年至 2022 年的十余年间，标普 500 半导体板块的每股收益（EPS）在 IT 行业总额中的占比常年波动于 15%左右，显著低于软件与服务板块。直至 2023 年 AI 产业周期开启，这一结构性特征才发生剧变：半导体板块的 EPS 贡献率首次逼近并于 2024 年突破了 20%的历史常态区间。究其原因，生成式 AI 对高端 GPU 的极端需求，驱动了以英伟达（NVIDIA）和博通（Broadcom）为核心的头部企业盈利爆发式增长；仅 2024 年第四季度，半导体板块便贡献了 IT 行业近 34%的盈利增长点，正式打破了其在行业内部利润分配中“长期低于 20%” 的历史规律。 AI 时代正在从根本上颠覆传统的产业分工格局，其本质是 Scaling Law 对半导体物理实现与产业权力结构的强制重构。统计数据显示，仅在 2022 至 2024 的两年内，标普 500 半导体板块的 EPS（每股收益）在 IT 行业中的占比便从不足 20%飙升至约 40%，且仍维持加速上升态势。这一结构性变迁揭示了一个深刻的范式转向：当算力（本质上是半导体的物理折旧）跃升为 AI 产业的核心生产要素时，半导体板块正迅速从 “基建的从属者”蜕变为“算力的收租者”。与互联网时代由 CPU 驱动的通用计算堆叠模式截然不同，大语言模型（LLM）的技术演进迫使半导体架构向应用端高度收敛。这不仅是一场“从算力丰裕向全链路瓶颈突破”的范式跃迁，更是一次对半导体在计算、存储、通信互联上功能定义的全面解构。从晶体管逻辑、高带宽内存（HBM）到高速互联织网（Fabric），每一个将“电流”转化为“Token”的物理环节都在被重新定价。这种重构效应呈现出动态演进的特征，2025 年后的典型例证包括：针对推理效能的底层解构：为应对“推理法则”（Inference Law）中计算强度与访存带宽的极度失衡，芯片厂商通过 TensorRT-LLM等软件栈深度介入底层的指令调度。通过实现 Prefill（预填充）与 Decode （解码）的分离执行架构（Disaggregated Inference），芯片能够在物理层面针对不同阶段的计算特性（计算密集型 vs.访存密集型）进行动态资源对齐，极大地提升了 Token 的生成吞吐率。针对复杂逻辑的范式回归：Agentic 模式的兴起标志着计算范式从“单向生成”转向“循环推理”。在这一工作流中，CPU 摆脱了长期的边缘化地位，重新回归为系统的智能调度中枢。Agent 模式下频繁的逻辑分支、外部工具调用及多步序列规划，对 CPU 的分支预测能力提出了苛刻要求。为消除 CPU 逻辑处理与 GPU 张量计算间的通信瓶颈，以 NVIDIA Grace Hopper 为代表的架构通过实现内存统一寻址与高速 C2C 互联，确保了“电变 Token”的过程在复杂的长任务链条中依然能保持高效协同。上海交大行研院报告，引用注明出处 39 针对存算瓶颈的物理跨越：为突破制约 Scaling Law 的“内存墙”，存储板块已从后台的“数据仓库” 跃升为“算力的肌肉延伸”。以 HBM3e 为代表的高带宽内存通过 3D 堆叠封装与计算核心实现近延时耦合，这种从通用 DRAM 向特化型算力内存的转型，使得存储环节在芯片总成本中的权重显著抬升。针对集群尺度的织网重构：当单一芯片无法承载模型规模时，互联（Interconnect）便从单纯的通信附件演变为“机架级计算机”的神经系统。通过 NVLink 以及针对 AI 优化的 RDMA 网络协议，计算力在数以万计的集群节点间实现了逻辑统一，驱动着交换芯片及高性能背板互联技术的全面价值重估。这种由应用层算法逻辑倒逼硬件物理设计的“持续自我重构”，正产生一种强大的“算力溢出效应” （Spillover Effect）。它将芯片产业从传统意义上线性、离散的供应链，彻底改造为一张深度耦合、持续演进的价值网络。在这张网络中，软硬件的物理边界已然模糊，技术主导权正无可争议地向那些能够实现“算法－架构－系统”全栈协同的领航者集聚。这种从“零部件供应”向“产业逻辑定义”的权力跃迁，不仅是对半导体产业利润分配格局的底层重塑，更是 AI 时代算力霸权向物理层回归的终极注脚。算力芯片：不仅是计算引擎，而是数据中心的“大脑总管” 在 AI Scaling Law（规模法则）的驱动下，算力芯片的竞争已经从“比拼谁的单颗芯片跑得快”演变为“比拼谁能管理好上万颗芯片的集群”。这种设计哲学的转变体现在：芯片不再是一个孤立的零部件，它必须自带强大的通信和内存管理能力，才能在“集群级系统工程”中发挥作用。例如，英伟达的 GB200 已经不再以“单张显卡”的形式售卖，而是以包含 72 颗 GPU 的整个机架（Rack）作为基本计算单元。这意味着，单体性能的提升如果不能服务于集群的整体吞吐，就失去了商业意义。计算 GPU/CPU：逻辑调度与张量执行的协同进化现状：从单体卡到机架式计算机市场主导与迭代节奏：英伟达在全球 AI 加速芯片市场占据约 92%的份额。其产品迭代已进入“一年一更”的超常节奏，这不仅决定了全球 AI 算力总量的供给速度，更定义了行业的技术步频。 Blackwell 架构的里程碑意义：当前旗舰Blackwell 系列（B200/GB200）在 FP8精度下可达20 PFLOPS，较前代 Hopper 架构实现了约 4 倍的性能跃迁。这种提升并非单纯依赖晶体管堆叠，而是通过集成的第二代 Transformer 引擎动态调整精度，直接回应了大模型对极大规模参数吞吐的需求。英伟达的 Blackwell(GB200)架构标志着 GPU 已彻底演变为系统级产品。它通过 NVLink-C2C 技术将 CPU 与 GPU 物理耦合，使得数据交换不再受限于传统的接口瓶颈，从而支撑起万亿级参数的实时推理能力。路线图预判（2026）：根据已披露的 Rubin 架构路线图，算力芯片将率先采用台积电 2nm 工艺并集成下一代HBM4内存。在互联层面，NVLink的单向带宽预计从900 GB/s翻倍提升，通过NVLink Switch 实现多达 576 张 GPU 的直接逻辑互联，标志着“机架即计算机”时代的全面到来。上海交大行研院报告，引用注明出处 40 2. 2025-2026 年 GPU技术架构的演进前沿 PD 分离（Prefill/Decode 分离）：2025 年的算力集群普遍采用了解构式推理（Disaggregated Inference），由于 Prefill 阶段为计算密集型（Compute-bound），而 Decode 阶段为访存密集型（Memory-bound），传统架构的资源共享会导致极大的利用率（MFU）损失。PD 分离允许在集群维度上将不同性能特征的芯片分别处理这两个阶段，利用 TensorRT-LLM 等软件栈，系统将计算密集型的预填充任务与访存密集型的解码任务分配给不同特性的芯片，将整体算力效能（MFU）提升了 30%以上。这正是“硬件架构服务于算法逻辑”的典型证据。 DiT（Diffusion Transformer）驱动的底层重构：随着 2025 年 Hot Chips 大会及相关前沿进展，图形渲染正从传统的“物理模拟”转向“AI 推理生成”。DiT 架构的成功倒逼 GPU 必须打破“图形渲染”与“AI 推理”之间的物理藩篱，转向更纯粹的 AI 原生架构（AI-Native Architecture）。逻辑缩放的终结与“小芯片”方案（Chiplet&CoWoS-L）：单体芯片的面积已逼近光刻掩模极限（Reticle Limit）。未来的算力增长将极度依赖 Chiplet 封装技术。未来的竞争不再是如何设计出最强的单颗芯片，而是如何通过封装将更多的计算单元、HBM 和互联接口集成在一个中介层上。晶圆级计算（Wafer-Scale Engine）的边缘化与启发：像 Cerebras 这样的晶圆级算力芯片虽然在特定场景下效率极高，但其商业化受限于成本。然而，它所代表的“内存与计算在同一物理平面上极度接近”的思想，正在深刻影响英伟达和自研 ASIC 链的设计，这也佐证了“存算一体/近存计算”的重要性。解决“推理难题”的新物种–Groq 的确定性推理：针对 Inference Law，Groq 的 LPU 通过取消动态调度，实现了对数据流的微秒级精确控制。这种创新证明了，为了追求极致的推理速度，芯片可以舍弃通用的并行能力，转向纯粹的逻辑流控制。模式下的计算重构与 CPU的价值回归在传统的深度学习推理中，CPU 仅充当简单的流量管控角色。但在 Agentic 模式下，CPU 重新接管了逻辑指挥权。为了应对复杂的 API 调用和逻辑分支，NVIDIA Grace Hopper 架构实现了 CPU 与 GPU 的内存统一寻址，让“思考（逻辑）”与“执行（计算）”能够在同一个内存空间内无缝流转，彻底解决了 Agent 长任务链条下的延迟问题。计算范式从“单向生成”转向“循环推理”，这驱动了 CPU 职能的战略性回归。逻辑调度中枢：Agent 模式涉及大量的“推理－行动－观察”循环（Reasoning-Action Loop），其中非张量计算（如调用 API、逻辑判断、分支预测）在 CPU 上的运行效率远高于 GPU。异构解耦与内存池化：为了降低响应延迟，以 NVIDIA Grace Hopper 为代表的架构通过超高带宽的芯片间互联（C2C）实现了 CPU 与 GPU 的内存统一寻址。这使得 CPU 不再是计算的旁观者，而是直接参与到复杂长任务流（Long-task Workflow）的实时调度中。算力市场的格局与链条博弈上海交大行研院报告，引用注明出处 41 2025 年的算力芯片市场已演变为“一超多强”的格斗场。英伟达凭借 Blackwell 架构稳坐“集群计算” 的王座，但以 Groq 为代表的 LPU 阵营通过极速推理切中了 Agent 时代的痛点；而以 Cerebras 为代表的晶圆级计算则在科研与超算领域开辟了无人区。与此同时，地缘政治与成本压力促成了“自研ASIC”与“本土替代”的双重爆发。阿里自研的PTU(Parallel Processing Unit)展现了云服务商通过算法深度定义硬件的能力，而中国本土厂商如摩尔线程，沐曦与华为昇腾，则通过“CUDA 兼容生态”与“系统级集群能力”，在英伟达的高墙之外，构建了一套自主可控的第二算力极。创业公司的“奇兵”与中国本土的“突围者”正在通过差异化竞争，在数据中心中抢夺特定的领地。表 2025 年全球 GPU/算力芯片主流部署列表阵营分类厂商与主要型号 2025 年部署/商业现状核心技术/竞争壁垒 “通用型 GPU”市场主导者英伟达 Blackwell (B200/GB200) 全球主流 CSP 的旗舰配置，机架级交付，用于万亿参数 LLM 训练与实时视频生成软硬一体生态， NVLink 72 GPU 集群互联，万亿参数实时推理自研 ASIC 巨头 Google TPU v7(Ironwood) 支持 Gemini 系列模型及 Vertex AI 平台， Anthropic 等大厂主力部署原生 FP8 支持，万亿参数模型推理，192GB HBM 大容量内存，光学互联(OCS)与全栈软件链优化自研 ASIC 巨头 Alibaba T-Head PPU(PTU) 阿里云PAI 平台大规模替代部分 H20 订单互联带宽 700GB/s，针对通义千问模型定制，实现推理成本下行创业公司 (2025 年 12 月被英伟达收购） Groq LPU(v2) 部署于 GroqCloud，主打极速实时对话、语音助手、高频交易 AI 确定性流水线调度， SRAM 近存计算创业公司 Cerebras WSE-3(CS-3) Condor Galaxy 超算集群，主打生物制药模拟、万亿参数超快推理晶圆级计算，4 万亿晶体管，彻底消除芯片间延迟中国本土华为 Ascend 910C（昇腾）国内智算中心主力，被百度、字节、阿里作为 Nvidia H100 的首选替代件自研昇腾生态 (CANN），算力接近 H100 的 70%-80%，万卡集群 SuperPod 架构中国本土寒武纪思元 590/690 国内运营商、金融、互联网规模化部署 Chiplet架构，思元690 性能直追 H100 80% 上海交大行研院报告，引用注明出处 42 中国本土摩尔线程 MTT S4000 （夸娥）国产 GPU 算力集群，国产兼容算力代表 MUSA 架构，高度兼容 CUDA，支持国产大模型生态中国本土沐曦（曦云 C600）/ 壁仞(BR100/105) 进入商业化批量交付，适配国产智算中心训推一体，支持大规模通用AI 训练和推理以下对创业公司、云服务厂商与中国厂商的“生存之道”进行深度分析： 1）创业公司的“非对称作战”：Groq 与 Cerebras 这些公司不再试图在所有领域超越英伟达，而是攻击英伟达的弱点—延迟（Latency）与通信（Communication）。 Groq(LPU）：在 2025 年的崛起是因为它深刻抓住了 Agentic 模式的需求。Agent 需要极速响应，而 GPU 的 HBM 存取和动态调度会产生波动。Groq 采用纯 SRAM方案，实现了真正的“确定性推理”，成为极速推理细分市场的冠军。 Cerebras（晶圆级）：它的逻辑是“如果互联是瓶颈，那就把整张晶圆做成一颗芯片”。2025 年， Cerebras 的 CS-3 系统在万亿参数模型推理上比 Blackwell 还要快 5 倍以上，这让它在国家级超算中心和尖端科研机构（如阿斯利康制药）中站稳了脚跟。 2）云服务商的“下半场”：从算力租用者到定制化“芯片主权”的博弈在 AI 算力的下半场竞赛中，超大规模云服务商（Hyperscalers）不再仅仅满足于向英伟达支付巨额的“算力租金”，而是通过自研 ASIC（专用集成电路）发起了一场旨在夺回定价权与技术主导权的防御战。 a.硬件反抗：GPU定价权与 ASIC 的成本替代英伟达的高毛利（约 80%）是对计算资源的高溢价销售，云服务商为打破这一垄断，通过自研芯片达到相比购买英伟达 GPU 更高的资本效率：成本降维打击：以 Google TPU v7(Ironwood)为例，对于内部使用的模型训练，其 TCO（总拥有成本）仅约为英伟达 GB300 的 55%。规模化替代：2026 年，Google 预计将量产部署超过 310 万至 320 万颗 TPU 芯片，通过大规模自用与外部租赁，显著稀释对英伟达单体硬件的依赖。 b.“生态绑定”下的算力自主可控：Google TPU的标杆效应 Google TPU 的演进展示了如何通过软件（XLA 编译器）与硬件（OCS 光学互联）的深度耦合，构建起不同于 CUDA 的独立生态：针对推理时代的重构：TPU v7 专为“推理时代”设计，其单片 FP8 算力达 PFLOPS，与英伟达 B200 旗鼓相当，但在大规模集群扩展上表现出更强的系统级优势。上海交大行研院报告，引用注明出处 43 跨公司的算力联盟：2026年，顶级AI实验室Anthropic计划部署上百万颗TPU v7，旨在通过Google 的算力集群将 Claude 模型的训练与推理成本压低至极致。甚至 Meta 也被爆出可能在 2026-2027 年间租用甚至直接部署 Google 的 TPU，标志着顶级厂商正集体寻求“去英伟达化”的替代方案。 c.云端 ASIC 的全面爆发：AWS与阿里的中国路径 AWS 的性价比攻势：Amazon 的 Trainium 3 芯片通过原生 PyTorch 集成，使开发者无需修改代码即可迁移，宣称在提供相同推理性能时，比同代 GPU 的性价比提升了 50%。阿里 PTU 的本土生态：在国内受限的制程环境下，阿里巴巴孵化的 PTU(Parallel Processing Unit) 展现了极强的生存智慧。它针对通义千问(Qwen)等大模型进行了算子级优化，片间带宽达 700GB/s。 2025-2026 年间，PTU 在阿里云 PAI 平台的大规模应用，不仅确保了国产模型的推理性能，更有效对冲了由于 GPU 禁运带来的系统性风险。 3）中国“自主算力链”的生存之道：从“单兵突围”到“集群化进化” 在 2025 年地缘政治博弈与 AI 范式转移的双重背景下，国产算力厂商已不再满足于零散的国产替代，而是形成了以“全栈生态（华为）”、“性能与成本拐点（寒武纪）”，以及“资本化加速的四小龙（摩尔线程、沐曦、壁仞、天数智芯）”为特点的三个生存模式。 a.华为昇腾：以“系统级工程”对垒单点性能当单颗芯片在先进制程受限时，华为通过 SuperPod 集群架构来实现“以量取胜”的突破。生存策略：核心在于 CANN 软件生态对标英伟达 CUDA，通过软硬一体化大幅降低模型迁移门槛。 2025 现状：昇腾已成为国内唯一能与英伟达 GB200 集群对抗的系统级厂商。在华为云数据中心， AI 算力占比已超 80%，其 SuperPod 架构能驱动上万颗芯片高效互联，是国内智算中心的生态基座。 b.寒武纪：从“亏损王”到“股王”的盈利质变 2025 年是寒武纪的“价值迸发时刻”，它证明了纯粹的 AI 原生架构（NPU）在推理时代的效率优势。生存策略：利用 Chiplet（小芯片）架构规避先进制程限制，并深化与互联网大厂（如字节跳动）的深度定制合作。 2025 现状：凭借思元 590/690 成功切入 DeepSeek 等主流模型供应链。2025 年上半年营收暴增 43 倍达亿元，并实现净利润扭亏为盈。其原生支持 FP8 计算的特性，使其在推理市场的溢价能力大幅提升，市值一度突破 6000 亿位居行业之首。 c.国产 GPU“四小龙”：资本驱动下的差异化突围 2025 年末至 2026 年初，国产 GPU 迎来史上最强“上市潮”。这四家公司通过不同的生存路径，在英伟达的高墙外构建了自己的利基市场。表国产 GPU“四小龙”的对比厂商生存路径与 2025 核心表现资本/商业化节点上海交大行研院报告，引用注明出处 44 摩尔线程生态为王：走“全功能 GPU”路线。其 MUSA 架构对 CUDA 的兼容性极高，大幅降低了开发者从英伟达迁移的成本登陆科创板。5 日涨幅超 7 倍，市值突破 4400 亿元沐曦股份商业化速度最快：专注于训推一体芯片。凭借高效的商业落地，在互联网与金融行业快速渗透 A 股上市。刷新 A 股打新纪录，率先在实现单季盈利壁仞科技国家队背书与算力枢纽：凭借 BR100 的高性能算力密度，成为多地智算中心（尤其是国资背景）的首选替代港股上市。首日大涨 82%，在大规模集群部署上展现了深厚根基天数智芯先发优势与产品全线：拥有国内最早量产交付的通用 GPU。随着客户集中度下降，其生态广度在逐步扩大港交所上市。标志着其从初创期正式迈向成熟商业化阶段 2025 年后的国产算力突围路径呈现出“组局”的特征：核心是构建跨厂商、跨技术的开放协同生态。从训练转向推理：随着 DeepSeek 等高效模型的兴起，算力需求从高能耗训练转向高周转推理。国产芯片（如寒武纪、沐曦）因能效比和特定算子优化，在推理侧展现出比英伟达 H20 更高的性价比。软硬协同填补硬件短板：通过算法创新（如 FP8 数据精度优化、稀疏化、底层编译优化），以及 Chiplet 架构，不仅是应对先进制程限制的工程突围、弥补先进制程的物理差距，更是国产算力芯片从“可用”向“好用”迈进的标志性转折，这已成为国产厂商在受限环境下的生存手段。总结：从单体计算性能向系统吞吐能力的范式漂移算力芯片的演进规律表明：AI 时代的产业话语权已不再取决于单体晶体管的物理微缩，而取决于对计算、存储与互联（Compute-Memory-Fabric）三者协同效率的定义能力。英伟达的系统化霸权：通过 Rubin 架构实现计算单元与 HBM4 的深度封装，英伟达成功将竞争维度从“单卡算力”提升至“机架级系统带宽”，迫使全球供应商必须进入其定义的物理迭代周期。云服务商的结构性反击：Google TPU v7 等自研 ASIC 的大规模应用，证明了通过定制化架构（如专门针对长序列推理的显存调度优化），云服务商能够有效对冲通用 GPU 的溢价，构建起独立的成本与能效护城河。这种设计哲学的位移，标志着算力竞争的核心指标已从单纯的 FLOPS（每秒浮点运算数）转向了 Token/s（每秒 Token 生成速率）。在这一转变中，计算核心的性能冗余与落后的数据传输速率之间形成了显著的“存算鸿沟”。当算力芯片的执行频率远超存储介质的读写速率时，存储系统便不再是计算的从属配套，而是成为决定整个计算集群利用率（MFU）的决定性约束变量。存储系统如何通过物理架构的重构（如 HBM 的 3D 堆叠）来缓解“内存墙”效应，并由此触发半导体价值链的二次分配，将是下一节论述的核心。上海交大行研院报告，引用注明出处 45 存储芯片：算力溢出效应的第一站在 AI 算力体系中，存储芯片已从传统的“数据仓库”角色跃升为算力效能的决定性约束变量。AI 加速卡的有效算力不仅取决于计算核心的理论峰值，更受限于内存带宽（Memory Bandwidth）。当计算核心以每代 4 倍的速度提升时，DRAM 密度的增长在过去十年仅有约 2 倍，这种极度的失衡使存储环节成为算力价值溢出效应冲击的第一站。 HBM：算力效能的“配给证”与定价权转移 1.“内存墙”下的物理跨越为了突破制约 Scaling Law 的“内存墙”，高带宽内存（HBM）应运而生。通过 3D 堆叠技术将多层 DRAM晶粒垂直集成，并利用硅中介层（Silicon Interposer）实现与 GPU 的超宽带互联。 HBM3e/HBM4 的技术指标：当前主流的 HBM3e 已能提供超过 TB/s 的带宽，是传统 DDR5 的 10 倍以上。而即将量产的 HBM4 将进一步通过 2048-bit 超宽接口，将单叠层带宽推向 TB/s 的量级。从通用向特化转型：这种从标准通用 DRAM向特化型算力内存的转型，使得存储环节在芯片总成本中的权重显著抬升。 2.寡头格局与溢价逻辑存储市场正经历“四十年一遇”的超级周期。由于 HBM 制造高度集中于海力士（SK Hynix）、三星和美光三家巨头，这种极高的行业壁垒赋予了供应商极强的定价权。确定性涨价：海力士与三星已计划在 2026 年对 HBM3e 提价约 20%。供需错配的结构性重估：预计到 2026 年，全球 HBM 市场规模将达 546 亿美元，部分分析认为 2028 年 HBM 单品类市场规模将超越 2024 年整个 DRAM 市场。这种价格上涨并非周期性波动，而是由于 DRAM单元结构深宽比已趋近物理极限（100:1）导致的成本重估。 NAND/SSD：推理时代 KV Cache 的意外受益者如果说 HBM 是 GPU 算力溢出的直接受益者，那么 NAND 闪存则是推理侧需求爆发下的关键支柱。 KV 缓存（KV Cache）的压力测试：在大模型推理过程中，随着上下文窗口从 4K 扩展到 128K 甚至更长，单次推理任务产生的中间计算状态（KV 缓存）可达数百 GB。高速存储的增量需求：为了维持推理低延迟，NAND SSD 必须提供极高的 IOPS 和带宽来支持频繁的检查点（Checkpoint）写入与读取。消费级市场的挤压效应：2025 年以来，数据中心对 HBM/DRAM/NAND 的暴增需求占据了全球绝大部分存储供给，导致消费电子市场被迫面临涨价或减配——例如部分 PC 产品的内存配置被迫回调，而苹果等厂商则通过长约锁价来维持成本优势。存储多元化：CXL池化与边缘AI 的物理前提随着 AI 范式从云端训练向全场景推理延伸，存储需求已不再局限于单一的带宽提升，而是呈现出上海交大行研院报告，引用注明出处 46 显著的差异化特征。存储环节不仅在云端扮演“算力肌肉的延伸”，在边缘侧更成为决定设备智能上限的物理基石。 1.集群层面的“存算解耦”与 CXL 内存池化针对超大规模集群中普遍存在的内存碎片化问题，CXL(Compute Express Link)协议正在实现内存的池化与共享。其核心意义在于通过物理层面的“存算解耦”，允许算力节点按需动态调用远端内存资源，从而进一步优化万卡集群的资源利用率（MFU）。 2.边缘侧的能效挑战与端侧AI 的爆发在智能驾驶、具身智能机器人及 AI 手机等场景中，对低功耗、高可靠性、小尺寸嵌入式存储的需求正迎来指数级增长。具身智能的突破：以宇树科技(Unitree)为代表的四足机器人已占据全球约 70%的市场份额，其硬件生态对嵌入式存储和低功耗计算芯片的极度依赖，是算力溢出效应从数据中心向终端延伸的典型表现。移动端的物理前提：在移动端，低功耗内存(LPDDR5X)的带宽提升已成为手机端侧运行大模型的物理先决条件。中国存储势力的崛起与产业结构重塑在全球存储市场被三星、SK 海力士及美光长期锁定的背景下，以长江存储（YMTC）和长鑫存储（CXMT）为代表的中国厂商，正在通过技术路径创新和本土供应链协同实现深层次破局。 1.核心厂商布局与技术高地 a.长鑫存储(CXMT）：DRAM 领域的国产基石技术突破：作为中国首家量产 LPDDR5 的厂商，长鑫存储在 2025 年已实现对主流 AI 边缘终端（如手机、PC）的规模化供货。其自研的 18nm 及以下工艺，为国产 AI 算力链提供了底层存储的安全备份。 b.长江存储(YMTC）：NAND 架构的颠覆者架构优势：凭借其独创的 Xtacking 架构，长江存储在 3D NAND 层数堆叠与 I/O 速度上已步入全球第一梯队，有效支撑了数据中心对超大容量、高性能 SSD 的迫切需求。 c.产业链长尾厂商：以兆易创新（Gigadevice）为代表的厂商，在 NOR Flash 及特定利基存储市场占据重要份额，补齐了 AIoT 领域的存储拼图。 2.对全球产业结构的深远影响打破“价格托拉斯”，驱动成本民主化：中国厂商的产能释放改变了传统存储巨头通过减产人为调控价格的旧律。这种竞争压力迫使全球存储芯片进入更具性价比的区间，加速了 AI 推理成本的下行。加速从单品竞争向“生态协同”演进：中国存储厂商不再孤立存在，而是与华为昇腾、寒武纪等算力厂商深度绑定。这种“国产算力+国产存储”的垂直整合模式，在物理层面上实现了更优的互联互通，确保了在受限环境下依然能通过系统级优化（如针对国产算子的存储预取技术）维持竞争力。上海交大行研院报告，引用注明出处 47 催化全球供应链的“多极化”重组：随着中国厂商在 3D NAND 和 LPDDR5 等前沿领域的份额提升，全球半导体供应链被迫从“美日韩”三角阵营向“多极并存”转化，显著提升了全球 AI 基础设施的供应韧性。互联芯片：算力溢出效应的第二站当存储系统通过物理架构重构缓解了“内存墙”效应后，系统内部各节点间的通信效率便上升为核心瓶颈。AI 系统的互联需求按物理距离可划分为四个严密的层级，每个层级对应着不同的技术路线与芯片生态。表四个互联层级的对比互联层级距离范围主流技术产业逻辑与关键厂商片上互联（On-Chip） <1cm Die-to-Die(UCIe）、 HBM互联解决SoC内部算力与存储的近延时耦合，主要由台积电（CoWoS）等封装巨头主导板间互联 (Board) 1cm—2m NVLink、PCIe 、C2C 互联负责GPU显存统一寻址与CPU-GPU协同，Nvidia Grace Hopper通过C2C实现内存统一寻址，主要由英伟达、AMD、博通主导机架互联 (Rack) 2m—100m CPO（共封装光学）、硅光技术、DAC/AOC 突破铜缆物理极限（2m以上信号衰减），实现机架内与机架间的算力池化，主要厂商：博通、中际旭创、新易盛跨集群互联 (Cluster) >100m InfiniBand、RDMA、以太网+高性能光模块构建万卡级智算中心的骨干网，驱动交换芯片与光模块价值重估，主要厂商：英伟达、Arista、华为互联层级的深度重构：从铜到光的物理飞跃 1.片上与板间互联：存算解构的物理底座在单一芯片无法承载模型规模时，板间互联通过高速总线将多颗 GPU 逻辑统一。以 NVIDIA 的 NVLink 为代表，其第五代带宽已达 TB/s，通过实现多达 576 张 GPU 的直接互联，消除了传统 PCIe 协议的调度延迟。同时，针对 Agentic 模式下的逻辑分支需求，C2C（Chip-to-Chip）技术让 CPU 与 GPU 共享统一内存地址空间，确保了复杂长任务链的高效协同。 2.机架互联：CPO与硅光技术的临界点当互联距离超过 2 米，传统的铜互联面临严峻的信号完整性和功耗挑战。这促使互联技术从“电” 上海交大行研院报告，引用注明出处 48 向“光”发生历史性跨越。硅光技术（Silicon Photonics）：利用 CMOS 工艺在硅基芯片上集成光收发功能，提升集成度并降低单位比特成本。 CPO（Co-Packaged Optics，共封装光学）：将光引擎（Optical Engine）与电交换芯片共同封装在同一基板上。通过消除可插拔光模块在 PCB 上的长距离走线，大幅降低了功耗（预计降低 30%以上）并解决了 SerDes 速率超过 224 Gbps 后的信号畸变问题。 3.跨集群互联：万卡时代的网织重构在跨集群维度，互联协议的效率直接决定了集群的 MFU（模型算力利用率）。RDMA（远程直接内存访问）技术绕过 CPU 内核栈，在万计节点间实现了逻辑统一。这种“网织重构”驱动了 800G 甚至高性能光模块的爆发式需求，成为算力溢出效应在硬件链条上的第二站。共封装光学(CPO）：互联领域最具变革潜力的技术方向 CPO 不仅是互联速率的升级，更是对数据中心拓扑结构的重塑。其核心思路是将光引擎（Optical Engine）与电芯片共同封装在同一基板上，消除了传统可插拔光模块在功耗、延迟和信号损失方面的限制。 CPO 的技术路线图显示了清晰的演进脉络：从“分体”向“集成”回归：传统的 LPO（线性驱动可插拔光学）作为过渡方案，虽降低了延迟，但仍受限于 SerDes 的缩放极限。CPO 通过 Wide I/O绕过复杂的 SerDes 调度，实现了光电转换在物理层面的“极致邻近”。技术路径的博弈：当前业界呈现出三种主流调制技术竞争——马赫-曾德尔调制器（MZM）在成熟度上领先；微环调制器（MRM）以紧凑尺寸见长；而电吸收调制器（EAM）则提供了另一种架构选择。台积电推出的 COUPE 方案正成为光电芯粒集成的首选平台。核心驱动力：当计算单元的执行速度不再是瓶颈，真正的“战争”便转移到了负责搬运数据的 Fabric 网络上。CPO 的落地标志着互联环节已从算力的“辅助配件”跃升为决定算力系统整体稳定性与经济性的核心变量。英伟达已确认将在下一代产品中采用 CPO技术，其“杀手级应用”在 Scale-up 网络中尤为突出： CPO 有望将 GPU 直连规模从当前 576 卡的上限大幅扩展，从根本上改变大规模训练集群的设计范式。 GPU 集群的扩张正在从量变走向质变。当训练集群从数百卡扩展到数万卡、当推理请求从串行处理进入大规模并发时，互联网络的带宽和延迟不再是“锦上添花”的优化项，而是决定集群实际效率的硬约束。铜线互联在距离超过 2 米后面临信号衰减瓶颈——在一个拥有数万 GPU 的集群中，铜缆的物理极限已经成为不可逾越的障碍。这正是算力溢出效应在互联层面的核心表现：GPU 越强、集群越大，对互联的要求就越高，互联芯片和光模块的价值就越被重新发现。上海交大行研院报告，引用注明出处 49 中国在互联领域的优势与短板中国在光通信领域拥有显著的产业链优势。中际旭创、新易盛、光迅科技等企业在全球 400G/800G 光模块市场中占据领先地位，出口规模持续增长。然而，在 CPO 核心技术、高端交换芯片（博通垄断）和硅光制造工艺方面，国内仍有明显差距。从算力溢出效应的视角看，中国光模块企业目前是这一效应的直接受益者——GPU 集群的全球扩张驱动了对高速光模块的刚性需求。但 CPO 技术的普及可能改写供应链格局：当光引擎从可插拔模块变为封装内组件时，传统光模块厂商的角色将面临重新定义。未来的关键突破点在于：参与 CPO标准制定和生态建设，在及更高速率光模块上保持技术领先，以及在国产交换芯片上实现中低端场景的替代。芯片联盟：价值网络上的四大阵营算力溢出效应正在将 AI 芯片产业从“英伟达一家独大”的单极格局推向多极化竞争。基于供应链关系和技术路线的差异，当前全球 AI 芯片生态可划分为四大阵营，每个阵营都在试图在这张由溢出效应重构的价值网络上占据最有利的节点。 1.英伟达链：全栈生态的守城者英伟达链是当前最完整、最强势的 AI 芯片生态。以英伟达 GPU 为核心，台积电（CoWoS 先进封装）为制造基座，SK 海力士/三星/美光提供 HBM，博通供应网络芯片，形成了从芯片设计、制造、封测到系统集成的全链条覆盖。CUDA 软件生态是这条链的核心壁垒——全球超过 400 万开发者构建在 CUDA 之上，千亿参数大模型的主流训练框架几乎全部原生支持 CUDA。从溢出效应的视角看，英伟达链的独特地位在于它既是溢出效应的“策源地”（GPU 性能升级驱动全链条需求），也是溢出效应最大的直接受益者（75%毛利率）。但也正是这种过于集中的价值捕获，催生了其他三大阵营的竞争性崛起。 2.谷歌链：ASIC 商业化的开拓者谷歌链以 TPU 为芯片核心、博通为 ASIC 代工伙伴、自研 OCS 光互联为网络基础，构建了与英伟达链平行的完整生态。TPUv7 的 TCO 优势（较 GB200 低 30%-44%）和 Anthropic 的大额订单，标志着这条链已从“谷歌自用”走向“开放商业化”。谷歌链的战略意义在于：它证明了在溢出效应重构的价值网络中，可以存在一条绕过英伟达 GPU 的替代路径。JAX/XLA 软件栈虽然生态规模不及 CUDA，但在科研和大模型训练领域已建立起可观的用户基础。如果 TPU 的外部化持续推进，可能触发英伟达估值逻辑从“垄断溢价”向“寡头定价”的转变。 3.云厂商 ASIC 链：多元化的挑战者微软、亚马逊和 Meta 等云厂商正在构建各自的定制化 ASIC 芯片能力，形成了分散但日益强大的第三阵营。微软的 Maia 100 加速器采用台积电 5nm 工艺、集成 1050 亿晶体管；亚马逊的 Trainium2 和 Inferentia2 已在 AWS 上商用；Meta 的 MTIA 芯片在内部规模化部署。这些自研芯片虽然单芯片性能通常不及英伟达旗舰产品，但凭借定制化优化和供应链自主性，正在成为云厂商降低对英伟达依赖上海交大行研院报告，引用注明出处 50 的战略支柱。从溢出效应的视角看，这一阵营的崛起本质上是价值网络中“下游”节点向“上游”的反向渗透——当芯片利润率远高于云服务利润率时，垂直整合成为理性的战略选择。 4.中国自主链：制约下的突围在美国出口管制的倒逼下，中国正在构建独立的 AI 芯片生态体系。2024 年中国 AI 芯片市场规模达 1206 亿元，同比增长 %，其中国产芯片销售额约 60 亿美元，预计 2025 年将翻倍至 160 亿美元。华为昇腾是当前的领头羊：昇腾 910C 采用 7nm 双 Die 封装，FP16 算力约 800 TFLOPS（约为 H100 的 80%），2024 年出货超过 64 万片，占国产 AI 芯片市场 23%份额。华为的三年路线图显示，2026 年将推出首款搭载自研 HBM 技术的昇腾 950PR（算力 1 PFLOPS），以及面向大模型解码场景的昇腾 950DT （2 PFLOPS，144GB 显存，4 TB/s 带宽）。寒武纪以 ASIC路线深耕垂直场景，海光信息以 X86 兼容路线破解信创需求，摩尔线程、沐曦股份、壁仞科技等 GPU 新势力也在加速追赶。Bernstein Research 预测，到 2026 年英伟达在中国 AI 芯片市场的份额将从 54%萎缩至 8%，华为将占据 50%。中国自主链面临三大关键瓶颈：一是先进制程受限，7nm 以下工艺仍依赖海外代工；二是软件生态碎片化，华为 MindSpore、寒武纪 NeuWare 等各立标准，千亿参数模型从 CUDA 迁移需 1-3 个月适配；三是 HBM 等先进封装技术差距明显。但从算力溢出效应的视角看，中国自主链面临的最大机遇在于推理芯片赛道：推理 workload 的特征更适合 ASIC 定制优化，且不像训练那样对最先进制程有刚性依赖。正如云天励飞创始人陈宁所言：“在 AI 推理芯片上，全球厂商包括英伟达，几乎是站在同一条起跑线上。“随着 DeepSeek 等国产大模型对推理效率的极致优化，以及政策层面的窗口指导，中国 AI 芯片的国产化率有望在 2027 年达到 55%。本章小结回顾本章的分析，一条清晰的主线贯穿始终：AI 算力需求不只是带动 GPU 一个品类的发展，而是通过溢出效应重塑了整个半导体的价值分配。在算力芯片领域，英伟达 GPU 的近乎垄断地位创造了前所未有的定价权，但也催生了 Hyperscaler 的集体反抗——谷歌 TPU 的百亿美元订单和四大云厂商的 ASIC 自研，正在将“垄断定价”推向“寡头竞争”。在存储芯片领域，GPU 算力的指数级增长暴露了 memory-bound 瓶颈，HBM 成为四十年一遇超级周期的主角，KV 缓存让 NAND 成为意外的受益者，物理缩放的极限使涨价从周期性波动变为结构性重估。在互联芯片领域，GPU 集群的规模扩张让铜线互联撞上物理极限，CPO 正在开启从铜到光的历史性跨越。在 CPU 领域，Agentic 应用的兴起让这个被边缘化的角色以“系统总指挥”的身份重回增长叙事。这些看似独立的技术趋势，实际上是同一张“算力价值网络”在不同节点上的共振。AI 芯片产业的发展不再是一条从设计到制造的单线，而是一张由算法演进、应用发展和物理定律共同驱动的、持续上海交大行研院报告，引用注明出处 51 自我重构的网。Scaling Law 驱动 GPU 代际升级，推理 Scaling Law 催生 ASIC 和推理芯片，LLM 的 memory-bound 特征驱动 HBM 和存算一体，延迟瓶颈驱动 CPO 和光互联，Agentic 应用让 CPU 重回核心——每一个节点的变化都会引发相邻节点的连锁反应。在这张网上，四大芯片联盟各自占据不同的战略位置：英伟达链是现有价值网络的最大受益者和守护者；谷歌链证明了 ASIC 可以在开放市场与 GPU 竞争；云厂商 ASIC 链代表着下游对上游定价权的系统性反抗；中国自主链则在地缘约束下探索推理赛道的后发突围。未来 35 年，这张网将持续自我重构——而每一次重构，都将重新分配数千亿美元的产业利润。本章参考资料 [1]Butters J.标普 500 指数盈利透视（Earnings Insight）[R/OL].诺沃克:FactSet Research Systems,2 024.(2024-11-15)[2026-1-15]. arch%20Desk/Earnings%20Insight/ [2] Semiconductors:The Rebirth of the Hardware Stack from Memory to Fabric[R].,2024. [3] HBM and AI Server Market Outlook:The Structural Shift in Semiconductor Cost[R].TrendForce,2024. [4]NVIDIA LLM Inference with TensorRT-LLM:From Prefill to Decode[EB /OL].NVIDIA Technical Blog [5]Weng Powered Autonomous Agents[EB/OL].Lil'Log.(2023-06-23)[2023-06-23].https://lili [6]Kaplan J,McCandlish S,Henighan Laws for Neural Language Models[R/OL].:OpenAI, 2020.(2020-01-23). [7]算法演进与应用模式研究(Algorithmic Evolution&Agentic Research) 上海交大行研院报告，引用注明出处 52 第 6章能源基础设施：AI 算力的终极物理约束如果说芯片决定了 AI 算力的上限，那么能源则决定了这个上限能否触达。国际能源署（IEA）预测，到 2030 年全球数据中心电力消耗将增长至约 945 TWh，占全球电力消耗总量近 3%，其中美国数据中心新增电力消耗中 AI 相关占比近半，能耗规模可能超过钢铁、化工等传统高耗能产业。2026 年，人工智能相关电力需求预计将占全球电力消耗的 4%。AI 正在以前所未有的速度重塑全球能源基础设施—— 从数据中心内部的供配电架构，到外部的能源供给方式，再到国家间对算力和电力资源的竞争性布局，电力已从数据中心的“水电煤”变为 AI 产业的战略性资源。数据中心内部：电力电源与储能的架构革命 AI 训练和推理的负载（workload）特征正在从根本上改变数据中心的供配电逻辑。传统数据中心的负载相对稳定，峰谷差较小，传统 UPS（不间断电源）配合市电即可满足需求。而 AI 工作负载呈现出剧烈的功率波动。一次大规模训练任务的启停可能在秒级时间内带来数十 MW 的负载跳变，这种“脉冲式”用电特征使传统供电架构面临系统性失配。英伟达在2025年10月开放运算计划（OCP）全球峰会上发布白皮书，明确将800V高压直流（HVDC）架构作为下一代 AI 数据中心的供电标准，并指定中压整流器/固态变压器（SST）为最终解决方案。相较传统 UPS 方案，800V HVDC 架构具备效率更高、功率密度更大、占地更小、总拥有成本更低等系统性优势。更关键的是，800V HVDC 架构本质上是一个高压直流微电网——绿电和储能系统可以更直接地接入数据中心供电系统，省去大量交直流转换（逆变器、整流器）环节，减少能量损耗，实现“源- 荷”的高效协同。英伟达在白皮书中提出了一个具有标志性意义的判断：“储能必须被视为电源架构中必不可少的、活跃的组件，而不仅仅是备用系统。这意味着储能从传统的“保险”角色转变为数据中心供电系统的核心功能组件。800V HVDC 架构解决了电力输送的规模效率问题，而 AI 工作负载越来越大的波动性则必须由储能系统来动态平抑。储能成为 AI 数据中心电力架构中不可缺少的“活跃缓冲层”。这一架构变革正在催生多个细分领域的技术升级。在半导体层面，碳化硅（SiC）功率器件、磁性元件、直流链路电容和直流断路器等电力电子核心器件迎来需求爆发，英诺赛科正与英伟达合作开发 800V HVDC机架电源方案，麦格米特的PSU服务器电源产品已进入英伟达供应链并向HVDC环节延伸。在系统集成层面，固态变压器（SST）因其效率高、体积小、预制化设计的优势，被中金公司研报认定为未来数据中心供电架构的优选方案，国内四方股份已实现多项 SST 产品交付，阳光电源计划 2026 年实现 SST 产品落地和小规模交付，中国西电全资子公司也已具备 800VDC 架构 SST 的研制能力。散热技术是电力架构中同等重要的另一维度。AI 芯片集成度的指数级提升正在逼近传统冷却材料的物理极限，未来优先发展方向指向石墨烯和金刚石基材料。在冷却方案层面，微通道冷却器正从传统设计向“近结（Near-Junction）”方向演进，歧管微通道（Manifold Microchannel）、微射流和相变冷上海交大行研院报告，引用注明出处 53 却的融合方案有望成为下一代主流技术。液冷已从高端选项变为 AI 数据中心标配——冷板式液冷将 PUE 降至以下，浸没式液冷进一步压缩至左右，这些技术的普及直接关系到数据中心的能效比和运营成本。在竞争格局上，未来 AI 数据中心（AIDC）储能市场将呈现“巨头主导、生态共生”的格局。维谛、施耐德、伊顿等国际老牌电力基础设施企业凭借技术储备和全球渠道能力稳居行业顶层，其 UPS 产品占据全球约 60%的市场份额，并率先推进 800V HVDC 供电架构与液冷、机柜级电源、AI 负载自适应管理等技术的深度融合，与英伟达等算力巨头保持紧密合作，率先适配 GPU 集群高功率、高动态负载的供配电需求。科华数据、科士达以及华为等国内企业则构成第二梯队，以更快速的市场响应能力、更强的定制化交付能力和更具竞争力的成本结构争夺国内市场。细分领域的生存策略将从过去的“大而全” 转向“融入巨头生态”——在先进电池技术、SiC 功率模块、高效热管理材料等方面成为不可或缺的“隐形冠军”。能源供给方式的升级：从绿电到核聚变 AI 数据中心规模的爆发式扩张正在重塑能源供给端的技术路线和投资结构。2025 年全球电网投资将超过 4000 亿美元，更远期的预测甚至给出未来 10 年全球数字基础设施加上能源体系的投资规模将达 5 万亿美元。电力设备行业正在成为这场 AI 基建浪潮中最直接的受益者。在短期内，燃气轮机发电正在成为北美 AI 数据中心的首选电力方案。燃气轮机具备建设速度快、发电稳定、启动迅速（可在短时间内达到满负荷应对突发电力需求）以及排放相对较低的优势，高度适配AI数据中心的脉冲式负载特征。2019年至 2023年，全球燃气轮机销售量从 GW增长至 GW；三菱重工等主要厂商预计 2024—2026 年平均年销售量将达 60 GW，较 2023 年增长 36%。通用电气（GE）2024 财年燃气轮机新增订单达 GW，同比增长 113%，并计划将年产量从 55 台提升至 80 台。燃气轮机市场高度集中，三菱重工、西门子能源和 GE 三家合计占据全球 82%的市场份额，其产能扩张节奏将直接影响 AI 数据中心的电力供给速度。光储系统（光伏发电+储能）正在成为 AI 数据中心的重要电力来源。光伏发电与储能的组合可以作为数据中心的主电源或辅助电源，提供长期稳定的绿色电力输出。全球锂电储能市场在 2025 年前三季度装机超 170 GWh，同比增长 68%，市场结构从中美为主演变为全球遍地开花——欧洲、中东、亚太等区域储能招标量和装机量均大幅提升。与 800V HVDC 架构的耦合使绿电+储能方案的系统效率进一步优化：高压直流的数据中心内部本身就是直流微电网，光储系统可以直接接入，大幅减少交直流转换损耗。在电池技术层面，磷酸铁锂仍是当前储能电池的绝对主流，但钠离子电池凭借安全性高、低温性能好、成本潜力大等优势正在加速向储能领域渗透——宁德时代已发布量产钠电池产品，预计 2026 年将成为钠电池商业化落地的关键节点。固态电池的产业化也在加速推进，预计 2030 年全球固态电池总出货将超 700 GWh，有望为数据中心储能提供更高能量密度和更高安全性的新选择。上海交大行研院报告，引用注明出处 54 核聚变能源代表了更前瞻性的方向。光大证券研报认为，未来 AI 产业发展或将重塑用电结构，核聚变能源作为“人类终极能源”，可控核聚变产业具备较高战略价值和长期增长潜力。AI 巨头已纷纷进行布局：2023 年，微软与 Helion Energy 达成全球首个核聚变电力购电协议，约定自 2028 年起交付 50 MW 的商用核聚变电力；2025 年 6 月，谷歌宣布加大对核聚变能源初创企业 TAE Technologies 的投资，并签署 200 MW 的供电协议。在技术支撑层面，许继电气联合参与研制的我国首套用于“中国环流三号” 的 300 MVA 脉冲供电系统已完成测试验收，标志着中国在可控核聚变供电装备领域取得重要突破。尽管商用核聚变的全面落地仍需十年以上，但 AI 产业对超大规模、超高稳定性电力的刚性需求，正在为核聚变的商业化注入前所未有的经济动力和资本关注。中美算力资源的竞争与差异化路径 AI对算力资源的巨大需求正在催生一场全球性的能源基础设施竞赛，中美两国作为AI产业的两极，展现出截然不同的能源策略。美国采取的是“算力引领、能源跟进”的路径，其资本投入力度史无前例。2025 年，亚马逊年度资本开支达 1000 亿美元（其中在俄亥俄州和佐治亚州投资超 10 亿美元建设 AI 算力数据中心），微软年度资本开支 800 亿美元，谷歌 2025 年资本开支 750 亿美元，Stargate 项目更是规划了 5000 亿美元的 AI 基础设施超级投资，由 Oracle 担任数据中心建设方。在能源供给层面，Hyperscaler 以速度为核心优先级：xAI 绕过电网自建超过 500 MW 的天然气发电设施，OpenAI 与 Oracle 规划 GW 的现场燃气发电，微软的单体 Fairwater 数据中心容量超过 2 GW。核能也被纳入战略选项：Oracle 配套三座小型模块化核反应堆（SMR），亚马逊和谷歌投资早期核能技术。美国模式的核心特征是“自备发电”（BYOG），即以高资本支出换取电力供给的自主性和速度。但这一路径也面临挑战——燃气轮机产能集中在少数厂商手中、天然气价格波动、环境审批阻力以及输电网络的扩容瓶颈正在成为新的制约因素。中国正在探索一条“绿电+储能+数据中心”的算力换道超车路径。凭借在光伏、风电、储能和特高压电网领域的产业链优势，中国试图以能源基础设施优势弥补算力效率差距。截至 2025 年底，中国风电和太阳能发电累计装机规模已突破 1800 GW，非化石能源发电装机容量占比首次达到 %，正式超过火电。2025 年全社会用电量历史性突破 10 万亿千瓦时，充换电服务业用电量增速达 %。在国家战略层面，中国明确 2035 年风电、太阳能发电总装机容量达到 2020 年的 6 倍以上，力争 36 亿千瓦以上，未来十年每年还需新增约 2 亿千瓦风光装机。中国变压器出口在 2025 年前 9 个月达亿元，同比增长 %，连续四个月创历史新高——中国电力设备产业链正在成为全球 AI 基建能源投资浪潮的核心供应商。 “十五五”期间，中国能源基础设施的核心任务是建设新型能源基础设施，解决新能源消纳与电网适配问题。路径包括：煤电灵活性改造以提升传统能源对新能源的支撑能力；大规模部署电网侧储能系统（预计 2027 年全国新型储能装机突破亿千瓦）；推动电动车车网互动（V2G）形成分布式储能上海交大行研院报告，引用注明出处 55 场景；特高压电网智能化改造以匹配“储能+新能源+特高压”的一体化方案。这套组合拳的战略意图清晰：在 AI 芯片受制于出口管制的约束下，以能源基础设施的全链条优势构建差异化的算力竞争力。从全球视角看，AI 对能源的支配性影响正在超越产业本身。当 Hyperscaler 的单体数据中心功率以 GW 为计量单位，当一国的 AI 竞争力取决于其电力供给的速度和规模，能源已不再是 AI 产业的外部条件，而是内生于 AI 产业链的战略要素。无论是美国的 BYOG 自备发电模式，还是中国的绿电储能路径，都指向同一个结论：在算力时代，“得能源者得算力，得算力者得 AI”。本章小结回望整章，一条清晰的逻辑链条浮出水面：AI 的极限不在代码，不在模型，不在芯片——而在于能否将足够的电子在正确的时刻、以足够稳定的方式送达数以百万计的 GPU。历史上，每一次划时代的技术跃迁都伴随着能源基础设施的同步革命。蒸汽机的普及催生了煤矿和铁路网络；电气化革命构建了百年电力工业体系；互联网时代则拉动了光纤和数据中心的全球铺设。如今，AI 大模型的崛起正在触发第四次同量级的能源基础设施重构——但其速度之快、强度之大，远超前几次的历史节奏。这场重构的独特之处，在于它同时从两个方向施压。在需求侧，AI 工作负载的功率密度已突破传统数据中心设计的物理边界，迫使整个供配电行业从架构层面重新出发——800V HVDC 不是旧体系的迭代升级，而是一次范式级的重建。在供给侧，美国的 BYOG 自备发电模式与中国的绿电储能路径代表了截然不同的路径选择：前者以资本强度换取速度，后者以体系优势换取可持续性。两条路径尚无定论，但殊途同归于一个共识——AI 竞争的终局，是电力竞争，更是能源竞争。这一轮能源革命的受益者，并不局限于科技产业本身。储能、电力设备、功率半导体、新材料、核能技术——这些在过去长期被视为“重资产、慢回报”的传统工业领域，正在被 AI 的电力饥渴重新激活，成为算力时代意想不到的战略高地。本章参考资料 [1] 国际能源署.Energy and AI[R/OL].巴黎:国际能源署,2025.(2025-04-10). orts/energy-and-ai/energy-demand-from-ai [2]翁欣.新质生产力系列：全球AIDC核心环节的迭代突破[R/OL].北京:中证鹏元资信评估股份有限公司,2025.(2025-07-11). f3f [3]唐仁杰.碳化硅赋能AI产业：从芯片封装到数据中心的核心材料变革[R].北京:金元证券股份有限公司,2025-09-28. [4]刘然.电力话题持续升温——英伟达发布 800V HVDC白皮书[EB/OL].新能源产业家.(2025-10-15). 上海交大行研院报告，引用注明出处 56 [5]中关村储能产业技术联盟.英伟达800V架构重塑AI数据中心：31家产业链核心企业大起底[EB/OL]. (2025). [6]高工产业研究院.2025 年中国AIDC储能行业发展蓝皮书[R].:高工产业研究院,2025. [7] The Stargate Project[EB/OL].(2025-01-21). uncing-the-stargate-project/ [8] AI Labs Are Solving the Power Crisis:The Onsite Gas Deep Dive[EB/OL].(2 025-12-30). [9]国家能源局.2025 年可再生能源并网运行情况[EB/OL].(2026-02). 2/742b8c6a078347b0b39de676c05c5d58/ [10]国家能源局.2025 年全国电力统计数据[EB/OL].(2026-01-29). 6874f211acd0417eab7ac10c3061a7c2/ [11]王玉晴.英伟达引领直流架构变革两类上市公司商机大[N].上海证券报,2025-10-23. [12]王玉晴.AIDC储能 2030 年出货量或达今年 20 倍[N].上海证券报,2025-12-11. [13]聂林浩.在重构中前行：AI投资激荡全球[N].上海证券报,2025-10-12. 上海交大行研院报告，引用注明出处 57 产业篇第 7章 AI 赋能产业创新发展产业篇回答的是一个更具现实张力的问题：AI 正在改变什么？AI 赋能产业正在从“概念验证”跨入” 规模化落地”的关键窗口期。 “十五五”规划建议前瞻性地推动“人工智能+”从战略构想迈向深度融合的产业与社会实践。一是以人工智能引领科学研究范式、产品研发模式与产业组织形态的深刻变革，在智能制造、智慧能源、生物医药等重点领域抢占全球创新制高点；二是在社会层面，推动人工智能与城市治理、文化服务、民生保障及绿色转型等领域的全面融合，通过打造国家级应用示范区和标杆场景，构建全链条、全场景的智能赋能生态。本章聚焦信息、新材料、智能制造、新能源、健康医疗和未来空间六大重大产业方向，并兼顾城市治理、智慧农业、文旅、绿色环保等新兴赋能场景，通过二十余个典型案例的剖析，从以下两个视角去系统地呈现 AI 与产业深度融合的真实图景。第一，“微观—中观—宏观”的穿透视角。我们不满足于展示 AI 应用的表面效果，而是试图穿透三个层次来理解产业智能化的全貌——微观层面，AI 如何提升单个设备、工序和岗位的效率；中观层面， AI 如何重构工厂级的调度、协同与决策；宏观层面，AI 如何改变产业链的组织形态和竞争逻辑。这一视角贯穿了各个产业领域的案例解读。第二，从”AI+行业”到”行业×AI”的观察视角。我们在调研中发现，真正释放通过 AI 赋能产业价值的企业，不是简单地在既有流程中嵌入 AI 工具（加法逻辑），而是以 AI 为底座重构产业的核心运行逻辑（乘法逻辑）。蔚来以 AI 赋能整车研发生产全流程、华为数字能源将 AI 深度融入储能电站智能运营...... 这些案例的共同特征是：AI 不再是生产系统的外挂，而是产业运转的中枢神经。 AI 赋能信息产业引言 1.产业定位与战略图景根据国务院、工业和信息化部及国家发展改革委的顶层设计，未来信息产业的核心内涵已从传统 IT 的采集－传输－处理线性逻辑，升级为以下一代通信（6G/卫星互联网）、前沿算力（量子计算/类脑智能）、智能交互（脑机接口/具身智能）及数据要素流通为核心的深度融合体系。 2024 年至 2025 年，随着“人工智能+”行动计划的深入推进，AI 技术加速向信息产业的物理层与协议层渗透，形成了 AI 重塑基础设施（AI for Infrastructure）与基础设施支撑 AI（Infrastructure for AI）双向驱动的产业发展态势。上海交大行研院报告，引用注明出处 58 这一双向驱动的格局意味着：一方面，AI 技术正在重构通信网络的调度逻辑、数据中心的能效管理、云计算的资源编排；另一方面，新一代基础设施（算力网络、数据交易所、隐私计算平台）又为 AI 应用的规模化落地提供了必要的物理支撑。表传统信息产业和未来信息产业的对比维度传统信息产业未来信息产业（AI 赋能）核心技术支撑通信网络地面覆盖，追求带宽与速率空天地海一体化，通感算智融合 6G、卫星互联网、太赫兹通信计算范式通用计算（CPU），摩尔定律驱动异构计算（GPU/NPU/QPU），能效与架构驱动量子计算、类脑智能、光子计算交互方式键盘/触控，物理接触意念交互、沉浸式体验，虚实共生脑机接口（BCI）、元宇宙、具身智能数据形态资源化，被动存储资产化，价值流通，隐私计算数据要素市场化、多方安全计算、联邦学习 2.概览信息产业涵盖众多细分领域，以下仅对 AI 赋能信息产业的五个子领域作概览性介绍：时空智能领域北斗卫星导航系统与人工智能的深度融合，正在推动高精度定位与智能决策相结合的新型应用模式发展。北斗系统提供高精度的经纬度与时间信息，AI 赋予时空数据语义理解能力。在自动驾驶场景中，北斗提供厘米级绝对定位，AI 视觉算法提供相对定位与环境感知，两者通过融合算法实现全天候、全场景的车道级导航。在城市治理领域，北斗+AI 支撑了智慧交通信号优化、城市部件精准管理、应急救援路径规划等场景应用。2024 年，我国高精度位置服务相关收入达 214 亿元，年均复合增长率超过 25%。例如，千寻位置公司将北斗高精度定位与 AI 视觉识别深度融合，构建了新型公路养护模式，巡检效率较传统人工模式提升数倍。 AI 搜索与信息服务领域传统搜索引擎面临新一轮范式变革。AI 搜索产品不再以链接列表形式呈现结果，而是直接生成综合性答案，信息检索的认知负荷正从用户端向机器端转移。在国际市场，OpenAI 的 DeepResearch 2025 年 ARR（年化收入）同比增长 %，已从创意写作工具发展为核心的信息发现入口；Perplexity AI 聚焦知识工作者的深度搜索需求，月处理查询超 1 亿次；Google 通过将 Gemini 集成至搜索结果页进行防御性部署，近 16%的查询已触发 AI 概览，Gemini 应用月活跃用户达亿。在中国市场，百度搜索份额从高峰期的86%降至约60%，DeepSeek凭借高性价比的推理能力在2025 上海交大行研院报告，引用注明出处 59 年初达到近 9700 万 MAU，豆包、Kimi 等产品分别切入消费级和专业级搜索场景；小红书日均搜索量达 6 亿次，在年轻用户群体中逐步确立了生活信息检索入口的地位。AI 搜索的发展催生了一个新的市场品类——GEO（生成式引擎优化），据某市场研究机构预测，2024 年 GEO 市场约亿美元，预计到 2031 年达 73 亿美元，CAGR 为 34%。 AI for Science 领域 AI 从赋能应用走向赋能科学，通过 AI 重构科学计算的范式，在气象预报、药物发现、材料设计等基础科学领域推动突破性进展。以盘古气象大模型为代表的方案，采用 43 年的欧洲气象局 ERA5 数据进行训练，构建了覆盖全球的中期天气预报基模型，将预报时间从数小时压缩至秒级，台风路径轨迹预测准确率超过欧洲气象中心，为极端天气应急响应提供了重要的时间窗口。量子计算与 AI 的深度融合（量子 AI）被普遍认为是未来十年具有重要战略意义的技术方向之一。2025 年，英伟达、牛津大学、多伦多大学等团队在《Nature Communications》发表综述，系统总结了量子 AI 的三大发展方向：建立量子人工智能计算平台、GPU 加速量子计算模拟仿真、加强跨学科协作。例如，图灵量子（节）正在将这一前沿方向从研究推向产业落地，其 2024 年推出的量生万物生物医药智能平台，融合量子计算与 AI 技术，覆盖合成生物学、抗原抗体设计和小分子药物设计领域。 AI 安全与可信AI 领域 AI Agent 的规模化部署催生了新的安全需求。当 AI 具备操控操作系统、调用 API、访问文件系统的能力后，安全风险正从内容安全层面向行为安全层面扩展。在应用层安全挑战方面，非人类身份管理（NHI IAM）问题日益突出，机器身份的数量已远超人类身份；传统验证码已无法有效阻挡具备视觉识别能力的 AI Agent；提示注入攻击防御仍待突破，杜克大学 2025 年研究显示，思维链劫持（H-CoT）攻击方法下模型对有害信息的拒绝率降低至仅 4%。在前沿模型行为风险方面，复旦大学团队对国内外 32 款大模型进行全面测评，发现 11 款模型已具备自我复制能力；Palisade Research 实验发现 OpenAI 的 o3 模型在 100 次测试中 7 次拒绝关闭；Anthropic 在 Claude Opus 4 安全测试中发现该模型具备策略欺骗能力，测试中发生率高达 84%。中国信通院已联合 30 余家企业、科研机构及高校，构建了大模型安全基准测试框架 AI Safety Benchmark，以底线红线、社会伦理、数据安全为核心维度，形成覆盖模型自身安全与内容安全的体系化测试方案。隐私计算与数据流通领域数据正在成为驱动智能经济的核心生产要素，而 AI 则是释放数据价值的关键引擎。金山办公的 WPS AI（节）、上曜科技的数据资产化全链闭环（节）、库帕思科技的语料枢纽平台（节）分别代表了 AI 赋能的三个关键方向，共同指向一个趋势：数据正在成为驱动智能经济的核心生产要素，而 AI 则是释放数据价值的关键引擎。智能办公处理的是企业内部的知识数据，数据资产化激活的是企业沉淀的业务数据，语料基础设施供给的是 AI 模型的训练数据——三者在不同层面推动数据从上海交大行研院报告，引用注明出处 60 资源向资产转化，从存储向流通演进。数据流通的前提是安全保障。2024 年，中国隐私计算市场规模达亿元，三大主流技术路线（多方安全计算 MPC、联邦学习 FL、可信执行环境 TEE）正逐步从实验室阶段走向规模化商用。AI 在隐私计算中发挥双重作用：一方面用于自动化识别数据中的敏感信息并进行智能脱敏；另一方面动态调整差分隐私的噪声参数，在保证数据可用性的同时最大化隐私保护效果。在银行风控场景中，科技公司通过隐私计算平台引入运营商数据辅助信贷评估，银行无法获取用户的通信明细，但可以获得 AI 生成的信用评估分数，这种数据可用不可见的模式有效促进了跨行业数据流通。 3.挑战面临的主要挑战包括：一是高端算力供给存在瓶颈。尽管华为昇腾等国产芯片取得长足进步，但在 7nm 及以下先进制程制造工艺、HBM 高带宽内存及 CoWoS 先进封装产能上，仍受制于光刻机等核心设备的外部限制。算力军备竞赛正从芯片层面扩展至能源层面，数据中心的电力供应和冷却能力成为新的竞争焦点。二是数据流通面临制度性障碍。数据确权难、定价难、入场难的问题依然存在，大量高价值数据沉淀在政府与大型国企内部，缺乏有效的市场化释放机制。2024 年全国数据交易总规模虽突破 1600 亿元，但大量数据产品挂牌而未实现交易，真实的市场化撮合成交量有限。数据的价值高度依赖使用场景，缺乏类似商品市场的标准化定价参考体系。 4.展望在技术趋势层面，AI 应用将从大模型阶段向多模态智能体（Agents）方向加速演进，Agent 将具备更强的自主规划与执行能力，能够操作复杂软件系统乃至物理设备，商业模式有望从按席位订阅（Seat-based Pricing）向按结果付费（Outcome-based Pricing）方向转型。在产业规模层面，预计到 2027 年我国核心工业软件市场规模将接近 580 亿元（年复合增长率超 20%），边缘 AI 芯片市场将从 2024 年的 30 亿美元增长至 2034 年的 259 亿美元（CAGR %）。在政策导向层面，“十五五”规划中 8 次提及人工智能一词，将未来信息产业发展放在重要位置，提出适度超前建设新型基础设施，进一步强化算力网络国家战略布局，加快人工智能等数智技术创新，全面实施“人工智能＋”行动，以人工智能引领科研，加强人工智能治理相结合，抢占人工智能产业应用制高点等规划建议。在战略高地层面，量子计算有望在 2030 年前后实现专用领域的量子优越性，与 AI 形成双重加速效应，推动材料科学与药物研发计算范式的深层变革。 2026 年，“十五五”规划开局之年，中国未来信息产业正处于从技术积累向规模化应用加速推进的关键阶段。AI 技术的全面渗透，不仅推动了信息产业技术栈的升级（从 CPU 到 GPU/NPU、从确定性规则到概率性推理），也深刻影响了产业的商业逻辑（从工具销售到效果交付）与生产组织方式（从上海交大行研院报告，引用注明出处 61 人操作软件到 Agent 操作软件）。典型案例：金山办公作为一家源自中国的科技公司，金山办公在过去 38 年持续深耕办公赛道，开创了计算机「中文字处理时代」，并持续致力于引领未来办公新方式。金山办公旗下核心产品包括专业文档处理工具 WPS Office、面向组织和企业的办公新质生产力平台 WPS 365，智能办公助手 WPS AI、原生智能体 WPS 灵犀以及轻量化知识沉淀利器 WPS 笔记等。 AI 赋能场景：WPS AI 行业痛点提示词门槛与交互断层：传统 AI 依赖复杂提示词（Prompt）。用户在对话框与编辑区切换会打断思维流，90%的用户反映不知道怎么跟 AI 对话。这种交互模式本质上是将学习成本转嫁给用户，与办公软件降低门槛的初衷相悖。格式兼容与交付成果的“最后一公里”：许多通用 Agent 在生成 PPT 时常出现目录缺失或格式错乱，导致人工二次调整时间过长。办公文档的格式复杂性（图文混排、多级列表、表格嵌套、公式符号）远超一般文本，这是通用大模型难以解决的垂直领域难题。碎片化知识的检索难题：企业文档散落在邮件、网盘、本地硬盘等多个系统中。面对 10 万行级别的复杂表格，人工筛选效率低下，且无法有效利用私域数据。传统的全文检索技术无法理解文档的语义结构，导致找资料成为知识工作者的主要时间消耗。组织安全与信创适配：政企客户需要数据主权保障。海外 AI 无法满足国内数据安全合规及国产化软硬件适配的需求。在政务、金融、央企等场景，私有化部署和国产化适配是刚性门槛。解决方案 1. 范式跃迁金山办公推出的 WPS AI 经历了从工具化辅助到原子化拆解再到原生智能体协同的三个关键进化阶段，实现了从好看到好用的范式跃迁。WPS AI 的核心竞争力在于懂格式、会思考、能进化，能够深度理解复杂的排版逻辑、表格嵌套以及幻灯片的视觉结构。（1）WPS AI 阶段（2023 年）：AIGC 能力的工具化探索锚定 AIGC（内容生成）、Insight（阅读理解）和 Copilot（辅助协同）三大核心能力，支持起草提纲、润色改写文章以及通过 Chat 框进行 PDF 分析。此阶段的主要功能包括：根据用户输入的主题自动生成文章框架；对已有文本进行语法纠错、风格调整和内容扩展；通过对话界面实现 PDF 文档的问答式阅读。此阶段的瓶颈在于高度依赖精准提示词。用户需要学习如何与 AI 对话，这实际上增加了使用门槛而非降低。同时，生成内容与实际办公场景的格式要求存在差距，AI 生成→人工调整的工作流并未真上海交大行研院报告，引用注明出处 62 正提升效率。（2）WPS AI 阶段（2024 年）：从好看到好用的原子化进化聚焦办公需求做精细化拆解，推出写作、阅读、数据、设计四类 AI 办公助手。核心突破是将复杂的办公任务分解为可被 AI 理解和执行的最小单元，用户无需掌握完整的任务描述能力，AI 能够从用户的局部输入中推断完整意图。标志性功能 AI 伴写让用户写个开头 AI 自动续写，通过 Tab 键采纳，实现了不用提示词，AI 也懂用户。这一设计的精妙之处在于：它将生成动作嵌入到用户的自然写作流程中，而非要求用户切换到对话模式。用户可以随时接受或忽略 AI 的建议，保持创作的主导权。此外，WPS AI 在数据分析场景实现了突破。用户可以用自然语言描述分析需求（例如，”帮我看看今年销售额最高的三个城市”），AI 自动理解数据结构、生成公式并输出可视化图表，将 Excel 高级功能的使用门槛大幅降低。（3）WPS AI 阶段（2025 年）：原生 Office 办公智能体时代基于 AI Agent 范式推出核心产品 WPS 灵犀，通过自然语言、多轮对话完成文档创作、演示文稿生成及语音辅助。与前两代的本质区别在于：WPS 灵犀不再是等待指令的工具，而是理解目标的助手，能够主动规划任务步骤、调用多种能力、并在执行过程中自我纠错。技术突破在于能识别并解析数千种格式组合，确保修改保留图文混排、多级列表等原始版式，出品即成品。这背后是金山办公三十年积累的文档格式解析能力与大模型的深度融合——AI 不仅理解文本语义，还理解文档的视觉结构和版式逻辑。 WPS 灵犀支持语音助手功能，用户可以通过语音描述需求，AI 生成文档并朗读关键内容，实现了解放双手的移动办公体验。在手机端，用户对着文档说出需求，即可快速获取文档要点和全网对比信息。 2. 应用场景场景一：商务合同全生命周期管理（法律/通用商务）某装修公司在与客户洽谈时，需要快速生成一份标准且具有法律效力的装修合同。用户调用 WPS 灵犀，通过多轮对话完成合同新建。灵犀能理解口语化的姓名、地址、金额信息并自动填充，无需用户在表单字段间来回切换。系统将合同中提到的装修项目（如铺瓷砖 50 平米、刷漆 100 平米）一键转化为标准化的表格展示，并自动识别合同条款中的潜在法律风险（如违约责任缺失）并给出修改建议。通过此类自动化，可节省 70%的常规审查时间。对于中小企业而言，这意味着无需聘请专职法务即可获得基础的合同风险管理能力。场景二：海量数据处理与经营分析（金融/制造/财务）财务人员需要从 10 万行级别的海量销售数据中提取特定维度的利润分析。在跨页数据提取环节，上海交大行研院报告，引用注明出处 63 AI 能从大型表格、合并单元格甚至弯曲变形的扫描件中，秒级识别并提取华东区 4 月份某产品的销售额。在自然语言分析环节，用户无需编写复杂公式，直接问“今年相比去年同期增长了多少？”，AI 自动生成透视图表并给出结论。系统理解同期的时间语义，自动完成年份对齐和增长率计算。这实现了人找资料向 AI 管资料的转变，降低了高级办公软件的操作门槛，让不熟悉 Excel 高级功能的用户也能完成专业的数据分析任务。 3. 从文档到企业知识图谱 AI 技术正在推动解决企业长期存在的知识孤岛问题。通过 RAG（检索增强生成）技术，企业可以将海量非结构化文档（PDF、Word、邮件、会议录音）转化为向量数据库。当员工提出问题时，AI 基于企业私有知识库生成精准答案，而非依赖公共知识。这种企业级 AI 搜索正在逐步替代传统的内部搜索系统和知识管理平台，成为企业数字化基础设施的重要组成部分。 WPS AI 政务版已完成与龙芯中科、统信 V20 等国产系统的兼容认证，提供私有化部署，确保敏感数据不出企业边界。这一能力对于政务、金融、央企等对数据主权有严格要求的客户至关重要。 4. AI 办公的持续进化：WPS笔记 WPS 笔记是金山办公开发的 AI 原生的知识管理工具，WPS 笔记将传统记录载体升级为多模态信息处理节点。系统深度融合 AI Agent 能力，支持语音转写、图片结构化解析等多模态数据接入，实现了从信息录入、逻辑重组到知识提取的全周期自动化，解决了非结构化内容难以沉淀与高频复用的痛点。在未来，更多的信息会由 AI 产生，为了更好地管理 AI 信息产物，WPS 笔记在底层架构生态上，通过打通 MCP（模型上下文协议）与 CLI（命令行）双接口，开放多项原子能力，支持各类外部大模型（如 GLM 等）及智能体直接对接笔记数据。这种系统级集成赋予了 AI Agent 完整的读写与编辑权限，旨在消除人工跨平台搬运信息的断层，构建了「智能体执行任务、笔记系统沉淀结构化成果」的自动化工作流，重塑了人机协同环境下的信息流转机制。推广价值 WPS AI 的进化历程（辅助创作、原子拆解、原生智能体）不仅是技术的堆叠，更是对办公场景的重新发现。办公软件正向 Agentic Software（代理式软件）演进，从人找资料转变为 AI 管资料。引入 WPS AI 不再仅仅是安装一个软件，而是获得了一个深度理解业务逻辑、能处理复杂任务、保障数据安全的数字助理，拥有了承前启后的资产激活能力——兼容过去三十年沉淀的文档格式（承前），并利用 AI Agent 将“死”文档转为“活”知识（启后）。在全球数字化转型步入深水区的当下，办公软件已从单纯的效率工具演变为企业数字化资产的核心载体。以大模型为核心的生成式 AI 正在推动办公软件与企业知识管理体系的升级重构，传统工具的上海交大行研院报告，引用注明出处 64 功能属性逐步向智能助理属性转变，企业知识管理从被动检索向主动推送方向演进。典型案例：上曜科技上海上曜科技有限公司（以下简称：上曜科技）秉持“智能激活数据价值，安全守护数据流通”的使命，紧密围绕数据要素市场化改革需求，搭建起以大语言模型、智能体等前沿 AI 技术为内核，深度融合隐私计算、动态加密、零信任架构等先进安全技术的一体化体系，打造出覆盖数据全生命周期管理，为各行业客户提供从数据采集、治理到资产化变现的全链路解决方案。 AI 赋能场景：AI 数据治理+资产化行业痛点数字经济浪潮下，人工智能与数据要素成为产业变革核心引擎。人工智能凭自主学习、推理决策能力，为各行业智能化升级赋能，实现数据全生命周期高效管理。数据作为关键生产资料，虽海量沉淀，却受数据孤岛、价值转化难等问题制约。解决方案数据要素市场化的推进，催生了一批专注于帮助企业实现数据资产化的专业服务商。上曜科技构建了数据咨询、数据治理、数据评估、数据挂牌、数据融资、数据资本的全链路闭环，是数据资产化领域的代表性企业。 1.数据治理上曜科技的数据治理业务基于“高效智能、安全合规”的原则，为客户提供从数据清洗到知识图谱构建的全流程服务，针对非结构化数据占比高、数据标准不统一等行业痛点，提供数据清洗、结构化转换、关联分析等全流程服务，同时基于联邦学习框架保障数据治理过程中的安全性与合规性。在数据治理中，AI 技术主要应用在以下方面：（1）在数据采集环节，依托计算机视觉与传感器融合技术，可实时捕获动态业务数据，结合联邦学习框架，能安全整合多源异构静态数据，打破数据孤岛。（2）在数据分类阶段，基于自然语言处理与图像识别技术，可自动完成文本、影像等非结构化数据的特征提取，按照业务规则实现精准归类。（3）在数据标准制定层面，生成式 AI 结合知识图谱，能参照行业规范自动构建数据语义模型，统一数据格式、字段属性与关联规则。（4）在数据清洗过程中，AI 算法可智能识别并剔除冗余、异常数据，通过时序模型校验数据一致性，大幅提升数据治理效率与数据资产质量。 2.数据资产化上曜科技以 AI 智能体为核心引擎，构建“数据咨询-数据治理-数据评估-数据挂牌-数据融资-数据资本”的完整数据资产化闭环，为企业数据价值释放提供全链路支撑。其 AI 智能体体系分为通用 AI 智上海交大行研院报告，引用注明出处 65 能体与专业 AI 智能体两大模块：（1）通用 AI 智能体覆盖数据全生命周期管理（含数据目录、采集转化、清洗治理等）、智能开发部署、决策中枢等核心能力，实现数据从采集到训练的基础流程自动化；（2）专业 AI 智能体聚焦垂直行业（例如文旅、医疗、制造等）数据合规与精细化治理，结合行业标准和实践案例，通过敏感数据识别、合规识别、智能脱敏等功能，配合数据梳理、分类、优化工具，保障数据治理的合规性与精准性。两大智能体模块协同联动，既完成数据的标准化治理，也为后续数据评估、挂牌交易、融资变现提供高质量数据资产基础，最终推动数据从资源向资本的价值跃迁。推广价值上曜科技与客户的合作实践充分验证了 AI 技术在驱动商业数据资产化过程中的核心价值，实现了数据采集、治理、评估、变现的全链路赋能，破解了行业数据管理与价值转化的痛点。上曜科技以“AI+数据”的深度融合破局，二者相辅相成，构建“数据驱动智能、智能激活价值”的良性循环，有助于释放沉淀在企业内部的数据价值，推动数据要素市场从“挂牌”走向“活跃”。对于中国数据要素市场的发展而言，这类专业服务商的涌现是市场成熟的重要标志——它们扮演了“数据银行”或“数据投行”的角色，连接数据供给方与需求方，降低交易摩擦，提升市场效率。典型案例：库帕思上海库帕思科技有限公司（以下简称：库帕思）是上海市委、市政府于 2024 年 3 月设立的上海市唯一一家 AI 语料功能性枢纽平台公司，定位于专业化的功能性语料服务运营平台，按照开放性、链接型、市场化的总体要求，立足上海、服务全国，致力于面向基础大模型、垂类大模型、创新创业者提供低成本、高质量的语料数据服务。作为国资背景的功能性平台，库帕思承担着特殊的使命：它不仅是商业化的语料服务商，更是上海乃至全国 AI 产业数据基础设施的重要组成部分。这一定位决定了库帕思在标准制定、生态建设、公共服务等方面承担更多责任。 AI 赋能场景：AI 语料功能性枢纽平台行业痛点随着人工智能大模型行业发展重心从追求参数规模的“百模大战”转向服务于各行业的垂直领域应用，对底层数据支撑能力的要求越来越高，模型越是追求精准、专业和多模态化，就越需要对海量高数据、高合规的语料数据进行训练，但现实却存在互联网原始数据质量参差不齐、优质语料成本高昂等问题，同时人工标注的传统方式效率低下，严重制约了产业规模化发展，整个领域缺乏统一的标准和规范。解决方案在此背景下，库帕思提出了如下解决方案：上海交大行研院报告，引用注明出处 66 1.技术创新（1）构建数据语料的方法论。行业语料库、大模型以及机模所需的数据语料，基于世界知识体系和细分行业赛道进行切分和封装，根据用户设定的、基于具体概念分类、细分行业等符合世界知识体系的前置条件后，实现单位语料数据的智能引导定位。（2）构建数据语料库的国家标准。大模型要实现良好发展，首先要保证数据的安全、隐私；伦理价值观也非常重要，不能涉黄、涉政、涉恐；语料数据必须具备共情能力，并且要有丰富的知识含量。（3）行业语料汇聚。行业垂类大模型将是未来大模型领域的主战场。将世界通识、行业知识、专业知识中的语料数据标准化，并一次性做好。通过私有化部署，配合工具链平台，将整体数据用于训练、微调与推理。基于此方法论，来助力行业语料库建设，推动中国大模型发展。（4）打造国际领先的语料工具链平台。在人工智能时代和大模型时代，用几万人工去标注已经不合时宜，应采用 AI 自动标注与清洗的理念，打造“采、洗、标、测、用”工具链平台，解放人工进行标注的困境。通过自动算子、标注算子和清洗算子实现标注与清洗工作，聚焦高效率的采集、更智能的清洗、更精准的标注、更科学的测试、更个性的应用，极大提升工作效率与质量。 2.语料库建设库帕思围绕垂直领域编制一系列语料标准，聚焦具身智能、生命健康、科学智能和前沿稀缺语料四大板块的语料库建设。具身智能板块，库帕思已启动相关语料库建设标准修编，该套标准预计在 2025 年三季度完成发布；生命健康板块，主要通过由上海市经信委审批通过的“生命工厂”项目实施，该项目为医疗健康领域垂类的 AI 项目；科学智能板块，主要是围绕思维链路的预训练语料，主要指强化模型理解和模仿人类逻辑推理过程的语料；前沿稀缺语料板块，主要围绕红色及民俗内容。 3.平台搭建对标服务国家战略、按照上海市整体部署，聚焦高质量语料数据，库帕思发布两套语料服务专业化运营平台：（1）语料运营公共服务统一门户库帕思向客户提供一站式的高质量语料服务。按照开放性、链接型、市场化的总体要求，围绕“统一标准、统一门户、统一机制”的“1+N”运行框架，推动语料调用服务 Agent 化，同步完成上链。其中，“1”为公共的核心语料，包括世界知识体系和价值对齐体系。库帕思语料数据的供给始终围绕真实性、鲜活度、大样本的语料需求主线，结合模型特性，合理布局文本、多模态、小语种等多个维度。库帕思遵循分步走策略，从布局通用语料到发展面向 SFT（监督微调，Supervised Fine-Tuning）、 RLHF（人类反馈强化学习，Reinforcement Learning from Human Feedback）的语料，再到合成数据等三个不同的发展阶段。“N”为面向垂直应用领域等的专业语料，结合人工智能产业需求，打造“1 个语料基础设施平台公司+N 个各领域专业运营体”的运营格局。上海交大行研院报告，引用注明出处 67 （2）语料工具链平台库帕思发布语料工具链平台，延续“采、洗、标、测、用“五位一体”布局，完成 403 个功能模块，涵盖多模异构数据采集（采）、智能清洗算子（洗）、智能预标注（标）、评测数据集管理（测）和标准化语料交付（用）等核心功能，并在医疗、教育、金融、城市治理等垂直领域投入实战，兼具云化部署和私有化部署，完成与现有国产算力适配。工具链平台较增加合成数据功能，该功能将成为大模型能力提升的重要基础。 4.行业标准制定库帕思不仅是语料服务商，更是行业规则的制定者。针对业内缺乏统一的高质量数据集定义标准的问题，库帕思持续推动语料工作的标准创新。 2024 年世界人工智能大会上，库帕思会同覆盖多模态数据资源供应、加工、应用和运营全链的近二十家企业共同发布团体标准《语料库建设导则》。这是行业首个系统性的语料库建设标准，填补了规范空白。 2025 年世界人工智能大会“语料筑基智生时代”论坛上，库帕思集中发布了 10 项语料团体标准，并联合中国信通院共同发布 3 项行业标准、1 项高质量数据集建设指南，标准涵盖医疗、教育、金融、自动驾驶、科学智能、城市治理等多个方向，为行业发展提供了有实操价值的指导和参考，为“好数据” 确立可量化的评估标尺。在专利布局上，库帕思在国家知识产权局申请了“语料数据的清洗和质检方法、设备、存储介质及程序产品”专利（公开号 CN119128385A，申请日期 2024 年 9 月），该专利的核心在于有效提升语料数据的质量，对于 AI 领域尤其是自然语言处理（NLP）和知识图谱等应用具有深远影响。推广价值库帕思的定位是产业的“提质增效器”、行业的“规则制定者”、安全的“价值守门员”：产业的“提质增效器”：通过自主研发的 AI 工具链自动化完成语料的“采、洗、标、测、用”，大幅度降低高质量语料的生产成本，突破制约模型性能提升的瓶颈；行业的“规则制定者”：通过牵头制定语料库建设国家标准和团体标准，为“好数据”建立可量化的标尺，推动建立共建、共享、共益的产业新生态，避免无序低效竞争；安全的“价值守门员”：制定语料符合伦理规范和数据安全要求，为 AI 产业的健康、可控、可信发展奠定坚实基础。数据要素市场化不仅需要交易侧的制度创新，同样需要供给侧的基础设施建设。在此背景下，以库帕思为代表的定位为功能性语料基础设施平台的企业应运而生，顺应了 AI 产业从模型竞争向数据竞争这一必要趋势，不仅服务于当下模型的迭代优化，更是为未来我国在具身智能、科学智能等前沿领域的竞争储备至关重要的“数据弹药”。典型案例：图灵量子上海交大行研院报告，引用注明出处 68 图灵量子成立于 2021 年，是我国首家光量子计算公司。公司致力于以光子芯片和算法为底层基础，打造软硬一体的产品体系，面向全行业推出自主可控的解决方案，引领国内光量子计算技术实现从学科探索到商业化应用的跨越，驱动算力变革。图灵量子先后推出大规模可编程光量子计算机、薄膜铌酸锂片上光量子实验平台，以及量子安全与光连接系列产品。公司前瞻布局“量子计算+人工智能”，依托量子算法加速机器学习与优化计算，构建量子人工智能应用生态，为金融科技、生物医药、智慧交通等场景提供智能化解决方案。 AI 赋能场景 1：AI+生物医药行业痛点在新药研发领域，数据处理复杂、成本高昂的问题日益突出。CADD 药物筛选计算方法受 GPU 限制，难以应用于复杂药物－靶点模型体系；经典 AIDD 受限于数据库量级，精度低，难以处理高精度量子化学，无法达到精准设计；现有生物医药算法平台受到算力、计算精度、数据库的限制；国内缺乏通用的量子计算－生物医药平台；新药研发各环节涉及大量数据处理，消耗大量人力、物力和时间成本。解决方案图灵量子推出的“量生万物”智能平台，融合量子计算与人工智能技术，针对合成生物学、药物设计及抗原抗体设计等领域，集成药物筛选、靶点发现、先导化合物优化、新酶发现、底物匹配、酶从头设计、酶稳定性优化、酶活性改造、抗体人源化改造、抗原表位识别及新型抗体开发等核心功能；平台提供整体流程计算，串联研发验证、工艺优化与产业化；采用量子+经典混合算力架构，提供强大算力底座，解决传统算力瓶颈，融合多种量子计算算法及经典 AIDD 计算，实现更稳定的模型与更强的收敛能力；依托自主开发的底层软件生态，实现快捷高效的应用。推广价值图灵量子推出的“量生万物”智能平台，旨在通过量子+经典混合算力解决传统算力瓶颈，加速生物医药研发进程。平台已通过与中山医院、盟科、桦冠生物等单位合作实践，验证了其在算法精度与产业落地中的有效性；能够广泛适用于计算机药物发现、蛋白质生成等各类场景。 AI 赋能场景 2：AI+金融科技行业痛点金融科技领域每天产生海量数据，求解交易和投资组合管理中的组合优化问题，复杂度呈指数级增长；市场波动性大，投资者风险管理能力不足；金融产品和服务同质化严重，行业竞争加剧。解决方案量子计算凭借并行性、叠加性等量子力学原理，能够提供比经典计算更快、更准确的解决方案，为金融科技领域带来突破性变革。图灵量子通过量子软硬协同加持，提供强大算力，为金融业广泛存上海交大行研院报告，引用注明出处 69 在的投资组合优化、风险分析、信用评级、高频交易等场景，打造高性能解决方案。采用量子+经典混合异构算力，融合量子计算与人工智能，加速释放量子计算潜力，胜任大规模及高频应用的广泛金融场景；提供模块化服务，功能模块丰富多样，可便捷适配各类金融业务场景；核心量子软硬件高效协同，实现算力革命性提升；基于金融业务痛点需求开发，由专业团队高效对接生产数据，确保方案落地可行。推广价值可广泛应用于投资组合优化、量化交易策略、信贷违约预判、风险欺诈防范等金融场景，提升决策效率与准确性；通过量子计算加速复杂问题求解，助力金融机构在激烈竞争中构建差异化优势。目前，图灵量子已在“AI+金融科技”领域持续深耕，与多家金融机构合作，在欺诈防范、风控模型、投资组合优化等方面取得显著成果，通过技术融合有效解决传统金融风控与资产管理中的效率瓶颈。 AI 赋能场景 3：AI+交通行业痛点城市交通与智慧停车领域普遍存在停车难、寻车效率低的问题；自动驾驶代客泊车（AVP）缺乏高精度定位协同，影响落地应用；事故事件溯源难，安全隐患监管难，场内安防覆盖不完善。解决方案依托量子启发式算法与视觉感知技术，结合行为推理与预测预警综合判断能力，打造以室内高精度定位为核心的场端视觉分析解决方案，为智慧停车、自动驾驶 AVP 及智慧交通提供能力支撑；系统构成：包括 AI 视觉高精度定位与全息数字孪生系统、泊位导航与反向寻车系统、车牌识别与事件感知及辅助决策分析系统。推广价值智慧停车领域：提升停车场运营效率与用户体验，推动 AVP 技术落地，为大型商业综合体、交通枢纽等提供可复制的智能化升级方案；行业升级：以量子启发式算法融合视觉感知的创新方案，推动智慧交通与工业物流场景的智能化升级，具有广泛的应用推广价值。 AI 赋能场景 4：AI+量智融合行业痛点经典计算发展面临瓶颈，复杂问题处理低效，摩尔定律濒临极限；算力资源呈孤岛状，共享难、利用率低，跨域调度成本高；量子算力与经典算力互连需要极低延迟、极高速率的光网络互连；量子－经典计算软件生态碎片化，语言框架不兼容，开发适配成本高。解决方案量智融合的兴起恰逢“十五五”规划带来的战略机遇期，量子科技作为未来产业首位被纳入规划，定位从“十四五”的基础研究升级为“技术突破与场景应用并重”。量智融合正是落实这一规划的关键路径。上海交大行研院报告，引用注明出处 70 图灵量子以自主研发的新一代混合集成光量子计算系统为核心，融合传统通算、超算、智算中心资源，推出全栈自主可控的量子－经典混合智算解决方案；通过量子计算融合云平台、量子人工智能编程框架搭建上层平台；基于全栈自主可控芯片构建光量子计算系统底层支撑；通过光连接与经典计算共同构建量子－经典大规模混合集群。推广价值落实国家战略：顺应“十五五”规划方向，推动量子科技从基础研究走向技术突破与场景应用并重，量智融合成为关键落地路径；赋能重点行业：构建面向金融、生物医药、人工智能、航空航天、交通等重点行业的高效算力服务体系，满足多样化计算需求；突破算力瓶颈：通过量子－经典混合算力，实现 QPU 与 CPU/GPU 协同，突破传统算力孤岛，提升复杂问题处理效率与资源利用率；降低开发成本：统一云平台与编程框架，解决软件生态碎片化问题，大幅降低开发适配成本，加速行业应用落地。图灵量子聚焦“AI+量智融合”前沿领域，加速量子计算模拟与经典算力深度融合，构建开放协同、自主可控的混合算力新生态，为人工智能前沿研究提供高效算力支撑，引领量智融合的产业化落地。 AI 赋能场景 5：AI+四算融合行业痛点通用量子计算受限于比特规模与纠错技术，难以实现大规模实用化；单一算力（如仅靠经典计算或仅靠量子计算）难以满足复杂应用场景的多样化需求。解决方案四算融合架构：以量子计算与超级计算、智能计算、通用计算的深度协同为核心，将人工智能深度融入四算体系，充分发挥量子计算的并行处理能力突破经典算力极限，同时依托传统计算的成熟生态保障运算稳定性；核心研发内容：与陕数集团开展可编程光量子计算机 QPU、应用算法及云平台研发，围绕量子计算产品、量子人工智能框架、经典—量子混合计算平台、应用层、量子加密产品五大核心单元进行技术攻关；关键技术突破：攻克大规模光源、可扩展芯片设计、高效单光子探测、量子 —经典算力融合等关键技术；通过全电量子随机数和抗量子密码技术研究，实现国内领先的安全水平。推广价值填补空白：发布陕西省首个四算融合数据中心，填补了省内新质算力基础设施空白，为区域算力发展提供示范；技术引领：攻克多项国际先进水平的关键技术，在量子计算产品、混合算力平台及量子加密安全等方面实现国内领先；标杆范式：为区域算力基础设施建设和产学研协同创新提供可复用的标杆范式，为人工智能技术的深度应用奠定坚实的算力基础。 AI 赋能场景 6：AI+量子安全行业痛点目前市面上部分高端芯片设计可能存在绕过操作系统直接与外部通信的潜在风险，增加了数据泄上海交大行研院报告，引用注明出处 71 露和远程操控的威胁；算力基础设施面临“追踪定位”、“远程关闭”与“数据转发”三大核心安全漏洞；口芯片存在不可控的后门和漏洞风险，亟需自主可控的算力安全保障。解决方案核心技术组合：以量子真随机数技术为核心基础，融合抗量子密码算法（PQC）与国密算法，突破量子随机源微型化、抗量子混合加密等关键技术，实现信源级加密；环境安全场景：将量子加密模块与传统加密网关一体化设计，整合传输与加密功能，实现快速部署与便捷运维，适配各类网络环境，有效提升数据传输安全性；数据安全场景：研制 AI 服务器专属 HSM（硬件安全模块），内置量子加密芯片，实现可信启动、程序和模型数据加密、模型数据防复制等功能，为 AI 服务器提供安全基石；动态防御能力：量子 HSM 模块可实时监测系统状态，一旦检测到异常行为，立即触发安全响应机制，阻断潜在攻击。推广价值技术自主可控：通过一系列加密软硬件产品，有效规避进口芯片的追踪定位、远程关闭及数据转发风险，为亟需中国算力芯片的企业提供安全保障；产业引领作用：实现全链条自主可控的 IDM 模式，推出 TuringQ Gen2 大规模可编程光量子计算机等核心产品，推动我国量子科技产业化进程；战略安全价值：为后摩尔时代的算力发展提供光量子计算新路径，从底层降低“远程操控”与“数据窃取”等系统性风险，筑牢智能时代的数字根基。 AI 赋能新材料产业引言在“十五五”时期，我国将新材料视为构筑新质生产力和实现产业基础高级化的核心先导产业。《“十五五”新材料产业发展规划》以“自主可控、绿色低碳、前沿引领”为主线，系统部署了从基础研究、技术攻关、产业转化到规模应用的全链条任务，将在 2030 年把我国建设成为全球新材料创新高地和重要策源地。通过政府专项基金、税收优惠、产学研合作等方式，推动我国人工智能+新材料产业加速发展。行业痛点传统材料创新依赖经验积累与反复实验，研发周期长、成本高、成功率低，科研成果与产业应用之间往往存在明显断层。尽管材料产业需求快速增长，但其研发模式长期存在结构性瓶颈。首先，材料体系通常具有高维变量空间，成分比例、微观结构、加工工艺与服役环境相互耦合，传统研究需要通过大量实验逐步排除错误方向，周期往往以年甚至十年计。其次，实验数据分散在不同设备与团

联系我们

智库文档公众号

客服微信

2026“人工智能+”行业发展蓝皮书.pdf

下载

标签

联系我们

意见反馈