下一代视联网愿景、技术
能力与应用场景白皮书
(2025 年)
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
前 言
视联网作为信息技术领域的重要组成部分,是促进数字经济生活,
生产全面升级的新型信息服务基础设施,是深入政府治理和行业应用
的新生产要素。
本白皮书旨在面向“十五五”产业布局及发展,结合中国移动及
产业内合作伙伴对视联网发展现状及演进动力、下一代视联网发展愿
景及演进理念,为实现愿景所必需的关键技术能力,以及下一代视联
网典型场景和应用进行分析,对产业发展提出倡议。希望深化与产业
链各环节协同,为视联网相关技术、产品及解决方案的发展与落地提
供参考与指引。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
目 录
1. 视联网发展现状与演进动力 ......................................................................................... 1
发展现状 ............................................................................................................ 1
演进动力 ............................................................................................................ 1
2. 下一代视联网发展愿景及演进理念 ...............................................................................6
发展愿景 ............................................................................................................ 6
演进理念 ............................................................................................................ 7
3. 下一代视联网关键技术能力 ....................................................................................... 11
资源融合层关键技术 .........................................................................................11
基础能力层关键技术 .........................................................................................16
业务赋能层关键技术 .........................................................................................21
智能内生关键技术 ............................................................................................ 25
全域可信安全关键技术 ..................................................................................... 26
4. 下一代视联网典型应用场景 ....................................................................................... 29
智能视频监控类 ................................................................................................29
远程控制类 .......................................................................................................30
实时音视频类 ................................................................................................... 32
视联数字孪生类 ................................................................................................34
低空视联类 .......................................................................................................35
具身智能类 .......................................................................................................37
智能网联车类 ................................................................................................... 38
5. 发展倡议 ................................................................................................................... 40
缩略语列表 .................................................................................................................... 41
参考文献 ........................................................................................................................42
编写单位及作者 ............................................................................................................. 43
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
1. 视联网发展现状与演进动
1
力
发展现状
我国的视联网已在安防监控领域取得显著成就,广泛应用于智慧家庭、智慧园
区、智慧城市等场景,视联网成为信息技术领域的重要组成部分,是深入政府治理
和行业应用的新生产要素,也是促进数字经济生活、生产全面升级的新型信息服务
基础设施。但随着设备覆盖率的提升,整体市场发展趋于稳定,增速有所放缓。
与此同时,随着 5G 移网、千兆光网、云计算等数字化基础设施的加速普及,
视频码率的逐步提升,以及 AI、大数据等前沿技术的加速革新,视频业务与各类垂
直行业的连接日益紧密,尤其是低空、具身智能等新兴场景带来广泛的视频接入、
传输和智能化处理需求。视频生态圈快速拓展,加速赋能千行百业智能化转型。
在视联网业务发展初期,烟囱式的发展模式曾导致不同应用之间形成孤立的状
态,各自为政,缺乏有效的互联互通和资源共享。但随着技术的发展和市场需求的
变化,目前这种局面开始转变,泛视频业务和技术发展逐渐走向融合,并持续催化
视频场景、业务模式、服务形态和技术能力的革新,推动视联网持续创新发展。
演进动力
政策引领驱动
在国家顶层设计中,视联网的构成要素和发展路径已嵌入多个纲领性文件。《中
华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》(简
称“十四五”规划)明确提出“加快建设新型基础设施”,系统布局“信息基础设
施、融合基础设施、创新基础设施”,建设“高速泛在、天地一体、集成互联、安
全高效的信息基础设施”。这一布局为视联网构建全国性、高密度、高可靠的视频
信息服务基础设施奠定了基调。《“十四五”数字经济发展规划》将“云网协同和
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
算网融合发展”作为关键任务,并指出要加强边缘计算能力,强化算力统筹和智能
调度,为视联网支撑超高清视频、智能分析、多模态交互等核心能力提供了算力保
障与技术融合基础。与此同时,《数字中国建设整体布局规划》进一步强调要“打
通数字基础设施大动脉”“畅通数据资源大循环”,为视联网打破“数据孤岛”、
实现视频数据要素市场开发和价值挖掘提供了管理和政策支撑
2
。
在专项政策层面,2025 年工业和信息化部印发的《算力互联互通行动计划》首
次将“视联网”列为推动算力互联的典型企业级场景,标志着视联网从通信应用范
畴正式步入国家级“关键应用体系”。此外,国家广电总局推动的“智慧广电”乡
村工程、全国有线电视网络整合与“千兆城市”建设行动,正在共同打造一个可承
载亿级视频终端、高质量数据流通的智能信息网络。
更进一步的是,2025 年 8 月 26 日国务院正式发布的《关于深入实施“人工智
能+”行动的意见》,为“人工智能+”与经济社会的深度融合提供了新的政策引领。
该《意见》明确提出强化 8项基础支撑能力,包括提升模型基础能力、强化智能算
力统筹、优化应用发展环境等与视联网发展强相关的内容,对视联网的建设具有重
要推动作用。
整体来看,我国已构建起以“战略引领+专项推进”为核心的政策支撑体系,
为视联网的加速建设与规模化落地提供了坚实制度基础与资源倾斜条件。
业务需求驱动
回顾视联网的发展历程,从模拟/数字时代的基础诉求“看得见”,到万物互联
时代“看得清”“看得全”,用户需求始终是行业发展的最大动力。当下,视联网
已进入智联孪生时代,视频的“社会化”和“高清化”趋势以及视频业务的“智能
化”和“沉浸式”趋势,推动“看得懂”“能预见”“身临其境”成为视联网下一
阶段发展的需求导向。“看得懂”着重解决从海量的汇聚数据中快速提取有价值信
息的需求,助力业务精准分析和高效响应。“能预见”反映了用户需求从被动观察
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
向主动洞察的转变,希望不仅能事后追溯而且可以事前预判,将主动防控价值最大
化。“身临其境”则是在体验层面的更高追求,强调打破时空限制,通过沉浸式、
交互化的方式提升远程协作和服务的真实感和参与感
3
。
与此同时,来自个人与家庭市场的音视频互动场景需求也在不断叠加并驱动视
联网的发展:在社交与娱乐方面,用户希望能享受更高画质、更低时延的实时视频
互动,拥有多人连线、沉浸式直播、XR 演艺等新兴体验;在家庭生活辅助方面,
家庭监控、远程陪护、智慧康养、智能家居联动等应用正推动视联网成为日常生活
的“安全管家”和“贴心助手”;在学习与工作方面,个人用户越来越依赖多模态
交互和远程协作能力,跨屏、跨空间的沉浸式学习与高效办公成为刚需。
另外值得注意的是,安全已成为贯穿上述各类场景的底层共性需求。它涵盖了
终端可信、数据隐私保护、AI 服务可控等多个方面,不仅是个人与家庭用户信赖的
保障,也是行业与政企客户大规模部署视联网应用的前提条件。移动运营商在这一
领域拥有全域网络基础设施和身份认证体系的独特优势,“安全可信”成为视联网
的重要差异化价值。
总体来看,业务需求正不断拉动视联网从“终端连接”到“数智赋能”,从“场
景应用”到“体验升级”,从“满足使用”到“安全可信”。未来,视联网不仅要
持续满足行业与政企市场的需求,更要深度回应个人与家庭对社交、娱乐与生活辅
助的诉求,并以安全可信为底层保障,聚焦提供更聪明的服务、更沉浸的体验,以
及更具前瞻性的能力支撑。
技术演进驱动
以视觉大模型、数字孪生、多模态交互等为代表的新兴媒体服务不断涌现,并
呈现智能化、沉浸式、强交互的特点,这些特点要求视联网在基础网络和媒体服务
方面提供超高通信能力、超强算力以及智能算法处理能力。在经典的网媒分离范式
下,通信、计算、算法三大能力存在瓶颈,难以支撑沉浸式通信发展。移动网络和
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
移动多媒体技术国家重点实验室提出网媒融合这一变革性技术,旨在突破“管道化”
传统思维,集成“通感算智存”统一调度能力,研究网络传输与媒体产生、呈现的
融合,实现全局动态最优,最终跨越三大性能瓶颈
4
。
与此同时,6G作为引领未来信息通信技术革新的关键节点,其标准制定和实验
验证正在加速推进,2030 年左右实现商用已成为产业共识。在 IMT-2030(6G)推
进组、3GPP 和 ITU-R 的相关研究框架中,“感知通信一体化”“AI 原生网络”“智
能分布式服务”被明确列为核心能力方向。视联网与 6G网络在架构理念上具有高
度耦合性——一方面,视联网可作为 6G网络低空、地面与泛在终端感知的重要入
口,反哺其智能调度与 QoS 保障;另一方面,6G 具备超低时延、泛在连接、内生
智能的特点,为视联网实现全场景泛在融合的服务体系提供网络底座。两者将在未
来 10 年深度融合,构建“通感算智存一体”的信息服务新范式。
通信、计算、视觉等传统 ICT 领域的技术创新持续深化,为视联网筑牢底层能
力根基;人工智能、沉浸式交互、数字孪生等跨学科技术与多行业场景加速融合,
为视联网拓展创新边界。两者共同作用,不仅为视联网实现多领域技术协同创新提
供了核心动力,也为其精准匹配垂直行业需求、推动相关标准协同演进奠定了关键
支撑。
成本效益驱动
视联网业务的规模化发展长期受制于带宽、计算与存储三类资源需求持续攀升
与供给离散、峰谷不均的结构性矛盾,破解这一瓶颈并使得“成本效益最优化”是
视联网演进发展最大的内生驱动力。以统一业务承载为牵引,贯通端、边、云与数
据要素,通过资源池化与智能编排、能力服务化与智能运维、数据资产化与合规开
放,构建“降本—增效—创收”的闭环治理与增长机制,使成本效益平衡的高质量
发展成为可能。
降本的核心在于以统一资源供给方式,提升带宽、算力与存储的平均利用率并
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
削峰填谷。通过对网络、媒体处理能力、算力、存力的池化与切片,实现跨域弹性
编排与按需供给,结合面向 SLA 与 QoE 阈值的自适应“成本路由”,在满足时延与
稳定性目标的前提下降低资源成本。同时将资源消耗与场景、租户、项目关联透明
化结算,叠加动态调度及一体化智能运维降低人力与运维支出,实现业务成本的系
统性下降
5
。
增效的关键在于以业务解耦与能力服务化提升组织与技术的交付效率。通过将
核心基础能力与业务能力标准化、原子化并沉淀为可复用服务,缩短新场景上线周
期并降低耦合成本,通过跨域协同的资源编排与多业务、多租户的差异化保障与确
定性服务提升整体资源产出效率与体验一致性,从而在同等资源规模下承载更多、
更复杂的业务。
创收的着力点在于以数据与能力的统一运营实现价值外溢。通过构建一致的媒
体能力、智能服务和数据价值挖掘体系,面向个人家庭、政企行业、低空视联、工
业视觉、会议通话与沉浸式协作等场景,提供网络与媒体能力、模型推理与数据服
务的产品矩阵,构建持续增长的收入曲线,并与“人工智能+”等战略导向形成正
反馈。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
2. 下一代视联网发展愿景及演进理
6
念
在政策引领、业务拉动、技术融合和自身成长的四重驱动下,叠加智能化浪潮
与数实融合加速交汇的时代背景,视联网正以全新的形态重塑信息服务基础设施的
边界与能力。为把握战略窗口,引导规模化和高质量发展,亟需从全局视角系统规
划下一代视联网的发展愿景与演进理念。
发展愿景
面向未来,视联网不仅需要拓展多要素融合的“看见”维度,扩大基于终端、
数据和智能的“连接”内涵,更需要通过智能感知重构“认知”方式,并催生创新
场景不断涌现。下一代视联网的目标是构建“感知泛在、连接泛在、智能泛在、业
务泛在”的视频信息服务基础设施,以视频为纽带,融合通信、感知、计算、渲染、
认知等多重能力,覆盖采集、传输、处理、存储、分析、服务与价值挖掘全生命周
期,实现业务由内容向服务的智能化跃升,其愿景是以视频为核心重塑信息服务模
式,成为推动数字经济的引领者、赋能社会治理的守护者、点亮美好生活的创造者。
四个“泛在”并非割裂存在,而是层层递进、相互支撑:感知是基础,连接是
通道,智能是核心驱动,业务是最终呈现。
感知泛在:构建无处不在的多模态信息采集处理体系。通过空、天、地等多
源异构平台的融合部署,突破空间限制,实现对不同维度的场景覆盖,同时
保障复杂条件下的持续感知。融合图像、语音、雷达、光学、红外等多模态
数据,针对城市、交通、工业、农业等关键领域,消除感知盲区,达成全场
景动态监测。借助边缘智能与泛在计算的协同处理机制,实现实时数据的高
效处理与价值提炼,为全域智能感知提供基础支撑。
连接泛在:构建开放、敏捷、安全可信的多维泛在连接体系。以智能终端、
异构网络和模态融合为基础,构建立体连接能力。通过多形态终端的无感接
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
入与统一管理,实现人、机、物、环境的全面联接;基于空天地全域网络协
同,构建全空间、全时段、跨域覆盖的连接通道,打破物理边界限制;融合
视频、语音、文本、控制信令等多模态通道,打通信息、计算、感知与交互
的系统链路。
智能泛在:构建以智能驱动的自组织服务体系。下一代视联网将原生具
7
备
AI 能力,打造自主感知、智能决策、人机协同、持续进化的智能服务体系。
从边端智能体的本地决策,到云端大模型的全局优化,构建面向任务的智能
调度体系,支撑复杂环境下的多智能体协作与资源弹性编排。这一体系将推
动服务形态从“响应式”向“主动型”演进,实现信息服务在系统中的自发
现、自推荐与自适应匹配。
业务泛在:构建以视频为核心的融合化业务承载体系。随着视频能力从辅助
工具演进为行业数字化转型的核心驱动,其作用全面拓展至内容采集、感知
分析、呈现渲染与场景应用等业务全流程,成为多行业融合创新的新范式。
依托视联网多维感知、泛在连接和智能服务能力,各类业务可灵活接入、高
效调度与智能协同,在沉浸式互动、低空巡检、具身智能等创新应用场景中
落地实践,视联网正加速推动产业边界重构,迈向视频业务与实体经济深度
融合、全场景价值渗透的新阶段。
演进理念
当前视联网的发展已进入深水区,传统架构和模式难以满足未来愿景发展需求,
下一代视联网的架构演进亟需在资源协同、网络服务、业务决策和场景服务四大维
度实现根本性范式跃升。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
从“资源分散独立”到“全域融合协同”的范式跃
8
升
传统视联网资源分散、协同效率低,导致利用率不高、时延难控、运维复杂。
下一代视联网将通过“全域资源融合协同”重构底座,实现资源统一视图与智能调
度,提升利用效率、降低时延,并为上层应用提供一体化按需供给。
资源池化与抽象化:将全域资源,包括网络连接能力(如带宽、QoS)、计
算能力(如 CPU/GPU/NPU 等异构算力)、媒体服务能力(如转码、渲染、
合成)、AI 服务能力(如视觉分析、语音识别、内容理解)、存储能力(如
热/温/冷数据存储)等进行池化管理和抽象化封装,最终形成全局、统一的
资源视图,为上层调度提供基础。
跨域感知协同:建立跨资源域(网络、计算、媒体、AI、存储)的实时、
自动化状态感知与信息共享机制。例如,网络能实时感知计算负载,计算能
动态感知网络时延,AI 能无缝调用媒体处理结果等,实现资源间的深度理
解与协同响应。
能力统一编排:引入智能的统一编排引擎,深度理解业务需求(如 SLA、
QoE)并基于全域资源的实时状态,进行跨域资源的协同调度与最优组合。
例如,面向低时延互动直播业务,编排引擎能自动选择最优的网络路径、邻
近的边缘计算节点进行实时渲染、调用合适的 AI 模型进行内容增强,并就
近提供媒体流分发。
从“网络适配业务”到“业务定义网络”的范式跃升
传统网络服务由底层设施主导,业务只能被动适配,难以保障高清直播、远程
协作等差异化需求。未来视联网将转向“业务定义网络”,以业务需求驱动网络能
力规划,实现确定性服务保障与极致体验。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
场景化业务网络:通过动态组网技术为差异化场景构建专属逻辑子网,彻
9
底
改变传统视联网资源分配 “一刀切” 的僵化模式。针对场景特性定制网络
拓扑、资源调度规则,例如为体育赛事高清直播场景打造 “大带宽 - 低
抖动” 子网(优化视频帧分片与传输优先级策略),确保高清信号稳定传
输;为远程手术等低时延交互场景构建 “边缘本地化” 子网,将计算与转
发节点部署在终端近场,确保端到端时延达到手术级交互要求。业务子网与
通用网络保持协同联动,同时具备场景化的自主决策能力,从网络层位业务
的精准、可靠落地提供坚实支撑。
精细化业务保障:通过多维感知数据、AI 细分场景、差异化保障策略的全
流程协同,构建从需求捕捉到策略执行再到服务落地的服务体系,为不同业
务提供精细化的服务质量保障。依托用户体验环境感知(如终端能力、用户
位置)、业务特征感知、网络状态感知的多维数据采集能力,实时捕捉业务
的动态需求;结合 AI 驱动的精细化识别引擎,克服传统简单分类的局限,
精准、实时识别业务类型及其高度细分场景(例如体育赛事转播的 “精彩
回放镜头”与“普通比赛进程”)。在此基础上,基于事实感知与识别结果,
通过智能调度模块动态生成并执行差异化的网络保障策略。这种 “一业务
一策略” 的保障模式,彻底解决传统网络中资源错配、体验波动的问题,
让每个业务的流畅性、清晰度与稳定性都得到确定性满足,从根本上消除网
络对业务创新的掣肘,释放视联网的业务创新潜力。
从“外挂式智能辅助”到“多模态智能内生”的范式跃升
以往智能仅是外挂辅助,难以深度融入业务与网络。下一代视联网将实现“多
模态智能内生”,通过智能体和大模型驱动的自治与闭环优化,使 AI 成为网络和业
务的内生能力。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
网络协同自治:通过对云边端各节点中海量、多态、异构数据的收集、处理
10
,
进行基于数据的智能分析和趋势预测,精准挖掘网络运行状态与业务需求特
征。并依托基于大模型的智能体技术实现对算法/模型、数据资源、算力资
源和连接资源进行无缝协同调度。最终通过深度理解任务需求、科学规划需
求落地路径、智能调用适配工具,高效完成自主决策,支撑网络在复杂场景
下的动态优化与高效运转。
业务智能闭环:通过对音视频业务的感知与理解,从媒体采集、处理、传输
等全链路进行智能化升级。由原生 AI 处理引擎对业务处理流水线进行智能
编排,通过业务需求的精细化识别和感知,动态规划媒体传输路径和资源分
配调度,并通过采集和感知数据综合评价业务当前质量和体验效果,动态进
行优化提升,形成“感知-调度-评价”的智能闭环和一体化保障体系。
从“单一场景服务”到“全场景泛在融合”的范式跃升
现有视联网多局限于单一场景,能力复用性低、拓展成本高。下一代视联网将
走向“全场景泛在融合”,通过统一平台和灵活能力组合,实现多领域快速集成与
跨场景协同。
从点到面,支撑多元场景融合:从城市道路的智慧巡查,到工厂车间的远程
控制,再到个人文旅场景的沉浸导览和社交互动,视联网正逐步渗透至生产
生活的全链条,成为数字社会的重要基础设施。
从分散构建到统一承载:通过统一平台支撑直播、点播、实时通话、互动协
作、智能处理等多种业务,减少重复建设,提升资源利用率和服务一致性。
从单一服务到按需组合:视频采集、处理、智能分析等核心能力可以按需组
合、灵活调用,让不同场景下的服务快速上线、精准匹配业务需求。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
3. 下一代视联网关键技术能
11
力
面向下一代视联网发展愿景,当前亟需对资源与网络协同模式、感知与智能连
接机制、技术承载与赋能体系进行系统性重构。这一进程要求一系列基础通用能力
进行革新,并深度融合视频通信、智能计算、感知理解与安全可信等关键技术能力。
通过技术能力升级,为视联网下一步技术架构演进和千行百业数智化转型,构筑坚
实的信息服务技术基础。
图 1:关键技术图谱
资源融合层关键技术
面向下一代视联网的高效能、低时延和强韧性需求,通感算智存融合底座与分
布式视联网络双核驱动,在架构层面实现资源要素的深度融合与智能调度,构建可
持续演进的核心资源底盘,支撑未来多场景、多行业的智能化应用与生态拓展。
通感算智存融合底座
在传统视联网系统中,通信、感知、计算和存储往往分散部署、独立运行,导
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
致硬件资源重复建设、空间占用大、能耗高,且信息在感知、传输、计算、决策等
环节之间多次搬移,带来高时延与低效率。面向未来远程控制、视联孪生等对实时
性与智能化要求极高的应用场景,通过引入通感一体、存算一体、视算一体、云边
端协同、异构算力协同等技术,打破传统“烟囱式”架构,实现多种资源要素的深
度融合与统一调度,显著提升资源利用率和系统整体性能,为下一代视联网构建高
可靠、低时延、智能感知与实时决策的核心资源底座
12
。
通感一体
随着视联网在低空视联、远程操控、智慧安防等场景中的应用不断扩展,传统
通信与感知能力的割裂部署已无法满足实时、高精度的环境感知与可靠传输需求。
通感一体技术通过在同一频谱和硬件平台上实现通信与感知功能的深度融合,使网
络节点既能完成高速数据传输,又能主动感知环境目标和动态变化。通过波形共设
计、信号协同处理和感知数据回传优化,通感一体技术不仅提升了频谱利用率与感
知精度,还显著降低了链路时延与系统复杂度,为视联网实现空天地一体化全域感
知与确定性通信提供了关键能力支撑。
存算一体
在视联网的全生命周期中,大量视频与感知数据需要长期存储与频繁调用,传
统存储与计算分离架构造成数据在存储设备与计算单元之间频繁传输,增加了延迟
与能耗。存算一体技术将计算单元直接嵌入存储设备,使数据在“存储即计算”的
模式下完成检索、筛选、特征提取等处理,极大减少了数据搬移过程。结合非易失
性内存、分布式文件系统与 AI 近数据计算框架,存算一体不仅提升了数据处理的并
发性能和能效比,还为视联网实现大规模视频检索、事件回溯与在线智能分析奠定
了高效能的数据基础设施。
视算一体
在超高清视频、虚实融合和视联孪生等业务中,海量视觉数据的实时分析已成
为视联网的核心挑战。视算一体技术不仅实现视觉采集与计算处理在架构层面的深
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
度融合,更将智能和计算能力前置到视频链路的最前端,实现图像预处理、特征提
取和智能分析的就近完成,减少原始视频回传带来的带宽压力和延迟累积。依托边
缘智能芯片、视频 AI 加速引擎与模型轻量化部署,视算一体不仅提升了视频业务的
实时性与智能化水平,还为事件驱动传输、内容安全审查、视觉语义理解等关键能
力提供了基础,成为视联网实现高效视觉服务的重要支点
13
。
云边端协同
面对视联网中多样化、分布广泛且实时性要求极高的业务需求,单一计算层级
已难以满足性能与成本的平衡。云边端 AI 协同智算技术,结合下一代视联网终端的
“感知驱动-原子编排”双维升级架构,实现 AI 推理任务的动态分配与跨层级按需
协同。云端负责全局模型训练与复杂分析,边缘侧承担低时延推理与本地数据处理,
终端则执行轻量级感知与即时决策。借助统一的任务调度框架与模型分发机制,该
技术不仅降低了传输时延与带宽占用,还增强了系统对突发事件的响应能力,使智
能成为分层架构的内生属性,为工业控制、无人巡检和智慧出行等场景提供灵活且
可扩展的智算支撑。
异构算力协同
视联网业务运行在包含 CPU、GPU、NPU、FPGA、ASIC 等多种计算架构的异
构环境中,不同任务对计算精度、延迟、能耗的要求差异显著。异构算力统一调度
技术通过构建跨硬件平台的抽象算力池与智能调度引擎,根据任务特性、算力状态
与业务优先级进行最优资源匹配与动态迁移。结合算力虚拟化、调度算法优化与实
时监控反馈机制,该技术能够显著提升异构算力的综合利用率与业务执行的确定性
性能,为视联网在多模态处理、视频 AI 分析与高并发场景下的稳定运行提供核心保
障。
分布式视联网络
随着视联网向超高清化、云化、智能化加速演进,业务类型由传统安防监控拓
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
展至政务、工业、文旅、个人娱乐等多元领域,业务流量与连接形态呈现出大规模、
动态化、弹性化特征。多样化的场景需求使差异化承载成为核心诉求,对此,中国
移动布局“一通多专”的专网体系——“通”指面向中小企业和个人用户、具备低
成本视频能力的通用网络,“专”涵盖政务、公安、工业等高价值、高保障场景的
专用网络,两者协同构建多元化的视联网服务生态
14
。
面向未来泛视频业务的融合承载需求,需构建更灵活的分布式业务承载网络技
术体系。分布式承载网络以视联网业务为核心,按需分布式组网,子网内独立承载,
子网间互联互通。依托空天地全域连接、业务驱动动态组网、网内自治、网间协同、
确定性服务与差异化保障等关键技术,实现从“网络固定供给”向“网络按需响应”
的根本转变,显著提升业务体验与资源利用效率,支撑“一通多专”体系的持续深
度拓展。
图 2 下一代视联网网络形态
空天地全域连接
空天地全域连接技术是分布式业务承载网络的基础,通过融合卫星通信、低空
无线网络、地面蜂窝网络,实现跨域、跨介质的无缝接入与切换。该技术依托多制
式接入融合网关与智能路由选择算法,根据业务类型、网络状态与用户位置动态选
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
择最优链路,确保视频业务在跨域移动过程中的连续性与稳定性。在低空巡检、海
上监测、远洋航运等场景中,该技术可显著降低链路切换时延,避免视频中断或质
量波动,为视联网在极端环境和全域感知任务中的可靠运行提供基础保障
15
。
业务驱动的动态组网
通用网络针对个人用户与中小企业客户“低成本、灵活接入”的诉求,提供视
频优先的网络能力,满足其视频监控、云办公等基本需求。针对特定保障场景,利
用业务驱动动态组网能力进行定制化承载保障。业务驱动组网能力采用模块化封装
技术将接入、计算、路由规划、AI 能力等功能拆解为最小服务模块单元,通过单元
间解耦,确保各单元可独立部署、调用,某一单元的迭代升级不会对其他服务产生
影响。针对需要特殊保障的特定场景,依托智能编排技术实现网络动态构建,生成
适配业务场景的子网。该技术充分发挥边缘智能与分布式资源协同优势,结合机器
学习、数字孪生等前沿技术,实现业务需求驱动下,算力、接入、路由及 AI 能力
等资源的智能动态协同组网,有效提升网络服务的灵活性,为视联网业务提供坚实
支撑。
网内自治
网内高度自治技术包括动态自治、资源优化与独立运行的综合能力。依托 AI
算法与专家知识库,网内实时监测硬件故障、信令风暴等异常场景,通过数字孪生
模拟定位问题根源并快速隔离故障节点,自动触发备用资源切换以恢复业务,减少
人工干预并提升故障响应速度;通过实时性能监测与负荷分析,精准掌握网元资源
使用状况,在视频流量高峰时自动扩容边缘节点算力、低谷时收缩资源,在保障服
务质量的前提下实现能耗最优;同时支持业务子网脱离外部依赖,凭借子网内的算
力、存储与决策系统持续提供服务,即便外部网络出现波动或故障,也能确保应急
指挥视频会商等关键业务的连续性与可靠性,有效应对复杂环境下的各类网络风险。
网间协同
网间深度协同技术以安全为基础,以智能化资源调度机制为核心,满足视联网
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
跨域业务协同的刚性需求。感知层面通过分层协同的多维感知体系,实现网络状态、
业务特征等感知数据的安全共享与融合,打破信息孤岛,为协同决策提供全方位输
入;算力资源层面依托池化技术整合各子网边缘算力资源,根据业务负载动态分配
以避免单点过载,提升整体算力利用效率;智能层面借助智能体协同架构,网间智
能能力互补联动,形成全域智能体系,增强对复杂业务场景的适配能力
16
。
确定性服务
确定性服务技术通过在时延、抖动、丢包率等关键性能指标上设定可验证的上
限,提供端到端可预测、可保障的网络性能。依托网络切片、时间敏感网络(TSN)、
优先级调度等机制,在传输路径、节点处理和调度策略等环节提供全链路保障,确
保远程工业控制、应急指挥、超高清视频直播等业务在复杂网络环境下的极致稳定
性。该技术标志着视联网从“尽力而为”向“确定性可达”转变,将大幅提升用户
体验和业务可靠性。
差异化保障
差异化保障技术面向多行业、多场景业务需求,按业务类型和优先级提供定制
化承载策略。在资源分配层面,利用 AI 驱动的业务识别与策略引擎自动匹配最优的
带宽、时延、算力与安全配置;在调度层面,通过动态策略下发与实时调整,确保
政务安防、工业制造、文旅直播、个人娱乐等不同业务在并发环境下均能保持最佳
体验。该技术既提升了网络灵活性与适配性,也为运营商精准运营和价值变现提供
了重要抓手。
基础能力层关键技术
面向下一代视联网的感知泛在、连接泛在和智能泛在的演进需求,基础能力体
系以视联感知、视联编码、视联传输为核心技术方向,覆盖从多维信息采集、智能
压缩处理到低延迟、多模态传输的全链路能力。这些能力协同作用在泛在业务场景
中,为千行百业数字化升级提供可复制、可扩展、可持续的基础能力底座。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
视联感
17
知
在视联网的演进过程中,感知能力是实现业务智能化和沉浸化的首要环节。随
着业务需求从基础监控向沉浸式交互、实时控制和环境理解不断升级,传统的单模
态、像素驱动的感知体系已难以满足高精度、高时效、多场景的应用需求。下一代
视联感知技术正从“像素采集”向“语义理解”转型,通过终端感知、视频感知、
多维感知、多模态数据融合及多模态数据检索等关键技术的协同,构建覆盖采集、
理解、存储与调用全链路的智能感知能力体系,为后续智能分析与决策提供高质量
数据支撑。
终端感知
视联网终端依托统一终端协议,搭建一体化的终端感知网络,实现终端运行状
态与网络数据的全面感知。通过集成 SDK 解决方案,实时精准采集终端设备 CPU/
内存负载、电池续航、算力、日志等终端数据,以及终端网络上下行带宽、延迟波
动、丢包等网络数据。利用 AI 智能算法对海量终端数据进行深度挖掘分析,构建终
端状态与网络环境的关联模型。终端感知技术不仅可以快速定位异常问题根源,还
能为终端算力动态调度提供数据支持,从而为视联网的大规模部署奠定坚实基础。
视频感知
面向超大规模视频业务对低延迟、高精度的核心需求,视联网的视频感知技术
通过将语义建模深度嵌入视频采集、传输全流程,实现对传统模式的革新。在视频
捕获环节,该技术通过内置的多模态感知模块,同步完成语义特征提取和生成结构
化信息。在后续传输与存储环节主动保留与业务场景强相关的核心信息,以此大幅
降低数据传输体量与网络承载压力。这一技术不仅直接提升了视频数据的传输效率
与实时处理速度,更为视联网下游智能分析环节提供了精准的语义级输入,支撑超
大规模视频业务的高效运转。
多维感知
在沉浸式、实时交互等业务场景中,单一模态感知已无法全面描述复杂环境。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
多维感知技术通过融合图像、视频、雷达、音频、温湿度、压力、位置信息等多类
型传感数据,形成高精度、多角度、全方位的环境理解能力。依托高精度传感器集
成、实时信息融合和多模态感知算法,系统能够在多变且复杂的环境下保持鲁棒性
和准确性,支持全息通信、智能监测等对时空同步和细节还原要求极高的业务,为
构建可信的数字孪生环境提供关键支撑
18
。
多模态数据融合
多模态数据融合技术是多模态智能的基础,旨在解决异构数据在特征表征、关
联建模、跨模态对齐与语义统一方面的难题。该技术利用不同模态数据的互补性与
冗余性,融合后可生成更完整、更准确的环境描述,为多模态大模型训练、跨领域
知识迁移和任务泛化提供数据支持。结合跨模态自监督学习与通用知识迁移能力,
多模态数据融合能够提升模型在不同业务场景下的适应性与通用性,并推动多模态
数据标准体系建设,为视联网在多行业、多场景的统一感知奠定基础。
多模态数据检索
多模态数据检索技术通过多模态特征向量化与跨模态索引构建,实现跨视频、
音频、文本及传感数据的精准匹配与快速定位。基于这一能力,系统可支持“以图
搜视频”“以声搜场景”等多样化检索模式,在海量异构数据中快速发现业务所需
的信息。该技术显著提升了感知数据的利用效率与响应速度,在应急指挥、公共安
全、智慧城市和智能运维等领域具有重要价值,是释放感知数据潜能的关键一环。
视联编码
在超高清、强互动和低延迟的业务需求驱动下,视频数据规模持续攀升,给带
宽、存储与处理带来巨大压力。传统编解码架构在压缩率、延迟和算力消耗等方面
逐渐接近瓶颈,难以支撑未来超大规模、多场景业务的稳定运行。视联编码技术以
高效压缩、智能适配、低成本传输为核心,在保障音视频效果的同时,通过剔除冗
余信息、优化压缩算法、融合 AI 智能分析,显著提升资源利用率和业务承载能力。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
依托自主可控的编码标准、行业化安全机制和语义级创新方案,视联编码已成为推
动视联网规模化部署和高质量体验的核心能力
19
。
国产化编码
数字音视频编解码技术标准(简称 AVS,Audio Video coding Standard)是我国
自主知识产权的音视频编解码标准,是全球首个落地应用的面向 8K及 5G 产业应用
的音视频信源编码标准。AVS3 沿用了基于块的预测变换混合编码框架,深度融合
人工智能技术,通过双向预测端到端优化的神经网络视频编码架构提升压缩性能、
参考帧之间的光流作为时间上下文先验提升运动场编码效率。其成熟的产业链形态、
显著提升的编码性能以及对超高清场景的优异适配能力,为视联网业务规模化落地
提供技术支撑。
国家标准 GB/T 25724《公共安全视频监控数字视音频编解码技术要求》,简称
SVAC 标准。针对公共安全视频监控行业的特殊需求,形成了具有我国自主知识产
权的关键技术标准。SVAC 在基于块的预测变换混合编码框架基础上引入大量智能
化技术,有利于实现视频监控的智能化应用。SVAC 支持对设备的加密与认证,支
持视音频信息防篡改和加密传输,有效保障国家重要视频信息安全。
下一代智能编码
语义编码作为极具创新潜力的新型编解码方向,是应对传统编解码技术瓶颈的
关键突破,其核心在于视频语义的深度理解。通过深度语义分析提取视频核心内涵,
将原始视频转化为语义表示形式(涵盖语义分割图、目标检测框、场景事件描述等),
再依据应用需求进行针对性编码。这种方法既能大幅降低冗余信息的传输与存储成
本,又能精准匹配物联网、智能监控等场景的多样化需求,为超大规模视频数据高
效处理提供新方案。
其他主流编码
被称为多功能视频编码(Versatile Video Coding,VVC)通过多类型树划
分、仿射运动补偿、RPR等技术,在压缩效率、网络适应性和高分辨率支持上实现
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
了质的飞跃。其核心价值在于以更低码率传输更高质量的视频,尤其适合 8K 超高
清、高动态范围和 360 度全景视频等新的视频类型
20
。
AOMedia Video 1(简称 AV1)是一个开放、免专利的视频编码格式。它主要针
对互联网传输设计,在相同画质下,相比HEVC 能够显著减小带宽传输需求,尤其
在低码率下能保持优异的视觉质量。
视联传输
随着泛视频应用向超高清、多源数据、控制信令融合方向演进,视联网传输能
力正从“数据搬运工”升级为“智能传输中枢”。传统的传输模式在面对异构数据
类型、动态业务环境和超低时延需求时,常出现时空割裂、资源僵化、服务质量难
保障等问题,难以满足远程控制、沉浸式互动等高可靠场景的需求。下一代视联传
输技术以智能连接与动态调度为核心,通过协议栈分层优化、AI 驱动的智能路由以
及统一多模态传输框架,实现异构感知数据的时空关联传输。该技术推动视联网传
输逻辑转向优先匹配业务的智能服务需求,最终为视联网提供超低时延、高可靠性
的业务承载能力,支撑各类高要求场景的稳定落地。
图 3 视联传输协议智能中枢流程图
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
协议栈分层优化技
21
术
面向多模态感知数据的高效传输,协议栈分层优化是提升视联网传输性能的底
层支撑。基于 SPN(切片分组网)硬切片技术与算力网络调度能力,构建分层增强
型协议栈,将传输控制、媒体处理、算力调度等功能模块化分层,针对高清视频、
实时控制、传感数据等不同业务类型动态分配网络切片与资源优先级。在 5G/6G 网
络支持下,该架构可同时承载大流量超高清视频与低时延控制信令,并通过跨层优
化机制减少协议冗余与处理延迟,为全场景业务提供弹性、稳定的传输通道。
智能路由技术
在大规模视联网环境中,业务节点状态和链路质量的动态变化对传输性能影响
显著。AI 赋能的智能路由技术将“感知—决策—执行”闭环嵌入协议栈架构,通过
中心控制器实时收集边缘节点负载、健康状态与地理位置等信息,并结合主动探测
机制,实现毫秒级路由决策与动态调优。AI 模型不仅可预测链路拥塞与拓扑变化,
还能根据业务优先级和 QoS 要求主动切换最优路径,使全网传输从被动响应转向
主动控制,显著提升传输稳定性与时延可控性。
多模态传输技术
在视联网中,视频、音频、触觉信号、点云数据等多模态信息需要实现高精度
的时空同步传输。统一多模态传输框架(MMT)通过智能封装技术,将异构数据流
转化为标准化 MMT 数据包,并结合动态 QoS 调度,为不同模态按需分配最优传
输通道(如低延迟 SRT 通道或高带宽 UDP 通道)。配合时空联合编码技术,可
实现微秒级的多流同步,终端融合引擎在接收端完成多模态数据的实时重组,显著
降低传输延迟并保障沉浸式业务体验。该框架尤其适用于 AR/VR、全息通信、远程
操作等对多模态协同精度要求极高的场景。
业务赋能层关键技术
面向千行百业的数字化赋能使命,下一代视联网将围绕“沉浸体验”和“智能
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
认知”构建两大赋能核心,不仅贯通从感性交互到理性决策的全业务路径,更致力
于形成“感知驱动认知,认知优化体验”的价值闭环。通过对用户意图和业务场景
的深度解读与智能决策,为跨行业、跨区域的多元应用场景提供稳定、可靠的智能
化服务支撑
22
。
视联孪生
面向需要全局可视化与可预测控制的业务,视联孪生通过将现实世界的动态状
态实时映射到数字空间,实现跨地域、多主体的可见、可测、可控业务闭环。它不
仅支持风险预测与方案验证,还能反向驱动物理系统执行,为高风险、高成本场景
提供零试错的决策环境。面向追求深度参与真实感交互的业务,沉浸体验技术以多
模态感知交互为入口,将虚拟信息与真实环境无缝融合,使用户在业务执行中获得
自然、连续、具备情感反馈的体验。
数字孪生
在城市治理、工业生产、家庭安防等领域,实时数字孪生依托已有的多源业务
数据与视频感知能力,通过整合激光点云、多视角影像、物理传感器等多类型数据
资源,结合高斯泼溅、神经辐射场(NeRF)、动态行为建模等先进技术,可精准构
建兼具几何精确性、物理真实性与行为逻辑性的数字孪生体(物理实体的数字动态
镜像),通过云边协同架构与三维建模引擎实现毫秒级数据更新和可视化推演,并
反向驱动物理设备执行控制指令,实现数字空间中提前预判潜在风险、优化资源调
度方案,大幅降低物理场景中的试错成本,显著提升决策的前瞻性与有效性。
情绪与意图理解
通过融合分析人的语音、表情、文字、行为等多维度信息,穿透字面意思,洞
悉用户内心的真实状态和需求,从而将人机交互从“功能式操作”推向“情感化对
话”的新高度,是构建下一代沉浸式、智能化应用不可或缺的一环。利用多模态情
绪识别、用户行为模式分析和历史交互数据,实时推断用户的情绪状态与潜在意图,
并动态调整系统响应策略,可大幅提升以人机交互为主要界面或者主要依赖人机辅
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
助进行服务交付和应用的场景,实现主动式、个性化和有温度的智能服务,增强用
户体验与粘性
23
。
多模态自然交互
将语音、手势、视觉、触觉等多模态输入无缝转化为业务控制与信息反馈,通
过跨模态语义对齐和动态交互策略,让用户在不同模态之间自由切换,系统自动选
择最契合任务的交互方式。多模态自然交互的本质是以人为本,允许用户使用多种
最自然的方式与机器进行交流,让技术适应人而不是人去适应技术,同时机器通过
模仿人类最本能的、多种感官并用的交流方式进行反馈,主动消除人机“隔阂”,
最终达成高效、直观、沉浸的交互体验。
低时延虚实交互
低时延虚实交互的终极体验是欺骗人类敏锐的感官,让用户完全察觉不到数字
世界的存在,从而无缝地、自信地在混合现实中工作和娱乐。它不仅仅是图形和光
场渲染问题,更是感知追踪、空间定位、边云协同、网络传输等多种技术的深度融
合和系统工程应用能力,是实现从“观看虚拟现实”到“在混合现实中生活”,实
现高质量体验的关键瓶颈和核心目标。只有保证极低的数据处理与传输延迟,才可
获得连续、稳定、真实的交互体验,实现工业、医疗等场景的高精度操作和文旅、
展览等场景的沉浸式体验。
视联智能
面对开放、复杂且高不确定性的业务环境,服务能力亟需从“被动感知”向“主
动认知”“智能决策”与“协同执行”进行发展。借助视觉大模型强大的推理与泛
化能力,不但可在缺乏先验数据的场景中作出合理判断及决策建议,而且可以情境
理解为核心,将碎片化信息置于时空与因果链条中,形成对业务全貌的深度解读与
预测,并通过智能体协同体系与视算智能体,将高阶认知能力分布式地转化为跨云、
边、端的精准、实时、协同行动,形成完整的“理解-决策-行动”智能闭环。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
视觉大模
24
型
在交通管理、安防巡检、工业质检等业务中,单纯依赖感知层识别结果难以满
足跨场景泛化与任务多样化需求。视觉大模型基于大规模预训练与多粒度语义建模,
将目标检测、事件分析与场景推理统一到同一框架,并通过提示驱动技术快速适配
任务需求。结合时序 Transformer 与因果推理链,该能力实现少样本、零样本的任
务泛化,为开放场景下的业务智能提供高精度推理支撑。
智能体协同
通过构建跨云-边-端的分布式智能体体系,各节点具备自主感知、独立决策
与协同执行的能力。在复杂动态环境中,智能体可基于任务分解、角色分配与实时
通信协议实现快速响应和多场景联动。未来,智能体协同将进一步引入大模型推理
能力,实现异构设备间的自组织网络、自适应任务分配与跨域知识共享,满足应急
指挥、低空巡检、公共安全等对低时延、高稳定性协作的要求。
情境理解
在复杂业务中,感知结果往往只是事实碎片,将这些碎片融合时间、空间和业
务等多维信息加以解释,通过时间序列分析、事件链重构和因果推理,将孤立的数
据点与历史模式、环境变量、业务目标相结合,最终可转化为有因果、可预测的深
度知识和业务全貌,并提供经验丰富的专家级思考、判断和决策,实现真正的业务
智能化。
视算智能体
视算智能体融合视觉感知与计算推理能力,能够对视频流进行像素级和语义级
的双域分析,实现从目标检测、行为识别到事件预测的全链路处理。通过端-云协
同推理框架和模型裁剪技术,视算智能体可在低功耗终端上实现实时视频分析,满
足边缘计算环境下的算力受限需求。该技术是推动视联网应用连接轻量化、业务泛
在化,从“看见”到“理解”再到“推演”的关键支撑。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
智能内生关键技
25
术
智能内生是驱动网络能力跃迁、业务模式升级与生态体系重构的核心动力。随
着业务需求从静态传输向实时感知、动态决策与主动交互不断演化,传统的“外置
AI”模式已无法支撑海量视频业务的多样化、低时延与高可靠性要求。智能内生技
术通过将人工智能融入视联网体系及各链路环节,实现感知、计算、网络、存储、
调度的全链路智能化,推动网络智能化转型。围绕智能调度决策、智能业务保障、
智能运营运维、持续学习与自进化等技术方向,构建具备自主感知、精准决策、自
我优化的未来视频信息服务基础设施。
智能调度与决策
智能调度与决策技术通过感知业务意图与实时状态,实现算力、带宽、存储等
多资源的动态编排与最优分配。结合 6G的业务定义网络理念,系统可将业务语义
直接转化为网络与算力调度策略,支持毫秒级的资源调整与跨域编排。该技术在超
高清视频传输、沉浸式交互等场景中,可显著提升用户体验并降低运维成本,同时
保障关键业务的确定性服务质量。
智能业务保障
智能业务保障技术面向多网络、多算力环境下的关键业务体验保障需求。通过
质量预测、策略生成与资源调度的闭环控制,实现跨域、跨制式网络的 8K/沉浸式
视频低延迟传输与体验稳定性保障。该技术可与 5G/5G-A 深度联动,支持多资源池
算力弹性分配及多制式视频业务的规模化落地,满足广电、文旅、工业等行业对高
清实时视频服务的高要求。
智能运营运维
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
智能运营依托视联网全域数据采集能力,利用 AI 技术整合多源数据,构建分析
模型实现业务推荐、资源优化与服务定制。智能运维技术则将 AI 深度嵌入视联网的
全生命周期管理中,实现点位自优化、链路自决策、质量自进化与安全自防御。此
外,结合视联孪生技术,实现空间化调度、多模块协同与动态运营的深度集成,达
成跨区域、跨业务的统一运维管理与智能运营优化,最终实现对内保障运维稳定、
对外提升运营效能的双重目标
26
。
持续学习与自进化
持续学习与自进化能力确保视联网在面对新设备、新协议、新业务时能快速适
配与升级。通过在线增量学习、模型热更新与自主知识增强,系统可在运行过程中
不断优化模型性能与适应性,减少人工配置与标注成本。未来,视联网将具备场景
自适应与自主演化的能力,实现从静态系统向动态进化体的跃迁。
全域可信安全关键技术
在视联网的演进过程中,全域可信安全是保障业务持续演进和规模化应用的基
石。随着业务场景从单域部署向跨域、跨层、跨生态的开放协同转变,安全风险的
触发面从终端设备延伸到网络链路、平台应用、AI 模型和数据资产等全过程。传统
的边界防护模式已无法应对跨层、跨域、多向渗透的攻击链条,下一代全域可信安
全技术正从“单点防护”向“全链路可信”升级并基于“云—管—边—端”多层架
构,融合芯片级安全、零信任安全接入、量子级加密防护与智能防御等关键技术,
构建主动感知、可证可信的综合防护能力闭环,为泛在视频业务和行业数智化应用
提供可持续、可量化的安全保障。
异构芯片安全
在视联网中,终端、边缘节点与云平台广泛采用 ARM、RISC-V、GPU、NPU
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
等异构芯片架构,以满足视频处理、AI 推理和多模态分析的算力需求。然而,异构
架构的安全模型不统一、固件供应链复杂、推理数据防护薄弱等问题,使其成为潜
在攻击入口。下一代异构芯片安全技术以硬件信任根为基础,融合跨架构可信执行
环境(TEE)、远程度量与固件签名校验,实现芯片级别的防篡改与防伪造,为视
联网终端和边缘节点构筑“芯片级”安全防护体系
27
。
零信任安全接入
视联网的多域接入场景要求访问控制必须突破传统“可信网络边界”假设,构
建以身份、上下文和实时风险为核心的零信任安全接入架构。针对视联网设备端到
端数据安全传输需求,基于零信任、国产密码算法和 IPSEC 的综合解决方案保障
通信链路防窃听、防篡改,通过前端可信设备、可信用户、可信网络、动态访控、
运维管理等模块,构建安全可信的零信任安全体系。
量子加密
AIGC 等技术被恶意利用催生出以深度伪造为代表的新型攻击手段,视频内容
与控制信令的真实性和不可篡改性面临前所未有的挑战。量子加密技术基于量子密
钥分发(QKD)和量子随机数(QRNG),可在物理层实现密钥交换的无条件安全,
为视联网跨域传输提供“信息论安全”级别的防护。在视联网应用中,量子加密技
术与国产密码算法结合,可实现从端到端视频链路的全程加密,到帧级自适应加密
的分级防护。未来,量子安全边缘网关将在低空视联网、应急通信等高价值场景中
推广,实现从接入节点到核心平台的量子密钥分发与动态会话密钥轮换,确保关键
视频流在物理层与逻辑层的双重安全防护。
智能防御
视联网全域安全的智能中枢作为下一代视联网安全架构的核心引擎,AI 智能防
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
御系统以“三层智能联动、动态认知闭环”的颠覆性架构,重构主动式安全范式,
通过 AI 的自主学习能力,使视联网安全从被动防御升级为主动预判,推动视联网
安全体系实现从“边界防护”到“内生安全”的质变跃迁
28
。
图 4 AI 智能防御体系架构
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
4. 下一代视联网典型应用场
29
景
智能视频监控类
在安防领域的演进中,视频智能算法成为核心驱动力,与高清采集和多域融合
共同推动行业不断升级。下一代视联网智能视频监控依托强大的多协议兼容能力,
可无缝接入路口摄像头、车载终端、雷达等多类设备,实现海量视频流与多维数据
的实时汇聚和联动分析,精准识别异常行为、追踪目标轨迹并预判风险趋势,显著
提升监控响应效率,在城市治理、交通疏导、工业生产、商业运营等场景中催生全
新应用。
场景一:家庭安全守护
在未来家庭中,视联网将作为核心纽带,联动摄像头与生物雷达矩阵,以无感
方式融合采集空间内的生命体征、动态轨迹与微动作。依托超低延迟传输,系统可
通过步态分析识别老人的跌倒风险,主动调亮照明并激活地面指引光带;当儿童接
近未上锁窗户等危险区域时,可即时触发定向声场播放警示语音,并联动智能窗框
自动锁闭。若遭遇非法入侵,系统还可支撑房门物理锁闭,并在入侵区域生成高频
声障或视觉干扰,为家庭构建动态防护边界,全面释放其在家庭安全场景中的应用
价值。
场景二:工业全流程巡检
在生产环境部署的高清相机采集视频流接入系统后,经 AI 智能处理可精准捕捉
设备松动、零件变形等微小异常,并将违规操作的判定从单一动作扩展至动作连贯
性与环境适配性等复合场景。依托时序分析模型,系统结合历史监控数据与实时视
频流,能够自动学习设备故障前兆特征,实现提前预判与主动预警,显著提升生产
安全与运维效率。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
场景三:全域联动交通监
30
管
传统监控“各自为战”的模式局限将被突破,针对全域交通进行智能监管赋能。
当某路段出现异常车流,系统将自动触发全域协同响应,并实时汇聚多点摄像头高
清视频、终端感知数据与路网数据,预判未来 15 分钟内的拥堵趋势。不仅可实现
跨区域信号灯的智能联动,还能在设备故障时依托自治能力对相关区域内设备进行
统一协调和智能调度,将故障影响降至最小,大幅提升通行效率和监管效能。
图 5 智能视频监控场景应用
远程控制类
远程控制是构建“零距离智能社会”的关键能力和典型场景,依托确定性传输、
多模态反馈和云边端协同调度等技术,能够突破地理限制,实现对工业生产、医疗
服务与城市设施的精准操控,有效解决传统远程操作中时延不确定和安全保障不足
的问题。
场景一:远程游戏娱乐
在远程游戏场景下,用户只需佩戴轻量化 VR显示设备并配合力反馈设备,即
可远程操控高性能赛车参与竞技。超低时延传输技术成为体验的核心支撑,赛道光
影变化、对手车辆实时动态与路面细微起伏等信息均可在毫秒级同步呈现,让用户
仿佛置身真实赛场。从虚拟画面的及时呈现到物理设备的触感反馈,整套系统无缝
衔接,构建出虚实融合的全新竞技娱乐范式。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
场景二:家庭远程陪
31
伴
视联网技术将家庭打造成一个可远程操控的智能空间。父母不在家时,可以远
程操控家居设备,播放学习内容和陪伴孩子互动等;当宠物独自在家时,主人可以
远程操控智能喂食器与摄像头,与宠物进行实时互动,确保它们得到悉心照料。此
外,对于家中独居的老人,子女可以远程操控智能健康监测设备,实时了解老人的
健康数据,并实现紧急情况下的远程呼叫,让家庭关爱零距离。
场景三:专家远程协同运维
设备突发故障时,专家通过视联网整合现场摄像头回传的实时视频与运行参数
等信息,远程操控机械臂进行拆解检修;在仓储区需要抽检时,可以远程操控移动
机器进行精准采样。这些跨地域的协同操作,不仅能提升运维效率与操作精度,更
能大幅降低人力成本与差旅费用,实现企业运营的智能化与高效化。
场景四:受限环境安全操控
在面对危险和受限环境时,视联网技术为政务部门提供了远程精准作业的解决
方案。在危险化学品事故处置中,操作人员可以远程操控搭载防爆摄像头的机械臂,
完成堵漏、灭火等高危任务,实现零人员暴露。在冶金高温车间等极端环境下,视
联网整合高精度传感数据与实时视频,联动机械臂完成熔炉内壁的无人化检修,有
效替代人工。在地下空间救援中,救援人员可以通过远程操控挖掘机器人清除障碍,
突破高危环境救援极限,全方位提升救援作业的安全性与可靠性。
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
图 6 远程控制场景应
32
用
实时音视频类
实时音视频作为泛视频业务核心场景,凭借超低时延传输和多模态 AI 增强等关
键技术,成功打破交互延迟高、业务场景孤立的发展瓶颈。政策红利的持续驱动下,
教育、医疗、工业等领域的沉浸式实时音视频服务需求激增,强力推动产业跨越式
发展。
场景一:沉浸式直播体验
个人用户只需佩戴轻量化 XR终端,便能接入全球热门的户外露营直播,轻松
解锁沉浸式直播新体验。通过 8K/120 帧实时音视频传输,以全景视角“置身”山
林间,耳边同步传来溪流潺潺、鸟鸣阵阵的环境音,仿佛站在主播身旁。更可与异
地好友的虚拟化身在直播空间实时相遇,进行实时语音交谈。彻底打破“观看”与“在
场”的界限,实现从被动接收视频到主动沉浸互动的体验升级。
场景二:全息临场家庭聚会
依托实时音视频技术,重新定义 “家庭聚会”,打造无视地理阻隔的“全息共
享空间”。用户佩戴轻量级XR眼镜后,远方家人不再是屏幕二维画面,而是以逼真
的等身全息影像“现身”客厅,仿佛共处一室。用户看见异地幼儿在身边搭建积木
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
的全息影像,通过眼镜微表情捕捉系统感知她的情绪,及时进行交流。这远超普通
视频通话,构建融合视、听、环境感的共同临场空间,重塑亲情连接。
场景三:高效智能视频办公
远程视频会议时,依托其超低时延传输能力,可支撑万人级别超大会议,参会
者通过高清画面与低延迟语音实现 “面对面” 沟通,屏幕共享同步展示文档,还
能自动识别聚焦发言者、生成多语种字幕,高效实现跨地域超大规模办公协同。远
程招聘面试中,视联网保障超高清实时音视频交互,让面试官与求职者清晰传递表
情与语气,双方在线共享简历、演示作品,精准模拟线下面试场景,有效缩短招聘
周期。
场景四:协同调度应急救援
视联网凭借超低时延音视频传输能力,让指挥中心与受灾现场实现无缝通信。
河道、居民区的监控设备实时回传水位上涨、房屋受淹等画面,集成的 AI 算法快
速分析水流速度、淹没范围等数据,精准识别堤坝管涌、人员受困等风险,立即触
发告警并推送高清视频至指挥平台。指挥人员通过视联网调用多区域实时画面,远
程调度救援队伍、调配物资,同步与现场救援人员进行低延迟语音会商,高效推进
抢险救灾,最大限度降低灾害损失。
图 7 实时音视频场景应用
33
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
视联数字孪生
34
类
随着 5G/5G-A 网络的深度普及、边缘算力的显著增强,以及大模型算法的不
断演进,视联数字孪生技术迎来了前所未有的发展契机。通过构建高度逼真的视联
数字孪生体,实现物理世界与数字空间之间的双向动态交互。这一技术革新推动视
频数据从单纯的描述性分析,向具备预测性干预能力的 “主动认知资源”跃升,为
各行业带来全新的发展可能。
场景一:智慧文旅体验
在视联孪生类场景中,票务系统、无人机航拍与千万级智能终端的时空轨迹深
度融合,使文旅孪生体具有精准预测能力。系统前瞻性模拟客流涌动,生成最优游
览路径。游客佩戴 AR眼镜等设备进入景区,所见不再是静态风光,而是叠加了全
息历史场景、动态生态信息与艺术化叙事线索的沉浸式时空。同时,根据游客画像,
生成个性化的互动讲解内容,为每一位游客缔造独一无二的完美旅程。
场景二:智能家庭空间
高精度家庭数字孪生体,实时动态同步家中各类智能设备的运行状态与环境数
据。例如,对冰箱内部食材、盆栽植物等家庭微观场景,进行精细化扫描与智能化
状态识别。这些实时采集的数据在数字孪生体中,构建出物理实体实时更新的健康
度、保质期等动态属性,还能自动触发相关智能设备联动响应,最终实现覆盖环境
监测、物品管理、设备调控的全方位家庭智能空间。
场景三:精准医疗作业
视联网技术整合医疗场景实时视频、患者多源数据以及智能算法,构建精准的
医疗数字孪生体,将医疗场景 1:1 复刻为高清可视化数字镜像。术前,基于孪生体
进行三维手术预演,医生可借助 AR可视化效果规划手术路径,模拟操作过程。术
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
后,孪生体持续同步患者恢复视频与各项监测数据,动态呈现病情变化,辅助医生
及时调整康复方案,全程为诊疗提供精准支持。
场景四:高效城市管
35
理
通过汇聚全市实时视频监控、传感器数据与交通流量等多源信息,并在数字孪
生平台上进行映射,生成城市孪生体,实现城市运行状态的实时还原。当出现交通
拥堵时,管理者可在数字孪生中模拟不同疏导方案,选择最佳路径。当城市管网出
现异常时,系统能实时渲染管道内部情况,预测故障点,并联动市政部门进行精准
维护。这种模式将城市运行数据化、可视化,使城市管理更加高效、智能,从而全
面提升城市运行效率与市民生活品质。
图 8 视联数字孪生场景应用
低空视联类
低空视联是下一代视联网在空间维度上的自然延伸,是构建泛在视觉感知系统
的重要组成部分。其依赖通信、探测、感知、管控一体的智能化网络,实现对低空
域(通常指地表以上 1000 米以下空域)的全域数字化管理,解决低空设备异构接入、
数据实时回传、超远程精准操控及空域安全管控等难题。随着政策支持(如低空空
域开放试点)、技术突破(如轻型化无人机、eVTOL 飞行器)及市场需求增长,低
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
空视联正加速从试点探索走向规模化应用,成为推动“空-天-地”一体化感知治理
体系的关键支撑力量。
场景一:户外徒步探
36
索
旅游爱好者在户外徒步或郊野露营时,常陷入路线判断困难。此时,随身携带
的折叠式低空无人机便成为有力助手。它能快速升空,以“空中视角”勘察前方路
况,高清摄像头捕捉的实时画面经视联网超低延迟传输至终端屏幕,清晰呈现路径
安全性、是否有溪流阻隔等关键信息,帮行人避开陡坡、沼泽等危险区域,让户外
出行更安全、路线规划更精准。
场景二:家庭空间拓展
把“低空视联网”搬到家庭场景,作为一种全新的“室外空间网络”,和家里
已有的室内摄像头/局域网打通,形成私域感知网络。实现外卖、快递、访客的可视
管理;高端住宅升级“立体安防”,以及房屋屋顶、外墙智能巡检等服务;同时为
亲子、宠物的室外时光,提供第三视角跟拍服务。让家庭视频监控从室内延伸至室
外、从地面拓展至低空,真正实现 “空地一体”的立体呈现,让家庭空间的可视管
理更全面、更完整。
场景三:低空物流配送
依托视联网技术,无人机物流全程通过高清视频实时回传舱内货物状态与航线
环境。视联网联动多节点开展视频会商,构建配送环节全流程可视化调度平台,确
保货物交接可视可溯,有效提升配送效率与安全性,成功实现以无人机替代传统货
车、货船等物流方式。
场景四:农林低空作业
无人机搭载高清摄像头与多光谱传感器巡航农田林地,实时将作物生长态势、
林木健康状态等视频流以及传感数据回传至视联网平台。系统通过 AI 视觉算法精准
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
识别病虫害等异常情况,并自动触发预警。农技专家依托视联网系统调取高清画面,
远程制定防治方案后,即可向无人机集群下发指令,通过变量喷洒实现农药的精准
定量喷施。“低空监测、智能分析、精准作业”三个环节形成完整链条,显著提升农林
虫害的防治效率
37
。
图 9 低空视联场景应用
具身智能类
具身智能是视联网感知边界不断外延的重要承载终端。相较于传统终端,具身
智能可通过持续的物理耦合与环境建立动态关联,在真实世界中实现高频、精准的
认知与动作协同。下一代视联网多模感知、语义理解、云边协同等能力的不断演进,
正推动具身智能的感知能力与行动效率不断提升,迈向全方位自主智能。
场景一:具身家庭伙伴
在家庭场景中,视联网具身智能发挥关键纽带作用,将摄像头的视觉感知能力
延伸至家庭机器人终端,让机器人从普通设备升级为贴心的智能服务伙伴。依托视
联网强大的多模态感知技术,机器人能精准识别泼洒液体、散落杂物等家务对象,
无需人工指令即可自主规划清洁路径、执行清扫任务;此外,当用户需要寻找物品
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
时,机器人还可通过视联网快速调取历史视觉数据,精准定位物品存放位置,并协
助完成查找与归纳。这些功能无缝衔接,切实减少家庭事务繁琐度。
场景二:具身行业助
38
手
在园区仓库场景中,视联网赋能的具身智能设备如巡逻车、搬运机器人等,通
过激光雷达、视觉识别与地面引导技术,强化精准感知与自主作业能力,可实时调
整搬运路径、同步巡逻盲区信息,实现仓储搬运高效化、生产物料配送自动化,既
大幅提升作业精度与效率,又有效降低人力成本,为工业场景智能化升级提供核心
支撑。
图 10 具身智能场景应用
智能网联车类
智能网联车依托视联网采集终端和网络承载,实现车与车、车与路、车与云端
的低时延信息交互,是 “信息消费新三样” 核心场景之一。在政策引导、产业推
动和地方落地的多方协同下,智能网联车正进入规模落地阶段。借助视联网的实时
传输与多维感知能力,其安全框架和技术路线不断完善,为智能出行提供坚实支撑。
场景一:自动驾驶辅助
在乘用车领域,视联网通过车载视频、雷达与高精度地图等多模态感知数据的
融合采集与实时传输,经 AI 算法处理,为自动驾驶提供核心支持。系统能够实现自
适应巡航、车道保持及自动泊车等功能,并在复杂环境下提升车辆对道路情况、交
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
通信号和周边目标的感知精度以及时空预测能力,增强自动驾驶的安全性与可靠性。
场景二:智能车队管
39
理
在车队管理场景中,视联网实现全流程智能化管控。车载摄像头、传感器与路
侧激光雷达等设备的多源数据,经由视联网实时传输与汇聚,实现车队运行的精准
检测与调度。依托低时延特性,系统可动态规划最优路线,降低空驶率和等待成本,
同时结合能耗监测与智能优化算法,有效减少油耗或电耗,实现降本增效。通过与
云端平台的联动,还可为物流、公共交通、环卫等场景提供可视化调度与智能管理,
推动车队管理模式向数字化、精细化升级。
图 11 智能网联车场景应用
下一代视联网愿景、技术能力与应用场景白皮书(2025年)
5. 发展倡
40
议
视联网的发展不仅是技术的演进更是产业范式与数字生态的重构,为实现下一
代视联网的目标和愿景,需凝聚全产业链力量,以技术共进、场景共创、生态共赢
为核心,共同开启视联网新纪元。我们倡议:
1)共筑视联网技术基座
呼吁产学研各方以统一协议与标准布局为牵引,协同定义下一代视联网技术架
构,推动架构演进与跨行业标准统一,形成具备智能内生、全域协同、安全可信等
特性的技术底座。集中突破通感算智存一体化融合、分布式网络承载、多模态自然
交互等核心技术能力,夯实超高清、低时延、高可靠的自主创新根基,使视联网升
级为具备环境认知与自主决策的智能基础设施。
2)共拓视联网场景范式
倡议深化视联网在千行百业数字化转型中的中枢价值,加速与个人家庭、政务、
交通、工业等关键领域的场景融合与深化应用,形成可复制、可推广的标杆场景。
面向沉浸式通信、低空视联、具身智能等新兴需求,培育基于多维感知与实时交互
的新质生产力引擎,推动虚拟与现实融合的下一代应用创新,建立跨行业协同的孵
化机制,探索可持续的商业模式与产业升级路径。
3)共建视联网开放生态
倡导构建低门槛的视联网生态开放创新体系,吸引汇聚全球产学研用伙伴参与
生态共创,推动技术能力、模型算法、跨域数据价值挖掘以及场景与方案融合。通
过建立兼顾高效协作与安全可信的治理框架,促进跨域技术能力与数据流通,实现
高效协作与隐私保护平衡,促进多层次、多主体的生态合作共赢。
下一代视联网愿景、技术能力与应用场景白皮书(2025)
缩略语列
41
表
缩略语 英文全名 中文解释
AI Artificial Intelligence 人工智能
QoE Quality of Experience 体验质量
FPGA Field-Programmable Gate Array 现场可编程门阵列
ASIC Application-Specific Integrated Circuit 专用集成电路
TSN Time-Sensitive Networking 时间敏感网络
CPU Central Processing Unit 中央处理器
GPU Graphics Processing Unit 图形处理器
NPU Neural Processing Unit 神经网络处理器
QoS Quality of Service 服务质量
VR Virtual Reality 虚拟现实
AR Augmented Reality 增强现实
SLA Service Level Agreement 服务等级协议
RPR Reference Picture Resampling 参考图像重采样
HEVC High Efficiency Video Coding 高效视频编码
SRT Secure Reliable Transport 安全可靠传输协议
RISC-V
第五代精简指令集
计算
Reduced Instruction Set Computer V
机
AIGC Artificially Intelligent Generated Content 人工智能生成内容
下一代视联网愿景、技术能力与应用场景白皮书(2025)
42
参考文献
[1] 面向 6G 的泛在实时通信网络场景需求与关键技术研究报告[R],IMT-2030(6G),2024.
[2] 通信网络 2030(2024 版)[R],华为科技有限公司,2024.
[3] 通感算一体化网络前沿报告[R],中国通信学会,2022.
[4] 中国移动视联网白皮书(2024)[R],中国移动,2024.
1.视联网发展现状与演进动力
发展现状
演进动力
政策引领驱动
业务需求驱动
技术演进驱动
成本效益驱动
2.下一代视联网发展愿景及演进理念
发展愿景
演进理念
从“资源分散独立”到“全域融合协同”的范式跃升
从“网络适配业务”到“业务定义网络”的范式跃升
从“外挂式智能辅助”到“多模态智能内生”的范式跃升
从“单一场景服务”到“全场景泛在融合”的范式跃升
3.下一代视联网关键技术能力
资源融合层关键技术
基础能力层关键技术
业务赋能层关键技术
智能内生关键技术
全域可信安全关键技术
4.下一代视联网典型应用场景
智能视频监控类
场景一:家庭安全守护
场景二:工业全流程巡检
场景三:全域联动交通监管
远程控制类
场景一:远程游戏娱乐
场景二:家庭远程陪伴
场景三:专家远程协同运维
场景四:受限环境安全操控
实时音视频类
场景一:沉浸式直播体验
场景二:全息临场家庭聚会
场景三:高效智能视频办公
场景四:协同调度应急救援
视联数字孪生类
场景一:智慧文旅体验
场景二:智能家庭空间
场景三:精准医疗作业
场景四:高效城市管理
低空视联类
场景一:户外徒步探索
场景二:家庭空间拓展
场景三:低空物流配送
场景四:农林低空作业
具身智能类
场景一:具身家庭伙伴
场景二:具身行业助手
智能网联车类
场景一:自动驾驶辅助
场景二:智能车队管理
5.发展倡议
缩略语列表
参考文献
编写单位及作者