©2026 iResearch Inc.
2026数字人电商直播白皮书
京东与艾瑞咨询联合发布
2
序言 如何实现从“流量运营”向“用户价值运营”的效率跨越,已成为当下电商商家的核心经营命题。
直播作为连接“人、货、场”的关键场景,其自身的智能化升级是破局的关键。数字人直播正从一项前沿技
术,演变为商家可规模化应用的“新质生产力”。在京东的商家生态中,直播已非头部品牌专属,而是通过
技术普惠成为所有商家的基础经营能力。京麦服务市场作为全域交易与履约枢纽,已高效链接数字人服务商
与商家,打通需求匹配、交易购买到落地使用的全链路,将数字人直播从技术概念变为商家可一键开通、即
开即用的标准化服务,真正实现技术对商家的降本增效赋能。
本白皮书旨在全景式描绘数字人电商直播的现状与未来。我们立足商家生态视角,分析头部、腰部及中小商
家如何通过数字人直播实现品牌增值、降本提效与零门槛变现。我们认为,数字人直播并非替代真人,而是
与真人形成“人机协同”的最佳组合,共同推动直播电商从“重资产人力驱动”向“轻量化数据驱动”的范
式迁移。
未来,数字人直播将迈向超越真人的“Agent智能体”时代。希望本白皮书能成为您洞察趋势、把握机遇的
指南针,助力您在京东开放创新的生态中,找到智能化直播的增长路径。
3
寄语
京东零售平台生态部负责人 孔祥莹
京东AI创新业务负责人 何晓冬
在内容为王的电商时代,真正的变革源于优质内容与高效运营的深度融合。而数字人直播正
在重塑业态,成为商家实现全天候品牌触达、提升转化效率的关键。我们致力于通过智能工
具,帮助商家构建高质量内容创作与高效率直播运营的双轮驱动。这不仅关乎工具升级,更
是经营理念的进化——让每一次直播都成为品牌价值与用户关系的长效积累,实现可持续增
长。期待与各位同行一道,以务实的方法论与创新的模式,共同开启直播电商的“质效”新
时代。
京东零售平台营销中心负责人 宋旸
数字人作为前沿AI技术的集大成者,深度融合了语音、视觉、自然语言理解等多模态技术。
它正不断打破虚拟与现实的边界,展现出极其广阔的产业应用前景。在这场技术浪潮中,京
东始终笃行不怠。在技术攻坚上,面对行业长期存在的文本指令控制力弱、多模态控制信号
冲突、长时长生成能力不足等核心痛点,京东推出了全新一代数字人大模型JoyStreamer,
实现了长时长、自由态、高频实时互动的数字人生成效果。在产业应用上,京东已先后打造
了“采销东哥”数字人、总裁数字人、明星及IP数字人等多种创新载体,持续引领数字人规
模化应用的产业浪潮,目前服务商家已超过7万家。也期待本报告能为行业带来全新的思考
与启发。
京东始终致力于为全量商家,特别是中小商家,打造一个公平、高效的经营环境。降低商家
的经营门槛,是我们长期不变的任务。面对高昂的直播成本,人工智能为我们提供了全新的
解法。数字人技术的成熟,真正打破了直播的时间和成本限制。它让‘24小时不间断营业’
覆盖到了全量商家,让广大中小商家也能享受到技术发展的红利。但作为平台,我们不仅要
引入新技术,更要对新技术的应用负责。这份白皮书的发布,是京东为数字人在电商场景中
的应用画出的一道“基准线”。我们明确了技术标准与服务规范,确保AI在切实帮商家降低
直播成本的同时,依然能为消费者提供真实、可信赖的购物体验。技术创新没有终点,但护
航商家稳健经营、守护消费者信任,是我们永恒的底色。
4
在数字人技术重塑直播业态的今天,我们希望通过智能工具帮助商家构建高质量内容生
产与高效率直播运营的双引擎。而基于京东的深厚积累,我们构建了从用户体验到运营
提效的完整方法论——通过生动形象、情感化表达、智能互动,让数字人直播从“形象
展示”升级为“有温度的沟通”;通过智能托管、经典复刻等多元模式,让不同发展阶
段的商家都能找到高效开播的路径,为行业树立了从“流量驱动”向“质量驱动”转型
的标杆。
京东零售内容生态部负责人 宋健
本次数字人电商直播白皮书的发布,旨在全面梳理数字人技术演进路径、产业发展趋势
与商业化落地实践,沉淀京东技术研发与业务应用的核心经验。我们期望以这份报告为
纽带,为行业从业者、企业合作伙伴提供专业的技术参考与实战借鉴,共同探索数字人
产业创新发展路径,推动AI技术与实体经济更深层次融合,用技术撕掉“虚拟”标签,
让数字人成为电商直播的“新常态”,共筑产业高质量发展新生态,共创数字经济时代
新价值。
京东科技数字人与AIGC负责人 王爱飞
寄语
5
联想与京东数字人携手打造的创新实践。通过数字人实现24小时不间断直播,有效解决
主播培养成本高、直播间搭建复杂、多场景适配难等痛点,充分释放闲时流量价值,彰
显了数字人技术在降本增效、提升用户体验上的巨大潜力。
数字人技术正成为企业智能化转型的关键引擎。我们相信,以京东为代表的平台生态将
持续推动技术标准化与场景深耕,降低企业应用门槛,加速全行业从“单点尝试”迈向
“体系化部署”。期待与京东数字人持续携手, 共创智能商业新未来。
联想中国消费业务群KA业务总经理 余尚奇
东阿阿胶与京东数字人携手打造的创新实践,为中医药滋补行业树立了专业标杆。通过
数字人实现24小时专业化不间断直播,有效解决专业主播稀缺、培养成本高、直播覆盖
不足等行业痛点,充分释放全域闲时流量价值,有力彰显了数字人技术在降本增效、规
范专业表达、提升用户体验与赋能商家数智化升级上的巨大潜力。
东阿阿胶直播运营部总监 刘芳
寄语
6
寄语
在数字经济浪潮下,人工智能正加速重塑千行百业,数字人直播亦从技术概念演进为电
商核心基础设施。为帮助商家精准把握这一变革机遇,艾瑞咨询与京东联合发布《数字
人电商直播白皮书》,立足产业全局,洞察技术演进、市场驱动与生态格局,前瞻性展
望从“工具替代”向“Agent智能体”跃迁的未来趋势,为电商直播行业注入持续动能,
共同夯实中国消费市场的创新活力。
艾瑞咨询联合创始人 邹蕾
电商直播正从“流量驱动”迈向“效率驱动”,数字人直播凭借其全时化、自动化、规
模化的核心优势,成为行业增长的新引擎。然而,如何在降本增效与用户体验间找到最
优解,仍是商家面临的核心难题。为此,艾瑞咨询携手京东联合发布《2026数字人电商
直播白皮书》,洞察数字人直播的技术演进、市场格局与商家差异化需求,为商家提供
清晰的认知框架与实操指南,助力从“流量运营”迈向“用户价值深度服务”。
艾瑞咨询研究总监 王芝兰
7
目 录
CONTENTS
01 数字人电商直播行业发展全景扫描
02 数字人电商直播行业应用洞察
03 京东官方数字人直播方法论与实践
04 数字人电商直播行业未来趋势展望
8
数字人电商直播行业发展全景扫描01
9©2026 iResearch Inc.
数字人电商直播行业定义
数字人电商直播是品牌以虚拟数字资产为核心,实现直播电商全时化、自动化与规模化的下一代解决方案
数字人电商直播,绝非简单的“虚拟主播”工具,而是一场由AI技术驱动、深入电商核心的“生产力革命”。其本质在于,通过将核心生产要素从不可复制的“真人”
替换为可标准复制的“AI数字人”,从而彻底重构了直播电商的成本结构、运营范式与资产形态。尤其让中小商家自由开播,享受直播时代的流量红利。
来源:艾瑞咨询研究院自主研究及绘制。
数字人电商直播,是指以AI驱动的虚拟数字人作为核心呈现者与销售主体,在电
商平台进行全天候、智能化的商品推介、互动答疑与销售转化,旨在实现降本增
效和沉淀品牌数字资产的新兴商业模式。
数字人电商直播行业定义 AI驱动
降本增效
虚拟数字人
数字资产
全时化/智能化
技术底座 商业主体 核心场景 价值本质
支撑业务运转的底层技术集合 产业链中的核心参与者与推动者 价值创造的具体应用场域 行业存在的根本商业逻辑
• 形象生成:高拟真建模
• AI驱动:动作/语音/表情
• 实时交互:语音识别、大
模型理解与生成
• 电商集成:与平台数据、
商品、交易系统打通
• 服务方:SaaS技术服务商、
IP定制商、代运营机构
• 使用方:品牌方(重品
效)、中小商家(重降
本)、MCN机构(重规
模)
• 终端用户:电商平台消费
者
• 品牌自播间:7×24小时品
牌店播
• 虚拟导购:智能答疑与推
荐
• 活动专场:大促/新品虚拟
发布会
• 跨境直播:多语种商品讲
解
• 对商家:将高成本的“真
人直播服务”转化为可拥
有、可复用的“品牌数字
资产”,实现降本、增效、
扩规模。
• 对行业:推动电商直播进
入标准化、自动化、全时
化的新阶段,是AIGC在电
商领域的关键落地。
真人与数字人电商直播核心差异
租赁人力 拥有数字生产资料
高边际成本 低边际成本
高波动、高风险 高稳定、强可控
核心资产:
复杂情感与临场应变 规则化与智能拟真
经验驱动 数据驱动
产能与成本:
内容与品控:
交互能力:
数据与迭代:
真人直播 数字人直播
10©2026 iResearch Inc.
数字人电商直播行业发展历程
数字人电商直播行业的发展是技术迭代与商业需求共振的过程,从早期探索到规模化应用,大致可分为技术萌
芽期、初步探索期、快速成长期、规模化商用期四个阶段
资料来源:公开信息整理。艾瑞研究院自主研究绘制。
1
2
3
4
① 数字人技术在影视、游戏领域已完成初步
的技术积累与经验沉淀
② 在电商领域,数字人应用尚处于初级阶段
③ 当时的应用主要表现为静态虚拟模特展示
和简单的信息播报
④ 受限于当时的技术水平,应用成本高昂,
普及程度很低
⑤ 数字人技术距离在直播电商中实现商业化
落地与规模化应用仍有较大差距
技术萌芽期(2020年前)
① 实时渲染、动作捕捉等技术发展,推动数
字人尝试应用于直播电商
② 一些国际品牌率先试水3D虚拟人主播
③ 数字人直播多属“技术秀”,形象和交互
相对僵硬
④ 主要用于品牌宣传而非实际销售
初步探索期(2020年-2022年)
① AIGC技术的爆发是此阶段的核心驱动力
② 数字人制作成本大幅降低,从百万元级别
降至数千元
③ 大量数字人工具平台涌现,市场呈现爆发
式增长
④ 快速发展导致低质量数字人内容泛滥,进
而造成用户体验下降
⑤ 平台开始制定相关规则,市场经历洗牌,
许多技术不成熟的服务商被淘汰
快速成长期(2023年-2024年)
① 数字人直播进入规模化应用阶段,同时监
管开始介入,行业向规范化发展
② 摆脱“小众试点”标签,开始全面渗透至
电商各细分领域,实现从头部品牌向中小
商户的普惠覆盖
③ 监管体系逐步完善、行业标准加速落地,
生态协同效应凸显
④ 迈入“合规有序、规模增长、价值升级”
的全新发展阶段
规模化商用期(2025年至今)
• 2016 年:国内数字人技术开始布局,企业聚焦语音
合成、图像建模
• 2018-2019年:京东云等企业开始积累智能客服语
料与场景,为数字人交互能力打基础;少量品牌尝试
虚拟模特用于商品展示
• 2019 年:虚拟偶像逐步出圈,部分品牌尝试用虚拟
形象进行营销
• 2020年4月:洛天依走进真人直播间,单场观看量达
300万,成为数字人直播带货破圈的标志性事件
• 2021年10月:虚拟美妆数字人“柳夜熙”在抖音上线,
48小时内粉丝量破百万,引爆虚拟数字人商业价值
• 2024年:“采销东哥”数字人分身开启直播带货,观看
量破 4000 万,成交额超 5000 万元,成为数字人直播
的标杆案例;同年6月京东业内第1个实现50多位总裁同
台直播
• 2023 年,行业率先建立数字人直播规范,品牌规模化应
用带动销量增长;2024 年,行业相关平台开始监管、处
理违规账号,市场加速洗牌,数字人工具平台全面推出。
• 2025年12月:监管出台《直播电商监督管理办法》,首
次将数字人直播纳入政策监管;
• 2025年12月:京东宣布数字人直播免费向所有商家开放,
短短10天报名商家突破10000家。
11©2026 iResearch Inc.
数字人电商直播行业市场规模
数字人电商直播正处于从“替代方案”到“创造增值” 转型的爆发增长期
数字人电商直播正站在电商直播行业向 “效率驱动” 深度转型的关键节点上。数字人电商直播凭借中国AI数字人2024年高达%的市场增速、超114万家企业的规
模化布局,以及向2026年全球近768亿美元的广阔市场预期,它已从技术概念演进为提升“人、货、场”运营效率的核心基础设施。在效率为王的行业新周期中,其
增长确定性与商业前景已十分明朗。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
2024年中国AI数字人市场规模
规模同比增长 %
2024年中国与数字人相关的企业数量
截止2024年9月
企业数量: 万家
2024年1-5月
新增注册企业数量: 万家
2021 2022 2023 2024 2025e 2026e
中国直播电商市场规模(亿元)
2021-2026中国电商直播市场规模 2021-2026年全球数字人电商直播市场规模及预测
2021 2022 2023 2024 2025e 2026e
全球数字人电商直播(亿美元)
12©2026 iResearch Inc.
主流电商平台数字人直播技术能力与布局
电商数字人直播梯队化竞争格局正式确立,京东、淘宝/天猫稳居行业第一梯队
京东、淘宝/天猫已完成技术、生态、规则的全链路布局,形成了差异化核心壁垒:京东以普惠免费的开放策略快速撬动商家规模化接入,淘宝/天猫聚焦技术标准化与
全链路合规治理。
数据来源:2025-2026 年各平台官方开放规则、商家后台公示政策、公开信息收集
平台 战略定位 开放模式 自研技术 流量扶持 服务商生态 合规管控 优势
京东
普惠开放,高性
价比方案
极高,零门槛免
费接入
JoyAI大模型,
7x24h稳定
免费加权,高转
化倾斜
开放认证,官方
接口免费
实时拦截,违规
预警指导
技术领先,生态完善,对商
家友好
淘宝/天猫 全链路合规生态
高,全量开放,
无门槛
TaoAvatar系统,
标准化高
合规加权,大促
专属池
星级体系成熟,
全案运营
强制标识,分层
处罚
技术成熟、生态完善
抖音电商
不鼓励录播AI直
播,鼓励AI分身
互动
中高,需双重备
案
即创(云雀大模型)
+OmniHuman-
+豆包语音模型
暂无专项扶持
分级体系,阶梯
补贴
三重监管机制:
内容标识+实名认
证+真人驱动
技术领先,AI分身生态差异
化,合规体系健全
快手电商
聚焦下沉市场与
产业带
中,产业带定向
放宽
女娲系统,互动体
验佳
最高3倍曝光,
产业带倾斜
聚焦下沉,定向
补贴
实时检测,违规
断流
下沉适配强、互动好
美团
本地生活垂直场
景应用
中,仅限餐饮/酒
旅商家
云端托管,真人克
隆适配
仅本地生活类目
基础曝光
生态起步,少量
服务商
API报备,合规承
诺书
本地生活适配强
拼多多
起步探索,头部
品牌试点
低,仅定向邀约
头部品牌
无公开自研,第三
方接入
无专项扶持政策
生态空白,无官
方认证
无专项治理机制 无额外技术成本
13©2026 iResearch Inc.
数字人电商直播行业发展-政策驱动
政策已经从“鼓励探索”转向“规范引导”,促进行业长远发展
2024-2026年数字人电商直播行业,政府以扶持筑基础、以监管划边界,推动技术迭代与合规发展,行业已实现从野蛮生长到规范运营的转型。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
国家与地方扶持与监管政策
年份 政策类型 政策名称及发布主体 核心内容
2026年
扶持政策
商务部《数字商务三年行动计划(2024-
2026年)》
培育数字消费,支持数字消费场景创新,鼓励直播电商新业态,为数字人直播融入电商场景提供宏观背书。
监管政策 广州市《直播电商规范经营指引清单》 首次明确AI数字人直播合规要求,需合法获取使用权、征得肖像权人同意,形象符合公序良俗。
2025年
扶持政策 北京通州区数字产业扶持细则
将数字人纳入AI、元宇宙支持范围,给予企业最高100万元技术攻关奖励,中小微企业享30%采购补贴及最高
50万模型/算力券。
监管政策 浙江省《网络直播营销行为规范指引》 细化数字人标识管理,严禁删除篡改标识、伪造名人形象引流,强化误导消费管控。
2024年
扶持政策 北京、深圳等地双节促消费配套政策 将数字人直播纳入促消费重点,通过政企合作补贴、技术工具开放,推动中小商家应用。
监管政策 《直播电商监督管理办法》(国家层面)将数字人主播纳入监管,要求显著标识AI身份,压实运营者主体责任,直播数据留存至少3年。
14©2026 iResearch Inc.
数字人电商直播行业发展-技术驱动
生成式人工智能(AIGC)的突破技术迭代,不仅赋予了数字人“有形的皮囊”,更赋予了其“有血有肉的灵魂”
从 “多模态大模型(思维引擎)→ 实时渲染 3D 重建(视觉体验)→AI实时互动(情感表达)”,构建了数字人从 “能思考” 到 “能看见” 再到 “能互动” 的能
力闭环。这种技术叠加的效应正在将数字人从“辅助工具”彻底升格为“核心生产力”,为电商直播带来了新的增长引擎。
来源:艾瑞咨询研究院自主研究及绘制。
01
多模态大模型为数字人直播提供了智能化的“思维引擎”
大语言模型赋能脚本与人设:自动生成直播脚本、产品介绍、互动话术,按品牌调性设定人设,降低人工运营成本
真实感提升:基于成熟的多模态模型的数字人可以理解弹幕中的文字信息,结合视觉场景进行情绪识别,从而进行
更加精准的互动。
运营效率的飞跃:借助大模型生成内容(AIGC)能力,数字人直播间可以实现24小时不间断运营。
场景适应能力:多模态模型允许数字人快速适应不同平台和语言环境,支持跨语言直播和多平台同步推流,打破了地
域和语言的限制
02
实时渲染与3D重建技术打造沉浸式的“视觉体验”
毫秒级响应:通过云端渲染技术,数字人的动作捕捉与画面生成可以在毫秒级完成,实现毫无卡顿的流畅观看体验。
超写实表现:快速迭代的3DGS(3D Gaussian Splatting)等技术突破,使得数字人的光影效果更加真实,面部表
情和微动作的细腻程度达到了“肉眼可辨”的级别。
成本与规模化:实时渲染的算力成本大幅下降(如每分钟成本从18元降至元),使得大规模部署数字人成为可
能,并且边缘计算与5G网络的结合也解决了并发交互的问题
03
AI实时互动,实现拟人化的“情感表达”
TTS音色克隆与情感语音:1-3分钟录音高保真克隆音色、语调;情感TTS自动切换语气(热情/温柔/叹息/笑声),
提升沉浸感
高精度动捕与自由态动作:光学/惯性动捕或视频驱动,手势、头姿、步态自然。京东JoyStreamer实现自由态数字
人(走动、拿商品、出画入画、镜头跟随),告别“站桩式播报”
音视多模态协同(动态CFG):生成早期优先文本指令搭动作框架,后期优先音频保口型对齐,剧烈运动时唇音同
步误差<秒
长时身份稳定:历史帧编码+伪最后一帧策略,30分钟以上直播保持面部、服装、背景一致,避免“身份漂移”
15©2026 iResearch Inc.
数字人电商直播行业发展-市场驱动
数字人成为商家降本增效的“最优解”
数字人通过抢占非黄金时段流量,以资产轻量化与人才结构重塑优化经营成本;用数据实时决策与自动化流程提升组织效能,最终推动行业从“重资产人力驱动”向
“轻量化数据驱动”的商业化范式迁移,为商家构建可持续的盈利模型。
≈≈
解决优秀主播培养周期长、流失率高带来的“人才荒”
数字人提供稳定的产出,让小微商家告别“一人兼多职”的精力枯竭
无需昂贵的专业设备与合规场地投入,缓解初期现金流压力,将重资产投入转
化为高弹性的数字化服务
数字化手段打破反馈机制滞后,支撑直播过程中的实时调整,确保每一场直播
的ROI可控
自动化直播流程减少了团队重复性劳动,让核心精力回归业务增长,而非消耗在
琐碎的场控协同中
优化经营成本 提升组织效能
资产轻量化
人才结构重塑
数据驱动决策
消除协作内耗
从重资产起步到轻量化运营 从人工复盘到实时决策
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
16©2026 iResearch Inc.
≈ ≈≈
数字人电商直播行业发展-需求驱动
顺应消费侧新需求:以数字化能力重塑信任、交互与价值
数字人凭借审美去同质化、24小时即时交互及全链路品牌陪伴,精准破解了传统直播的审美疲劳与转化瓶颈;通过数字化能力的重塑,实现从“流量运营”向“用户
价值深度服务”的效能跨越。
从审美疲劳到场景定制
用户对套路化、喧闹的直播产生审美疲劳。数字人能够精
准、冷静地呈现专业产品卖点,为用户提供更清晰、更高信
息密度的购物环境。
基于不同时段和用户画像,数字人可一键切换直播间装
修和话术,实现“千人千面”的消费场景化沉浸
结合AI大模型,数字人能秒级回复弹幕咨询,解决人工客
服疲劳期导致的咨询流失,提升用户从“心动”到“下
单”的决策速度
现代消费者不再习惯准时守候直播间。数字人全天候在
线,确保用户在任何碎片化时间进入,都能获得针对性的
产品讲解,满足即兴消费需求
数字人不再仅仅是“卖货员”,更是“品牌数字代言
人”。通过24小时的在线陪伴,建立起长期稳定的服务心
智,提升老客户复购率
用户对数字人接受度持续攀升,新生代群体对数字形态具备
天然好感与探索欲,数字人直播高度契合当下社交体验需求
与审美偏好,为直播消费注入全新吸引力
审美内容优化 顺应交互升级 信任机制重塑
内容去同质化
定制化场景共鸣
刷到即所得
即时响应体验
全链路服务化
接受度提升
满足即时性与碎片化需求 跨时空品牌陪伴
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
17©2026 iResearch Inc.
数字人电商直播行业当前痛点与挑战
数字人直播面临体验、运营、协同与合规等的多重短板,技术潜能尚未转化为稳定商业价值
数字人电商直播行业正处于“技术快速发展”与“规模化成熟应用”之间的关键瓶颈期。 其核心矛盾表现为:技术进步带来的降本增效潜力,与用户体验、运营效率、
产业协同及合规安全等多维度现实短板之间的巨大落差。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
技术挑战
• 成本与质量失衡
• 交互表现力不足
• 技术稳定性不稳
运营瓶颈
• 复合型人才短缺
• 运营流程不规范
• 用户接受度低
平台壁垒
• 流量支持政策分化
• 平台拥抱AI态度迥异
• 技术规则不兼容
合规风险
• 合规边界模糊
• 内容风险难控
• 责任维权难题
• 写实数字人制作成本仍高,轻量化数字人质量低、成本
小,体验差距悬殊
• 肢体动作僵硬不自然,面部表情单一,缺乏“真人温
度”,互动依赖预设话术,复杂问题解答能力弱,毫秒级
多模态同步不足
• 直播易受网络波动影响(如中断、画质模糊),AI生成内
容可能存在逻辑错误与违规风险。
• 兼具技术、运营、内容创作能力者少;多数运营人员缺乏数
字人直播专业知识与经验,对平台规则、话术优化、互动设
计等掌握不足
• 多数企业处于单兵作战阶段,缺乏标准化的运营流程与体系
化的支持保障
• 部分用户对数字人直播存在抵触心理,认为缺乏人情味、不
够真实;用户对数字人直播的预期过高,一旦体验不佳容易
产生负面评价
• 各平台对数字人直播的流量支持差异悬殊,多数平台无
专项扶持甚至明确打压,商家难获稳定公域流量
• 平台开放程度从积极拥抱到谨慎限制不等,准入门槛与
规则频繁变动,商家跨平台运营试错成本高
• 各平台的API、编码、审核标准不一致,一套方案难以多
平台适配,导致内容重复制作或违规下架
• 各平台规则不一;存储等环节的合规要求日益严格,数据采
集、使用、企业合规成本增加
• AI生成内容易出现虚假宣传、绝对化用语、侵权等问题;现
有平台审核体系难以应对海量 AI 生成内容
• 数字人、运营者、平台方之间的责任划分不够明确,出现问
题易互相推诿;消费者对数字人直播的维权意识增强,但维
权难度大,取证成本高
18
数字人电商直播行业应用洞察02
19©2026 iResearch Inc.
电商零售行业数字人直播应用概况
AI重塑直播生态,数字人正成为电商商家的新标配
数字人直播已成为电商零售行业的标配能力,呈现规模化普及、增长的态势,并深度渗透至各规模商家及主流品类,成为驱动行业增长的新引擎。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
整体普及率:从“试水”迈向“标配”,商业价值凸显 不同规模商家数字人直播应用情况
头部商家:深度应用,人机协同
腰部商家:规模化主力,降本增效
中小商家:技术普惠,低门槛入局
• 2025年618期间超过50%的头部品牌已实现72小时连续直播
• 模式多为“真人黄金时段+数字人夜间/闲时值守”
• 高管数字人IP成为营销新亮点
• 通过数字人实现7×24小时不间断直播,替代部分真人
• 利用数字人矩阵覆盖多品类、多时段,抢占长尾流量
• 入门级数字人产品价格从百万级降至数百元,甚至免费
• 帮助中小商家以极低成本开启直播,抓住夜间等“长尾流量”
核心应用品类:聚焦“高适配”赛道
美妆 服饰鞋包 食品饮料 母婴用品 3C数码 家居家电
平台应用规模与增长
• 京东平台:2026年Q1京东头部商家数字人开播率达80%,
数字人已成头部品牌常态化经营标配
平台商家开播率
• 商家规模:2026年Q1京东数字人累计服务商家突破7万,25
年全年带动GMV超数百亿元
• 开播增长:2026年Q1京东数字人开播量同比激增10倍
主力品类:美妆、服饰鞋包、食品饮料、母婴用品、3C数码、家居家电等标准化程度高、
讲解逻辑清晰的品类。这些品类产品参数明确,适合数字人进行7×24小时标准化讲解,
且转化效果稳定。
20©2026 iResearch Inc.
电商零售行业数字人直播典型应用场景
电商零售行业的数字人直播已形成多元应用场景
电商零售行业的数字人直播通过真人主播数字分身降本增效、AI总裁背书建立信任、双主播协同优化转化、双IP互动提升停留、跨品牌联动推动年轻化、文化IP跨界实
现破圈、品牌叙事传递情绪价值等形成多元场景的核心价值矩阵。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
真人IP数字化
真人主播数字分身 AI总裁数字分身
主播IP资产化,人
机协同降本增效
权威背书,信任传递
多人互动模式
数字人双主播协同 品牌双IP互动直播
直播内容丰富度提
升,转化效率优化
内容差异化,用户
停留提升
跨品牌数字IP联动
流量互换,品牌年
轻化
创意内容型
IP活化与文化IP跨界 品牌叙事沉浸式直播
文化赋能,流量破
圈
情绪价值创造,品牌
深度沟通
① ②
③ ④ ⑤
⑥ ⑦
21©2026 iResearch Inc.
头部零售商家数字人直播需求
以品牌增值为核心目标,核心诉求为创意IP化、闲时补充及深度互动,对技术与品牌适配性要求高
头部商家将数字人视为承载品牌调性的“数字资产”,通过打造专属IP(如AI总裁福利官)制造稀缺感与信任背书,同时利用闲时直播实现“全天候品牌在场”,形
成“闲时蓄水、高峰转化”的24小时直播闭环。在实际运营中,采用“数字人覆盖效率、真人深耕情感”的人机协同模式,数字人负责低转化时段及创意互动,真人
聚焦流量高峰与情感深绑。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
创意玩法
• IP化角色定制:基于品牌真实人物
(如总裁)打造专属数字人,兼具权
威感与亲和力
• 节点玩法:新品首发、周年庆等大促
空降直播间,以“总裁身份”派发限
时福利、签名好礼、专属折扣码
• 常态化互动:设计“总裁送福利”等
固定环节,提升参与感
闲时补充
• 闲时无缝接管:真人直播聚焦晚8点至
12点高峰时段;其他时段由数字人完
全承接
• 闲时职能:品牌形象输出 + 基础讲解
+ 福利提醒 + 自动咨询种草 + 发券
• 流量接力:数字人自动承接咨询、种
草、发券,待真人主播上线后实现流
量接力
Text
here
• 情感连接:数字人不仅要有问必
答,更要代表品牌与用户建立情感
连接
• 意图识别:在闲时自动识别用户意
图,完成商品种草与券码发放
• 人机协同:与真人主播协同,数字
人预热蓄水,真人深度互动,共同
提升转化效率
深度互动
22©2026 iResearch Inc.
腰部零售商家数字人直播需求
以降本提效为目标,核心诉求是实时互动、丰富模板、便捷开播及AI脚本等,兼顾效果与成本平衡
腰部商家以数字人破解主播成本高、留存难困境,通过基础实时互动保障转化效率,借助丰富模板库快速适配多品类运营,依靠便捷开播让有限人力发挥最大效能,
利用AI脚本生成解决内容同质化问题。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
实时互动
• 互动聚焦于及时性的
实时互动,确保直播
间正常运转、用户问
题得到回应
形象模板库
• 需多样化现成模板,
数字人形象能够快速
适配不同产品风格、
不同目标人群
Text
here
• 简化开播流程、缩
短筹备时间,降低
操作门槛
开播便捷性
Text
here
• 快速产出合规、实
用的直播脚本,节
省文案人力成本、
解决内容同质化
问题
AI脚本生成
23©2026 iResearch Inc.
中小零售商家数字人直播需求
以零门槛变现为目标,核心诉求为一键开播、持续运行与低成本覆盖,聚焦长尾流量挖掘
中小商家以数字人解决“有货无人播”困境,通过一键开播实现零门槛入场——无需专业团队、无需绿幕影棚,仅需几分钟视频素材即可生成数字人;依靠7x24小时
持续开播实现全天候流量覆盖,用时长换曝光、换成交;同时以极低边际成本实现高性价比运营,降低试错门槛。
来源:公开信息整理。艾瑞咨询研究院自主研究及绘制。
一键启动,7x24小时持续运行
• 一键开播:极致简化的操作流程,将复
杂的直播筹备压缩至最简单步骤,让无
技术背景的商家也能在几分钟内完成数
字人直播间的搭建与启动
• 持续运行:利用数字人7x24小时不间断
工作特性,覆盖真人无法值守的凌晨、
早间、工作日下午等闲时时段,用时长
换曝光、换成交
极简开播: 低成本覆盖:
• 制作成本低:仅需上传几分钟视频素材即
可生成数字人,无需绿幕影棚、专业设备
或拍摄团队
• 运营成本低:无需雇佣全职主播或搭建专
业直播团队,账号边际成本低
• 试错成本低:商家可快速上线测试不同品
类、话术、时段效果,灵活调整策略,降
低转型风险
低门槛投入,高性价比运营
24
京东官方数字人直播方法论与实践03
25©2026 iResearch Inc.
数字人电商直播能力行业评估标准
从视觉、交互、决策、易用和价值评估数字人电商直播能力
突破传统以GMV、观看人次为核心的单一流量评估逻辑,艾瑞构建了“五维一体”的全链路能力评估框架,从视觉表现力、智能交互力、智能决策力、运营易用性、
商业价值力五大维度,对数字人电商直播能力进行系统化的评估。
来源:艾瑞咨询研究院自主研究及绘制。
视觉表现力
智能决策力 商业价值力
数字人
直播能力
评估标准
像不像真人? 会不会互动?
懂不懂业务?
好不好用?
有没有回报?
形象拟真度:复刻真人的外在神
韵与内在神态
动作流畅性:肢体动作的丰富度、
自然度与连贯性
人货融合度:与商品、背景的真
实感
实时响应能力:对弹幕、评论等用户
输入的识别速度与回复准确性
情境感知能力:理解对话上下文语境,
并根据用户意图做出个性化、有温度
的回应
动态场控能力:察言观色、智能调控
业务理解深度:懂商品、懂营销
思考推理能力:解决复杂问题
内容生成质量:自动生成高质量脚本、话术、
营销文案
开播便捷性:从账号配置、商品导
入到正式开播的流程简单性
人机协同度:为人工运营预留充分
的介入与调整空间
模式灵活性:提供多种直播模式
转化效率:在单位时间内的转化率、GMV产出
成本优化:相较于真人直播,在人力、场地、设
备等方面的成本下降
资产沉淀:直播过程自动产生可复用的内容资产
智能交互力 运营易用性
26©2026 iResearch Inc.
京东官方数字人直播方法论
京东官方数字人电商直播方法论高度契合艾瑞数字人电商直播能力评估标准,依托全栈自研技术,以用户体
验、运营效率、技术支持、数据安全、生态共建五大要素实现从工具替代到智能协同,赋能品牌全天候、高效
率、可复制、安全合规的智能化直播
U
E
CS
T
京东官方数字人
直播方法论
User
从形似到神似,支持自然走动、灵活摆姿,镜头跟随、出画入画流畅形象体验
声音表达
内容逻辑
交互体验
情感化TTS,抑扬顿挫,告别机械朗读
有温度、有逻辑、有个性的脚本与对话
低延迟响应 + 情境感知,实现有来有回的互动
JoyAI
大模型
全栈自研,多模态能力与产业赋能
数字人
大模型
京东 JoyStreamer 和 JoyStreamer-Flash 两个数字
人大模型,实现了长时长、自由态、实时互动的数字
人生成效果
用户体验要素
技术支持要素
运营效率要素
生态共建要素
一键开播
模式
专业模式
复刻模式
质量评估
机制
流量激励
闭环
协同
生态力
超简单,快人一步,自动配置+智能开播
海量形象+多元音色,组合开播更专业
1:1还原声/形/景,支持大姿态(90度转身、
出镜、遮挡)
以拟真度、脚本、商品展示为核心,五档质
量分级
高质量内容 → 高流量激励 → 正向循环
京麦服务市场,协同构建生态能力
数据安全要素
前置合规
使用安全
内容审核
肖像授权 + 数据脱敏 + 上线备案
身份验证 + 隐私保护 + 合规引导
涉政/歧视/违禁内容全量审核 + 生成内容标识
违规处置
算法备案
投诉机制 + 违法信息库 + 模型优化
大模型内容生成 + 数字人形象合成双备案
27©2026 iResearch Inc.
用户体验要素:形象、声音、内容、交互
京东数字人JoyStreamer通过形象从“形似”到“神似”的视觉进化、情感化声音表达、人性化内容逻辑与低
延迟情境交互,实现了从技术拟真到自然、有温度的人性化交互体验的全面跨越
“超真人”形象体验
• 从“形似”到“神似”的视觉进
化,数字人不仅只是僵硬的盯着屏
幕,而是更加自由的进行自由的动
作展示、运镜等
“超真人”声音表达
• 聚焦于情感化、个性化的语音合成
(TTS)与声音复刻技术,让声音富
有情感、抑扬顿挫,而非机械朗读
“超真人”交互体验
• 通过低延迟响应与情境感知能力,
实现像真人一样自然、即时、有来
有回的互动
“超真人”内容逻辑
• 通过高质量的对话脚本、知识库与
AIGC内容生成,使数字人的回应不
仅准确,更具备人性化的逻辑、温
度与个性
形 声
交内
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
28©2026 iResearch Inc.
极致拟真:京东JoyStreamer发布行业首款“自由态数字人”
京东JoyStreamer“自由态数字人”突破传统局限,实现从 “静态播报员” 到 “动态参与者” 的形态革新,
精准适配家电家居、服饰美妆、3C数码、快消零售、营养健康五大行业,以自然灵动交互赋能多场景,引领行
业全新体验
“超真人”形象体验
前后走动、左右转身、进出画面等更拟真动作
赋予数字人“生命感”!
真人级动作,全场景自由驾驭
人景合一直播画面深度融合
缔造用户沉浸体验!
镜头智能跟随,直播如临其境
数字人可实现“吃播”“走播”能力
解锁更多直播模式!
无惧唇形遮挡,新场景拓展延伸
京东官方数字人主播以极致拟真质感与灵动自然的肢体表现,支持自然走动、灵活摆姿,镜头跟随、出画入画流畅,脸部遮挡也能保持高保真质感,打
造行业的全新体验。
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
29©2026 iResearch Inc.
声音体验:京东语音技术驱动数字人情感化交互革命
京东数字人JoyStreamer语音技术历经八年演进,依托迭代模型与海量数据攻克拟真、情感、实时率等核心难
题,精准匹配多元消费偏好,提升直播亲和力与信任度,助力品牌高效转化与温度化交互
“超真人”声音体验
从0到1
发布基于BRPC的流式
版本
Tacotron+World
文本语音联动落地
Tacotron2+Lpcnet
实时TTS架构落地
DIAN+Lpcnet
体验再升级
FS2+MelGan
更加拟人化
音色更拟人、韵律更丰富
京东语音技术
语音离散化+LLM建模
10万+小时训练数据
京东语音技术
多语言支持、情绪、语速
控制、方言解耦.
80万小时训练数据
京东语音技术
情感解耦,更丰富的语音表现
100万小时训练数据
同一音色流畅切换多种语言
(中文、英语、日语、韩语等)
多语适配
同一文本表达不同情绪
(开心、悲伤、愤怒、平静等)
情绪可控
同一音色呈现不同方言特色
(普通话、粤语、四川话、东北话等)
方言覆盖
根据用户需求灵活控制语音速度
(保持语音自然度和可理解性)
语速可调
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
30©2026 iResearch Inc.
脚本引擎:“经验驱动” 进入 “数据赋能” 的全新阶段
独家联动京东核心电商数据资源,我们打通全链路数据体系,通过多模态脚本编排与销售逻辑嵌入,实现“讲
得好、卖得快”的直播内容体系,提升信息密度、节奏控制与行动引导能力
内容结构
• 强调文稿段落合理
• 控制信息密度、强化整体节奏
• 结合TTS语音节奏优化和视觉切换
证据展示
• 使用产品卖点讲解、场景演示、福利机制
等手段
• 优化文稿与视觉素材匹配战略
交易转化
• 多品类场景中,使用促单频次控
制、CTA(Call to Action,行动号
召)设计、商品组合策略等手段
提升用户信息获取效率
和观看体验
增强用户信任感和购买意愿
提升展示的相关性和精准度
提升用户下单率和客单价
实现卖点+逼单的标准化策略
脚本化解决方案
打造高销售力内容
提升高直播间质量
实现高交易转化
以真实、精准的京东商品数据为根基,深度拆解用户消费偏好、价格敏感度、场景需求等核心痛
点,让每一句话术都有数据支撑、每一个卖点都贴合用户需求
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
31©2026 iResearch Inc.
互动能力:电商基因驱动,数字人互动新范式
京东数字人JoyStreamer打造以互动Agent为核心的智能交互体系,通过知识增强型问答、场控动态响应、智
能体协同三大核心技术框架,结合类比真人的表达结构与口语化能力,实现数字人直播交互对标真人直播,重
新定义数字人直播互动新范式
互动Agent
数字人对标真人主播
真人主播应变能力与情感化交互
核心技术架构 智能交互策略
构建
场控智能体:基于直播目标,全局调控直播节奏与流程
互动智能体:基于用户需求,识别意图实现个性化应答
独有电商知识增强型问答
知识融合:商品信息、平台信息、商家知识、促销政策(如国补)实
时同步,信息零时差。
意图预测:基于用户历史行为,主动预判需求,服务更贴心。
商家赋能:引入商家自有知识库,包括客服话术、产品手册、使用教
程、品牌介绍等,为数字人直播间打造完备可靠的知识来源。
实时洞察:识别用户等级、优惠、国补资格,商品诉求,推荐更精
准。
场控动态响应机制
工具链实时调用:集成用户画像、追踪订单、知识查询与直播营
销工具(红包、抽奖、优惠券等),互动即可执行。
策略动态优化:基于实时观看、互动、转化数据,自动调整数字
人主播讲品、互动、促销等节奏。
多智能体协同机制
策略中枢
对直播间弹幕进行实时意图分
类与转化潜力分析:对高意向
问题极速应答,对低价值干扰
类问题智能过滤/延后处理
意图驱动高优响应策略 流量自适应策略
基于实时流量感知的智能引导,
主动触发引导策略,引导下单、
引导互动,最大化直播间增长
效能。
高流量场景: 聚焦高效转化,
筛选关键问题,快速响应
低流量场景: 引导提问并解析
商品对比与场景,吸引停留
真人级互动衔接策略 智能主动场控策略
上下文感知智能打断,应答后
丝滑回归商品讲解实现真人级
无感知交互,保障直播体验连
贯性
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
32©2026 iResearch Inc.
运营效率要素:一键开播、智播、复刻模式
通过一键开播的自动化配置、专业开播模式的人机协同提效与复刻模式的全维度无损还原,京东数字人直播在
降低运营门槛的同时,实现了从快速启动到精细化运营的灵活覆盖与真人级表现
一键开播模式-超简单,快人一步
通过智能分析您的店铺信息,商品信息、直播历史信息等内容,您仅需通过筛选、审核、
确认即可实现自动化、智能化的一键完成数字人直播间配置和开播,并在开播后实现商品
讲解的自动切片和投放,提升直播间的公域和私域流量。
专业开播模式-海量形象+多元音色,组合开播更专业
内置近百款精品用户形象,覆盖多元风格与场景。支持自由选择音色、语调与语速,搭
配形象、声音、风格多维组合,灵活匹配品牌调性,打造高质量数字人主播,高效开启
专业直播。
复刻模式-1:1还原声/形/景
复刻模式的核心,是实现真人直播场景的全维度无损还原,彻底区别于传统从
零构建虚拟形象的数字人。 不仅能精准复刻主播形象、声线神态与直播间布
景,更支持大姿态直播间复刻:数字人可轻松实现 90 度以上转身、出镜、面
部遮挡等自由姿态,动作流畅无违和。
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
33©2026 iResearch Inc.
一键开播模式:超简单,快人一步
通过智能分析店铺信息,商品信息、直播历史信息等内容,商家仅需通过筛选、审核、确认即可实现自动化、智
能化的数字人直播间配置和开播,并在开播后实现商品讲解的自动切片和投放,提升直播间的公域和私域流量
让直播像发朋友圈一样简单
零门槛开播
告别调试,点击即用,新手秒变专业主播
AI能力加成
自动配置画面/话术/互动,用户体验拉满
多场景适配
适配大促活动、平销期等不同场景
1 2 3
点击“一键开播”
商家信息自动扫描&确认
一键直播间配置/审核
智能选品策略
AI文案写作
直播间装修
互动交互配置
直播间推流开播
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
34©2026 iResearch Inc.
专业开播模式:海量形象+多元音色,组合开播更专业
京东打造覆盖直播筹备、运营、结束全流程的专业开播模式,形象x音色x脚本x互动的灵活调整组合,助力商家
打造富有特色的数字人主播,24小时不间断开播,带货更高效
近600+高表现力数字人形象 100+带货主播音色
多种装修模板灵活选择 一键配置大模型问答
多种脚本人设灵活选择
达人型 专业讲解型 贴心闺蜜型 匠心创业型
搞笑段子手型 高端精英型 讲品不讲价型
8大电商直播场景全覆盖
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
35©2026 iResearch Inc.
复刻模式:全维度无损还原提质增效
京东推出数字人直播复刻模式实现真人主播形象、声线、神态及直播间布景的全维度无损还原,达成形似与神
似的双重突破,通过极简操作流程实现小时级快速开播,降低直播运营成本,实现直播内容高效复用与带货效
率提升
优秀真人主播1:1复刻 直播音色1:1复刻 直播间1:1低成本复刻
“形似”
精准复刻主播形象、声线神态与直播间布景
主播自由态直播间复刻:还原主播任意真实直播
姿态与行为,可轻松实现 90 度以上转身、出
镜、面部遮挡等自由姿态的复刻呈现
讲解时的语气停顿、神情动作更与真人高度一致,
深度还原主播语气、语速、语调等个性化特色,彻
底告别机械合成音,带货话术、互动应答语气自然
贴合真人状态,搭配唇形精准同步技术,实现视听
体验高度统一,用户观感与真人直播无异。
“神似” “景真”
基于商家存量直播素材的学习,即可快速1:1复刻,
还原真实直播间布景与品牌元素,不仅仅在直播体
验上与真人主播无差别,数字人主播可实时响应弹
幕、在用户互动和主动促单上发挥优势,实现7×24
小时高品质的不间断开播。
≈
阅读素材要求 确认授权 上传素材 等待复刻 创建直播 修改文案 配置商品 开播
京东数字人复刻直播
开播操作流程 “低成本运营” “高效带货” “极简操作” “小时级快速开播”
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
36©2026 iResearch Inc.
技术突破:实现从机械响应到类人表达的跨越
京东 JoyStreamer 和 JoyStreamer-Flash 两个数字人大模型,解决行业长期存在的文本指令控制力弱、多模
态控制信号冲突、长时长生成能力不足等痛点问题,实现了长时长、自由态、实时互动的数字人生成效果,相
关成果发表在了 arXiv 上,新一代数字人的性能全面超越了当前 SOTA 模型,将效果推向了新的高度
“文本驱动,精准可控” “实现音画高度同步” “长视频稳定生成”
双教师DMD后训练技术 动态CFG调制策略 历史帧+伪最后一帧结构
以往数字人常因无法准确理解复杂指令
而“答非所问”。京东数字人创新性采
用双教师模型的DMD后训练方法,无
需新增训练数据,通过音频、文本两个
专属教师模型,让数字人能够精准响应
复杂动作、镜头交互等指令,从根本上
提升了文本驱动的可控性
声音与动作的割裂是数字人“假”感的
主要来源。针对“音频主导节奏、文本
主导动作,两种控制信号相互干扰导致
数字人动作失真”的行业痛点,京东数
字人运用动态CFG调制策略,从根源上
解决文本、音频多模态控制冲突,实现
了口型、表情、肢体语言与语音内容高
度一致,让数字人的表演流畅自然,告
别“声画不同步”的尴尬
行业长期面临长视频生成质量下降、画
面闪烁、动作重复的难题。京东数字人
采用历史帧+伪最后一帧结构,稳定支
持30秒以上的高质量长视频生成,全程
保持形象统一、动作流畅,为直播切片
等长内容创作提供了可靠工具
根据内部测试与第三方基准评测,京东数字人在唇形同步、身份稳定与动作自然度上全方位超越国际SOTA模型,达到商用级水准
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
37©2026 iResearch Inc.
≈
≈
JoyAI大模型:从通用能力到深度思考的模型跃迁
京东自研全尺寸大模型体系,融合三大创新算法与高效推理机制,为数字人直播提供底层认知与决策支撑
高智力密度思维链
(CoT Synthesis)
注入产品知识
合成高智力密度思维链数据
构建高效自动化数据生产体系
提升数据智力密度
更懂电商业务逻辑
电商业务结合度低
渐进式混合思考
(Progressive Mixed Thinking)
兼具即时反应与深度逻辑
逻辑理解浅层,缺乏深度思考
同态变分推断强化学习
(HVRL)
交互拟人感和效率更好
拟人化弱,直播体验生硬
自研Q-EPLB机制
实测数据:推理速度较传统EPLB提升倍
吞吐性能:单卡吞吐量高达3000tokens/秒
商用成本更低,直播体验更佳
商用成本高,性价比不足
JoyAI 京东大模型
京东大模型品牌升级为JoyAI,涵盖从3B到750B的
全尺寸模型,能满足产业多样化需求。模型涵盖语
言、语音、图像与多模态、数字人等多种模态
多模态能力与产业赋能
语言大模型 语音大模型 图像与多模态大模型 数字人大模型
三大创新算法 自研推理机制
提出PST-渐进式监督微调与自博弈偏好优
化协同创新方案
实现模型从通用能力,向深度思考+快思考
混合能力的自我演化与性能提升
降低深度思考与快思考任务单独部署模型的
成本与复杂度
支持开发者与用户高效适配特定任务,灵活
调整模型推理行为
具备隐空间推理,即“默思考”能力
训练阶段:通过HVRL算法驱动,大模型学
会在隐藏空间完成思考过程,在回答问题时
不复述推理过程,直接输出答案
推理阶段:对于用户提出的问题,大模型学
会在隐藏空间进行静默思考,并直接回答用
户问题
采用训推一体、部署成本友好的稀疏MOE架构
创新性引入Q- EPLB机制
对稀疏专家模型实施INT4与FP8混合精度量化策略,
保障模型精度、实现混合量化环境下的专家负载均衡
Q-EPLB针对MOE通信瓶颈中的分发与合并操作,应
用了量化后All-to-All通信传输机制,这一优化有效降
低了Attention模块与MOE模块之间的计算时延比例
【权威综合评测榜单 R bench 0924】
得分:
【推理能力】
全国排名:TOP1
全球排名:TOP2
京东表现vs行业表现
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
38©2026 iResearch Inc.
京东数字人构建了端到端、全流程安全治理体系
模型训练&上线前置阶段 违规处置阶段用户使用阶段 内容生成阶段
模型训练阶段
应
用
层
用户使用 内容安全审核
生成内容标识
违规处理阶段
算
法
层
大模型内容生成算法备案
网信算备10115536455201230023号
数字人形象合成算法备案
网信算备10115536455201230031号
肖像授权:真人数字人模特完成
肖像授权
训练数据:采集及训练数据合规
审核
数据标注:数据脱敏,符合安全
规范
上线前置阶段
备案评估:上线前安全评估
信息公开:基础算法、技术体系
等信息
用户身份:使用者身份验证
用户引导:规避损害他人合法权
益、不当商业用途等使用
用户信息保护:保护用户输入
和输出信息安全
用户隐私政策:使用期间确认用
户隐私协议
涉政言论审核
歧视内容审核
生成标识:生成图片、视频、直
播等均存在显性和隐性标识
违禁内容、恐怖暴力等内容审核
投诉举报:建立用户投诉接受处
理机制
违规处理:违法信息数据库、违
法信息处置、违法用户服务终止
模型优化:不合规内容通过模型优
化、审核强化,防止再次生成
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
39©2026 iResearch Inc.
引导与激励:京东数字人直播质量评估体系构建
京东建立数字人直播标准化质量分评估机制,以拟真度、脚本、商品展示为三大核心评估指标,划分三档质量
分级,通过动态评估实现评级迭代,以流量激励形成内容与流量的正向循环,推动行业向质量驱动转型
三档质量分级
三大评估指标
质量分评估体系相关指标
动态评估机制
质量分分档
优秀核心流量权益
综合评分为【优秀】的账号,可在推荐、搜索、直播场域等公域高优
展示,质量越高的直播间有机会获得更多曝光
待改善
良好
优秀
拟真度
主播形象
脚本
商品展示
主播语音
主播动作
互动表现
讲话质量 话术逻辑 实际控场
商品展示 背景
京东数字人直播质量评估体系
平台采用动态评估实现评级迭代,商家可通过持续优化直播质量实现
评级跃升,确保评估结果与实时表现紧密挂钩,保持竞争活力
数字人直播质量【优秀】评估标准
指标 细分维度 【优秀】评估标准
拟
真
度
脚
本
商
品
展
示
形象
语音
动作
互动
妆造美观 高度写实或高拟真
高保真人声
语速停顿自然 个性化音色
情感表达自然细腻
动作丰富流畅
肢体语言情感表达 微表情丰富自然
快速反馈 主动自然互动准确回复
讲解质量
话术逻辑
实际控场
商品展示
背景
开场有钩子 结尾有逼单中间有核心
真实自然口语化表达
实物展示
光影设计好 背景美观色彩协调
权益贴片呈现关键信息 贴片与直播间风格统一,高效互动
形象气质好
商品展示与讲解结合
动作细节高度逼真动作过渡自然
场景跟品类/品牌强相关
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
40©2026 iResearch Inc.
京麦服务市场:商家全域交易与履约枢纽
京麦服务市场以开放生态为核心,精准响应商家需求并提供免费试用入口,高效链接数字人服务商与商家,打
通需求匹配、交易购买、落地使用全链路,实现供需高效撮合,助力商家降本增效
服务商严选 资金保障 服务保障 售后保障
京麦服务市场
高效撮合
京麦服务市场()
平台首页 搜索推荐 商品详情核心场景
官方活动 加速能力提升
官方精选 中小商家权益包/新商礼包
官方认证 搭建经营标杆
京卓越 服务星榜 案例体系
商家
商品订单
店铺会员
广告内容
整合营销
……
输出需求
服务商
ISV工具
运营类服务
讲师
官方服务
……
提供服务
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
41©2026 iResearch Inc.
京麦服务市场:协同构建生态能力
京麦服务市场以官方底座筑牢普惠服务根基,三方ISV精准补位细分场景,形成分层协同体系。该模式破解了商
家全生命周期的能力错配难题,构建起平台、服务商与商家共生的电商服务新生态
头部
中部
商家
长尾
开放底座+技术支持
通用工具+行业政策引导
标准化免费工具+基础功能
个性化定制服务
行业进阶/差异化方案
轻量辅助/便捷插件
官方 三方ISV
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
42©2026 iResearch Inc.
AI智能客服
京麦服务市场:五大AI能力矩阵
京麦服务市场打造数字人直播、智能客服、图片生成、视频生成、数据分析五大AI能力矩阵,助力商家提效直
播经营、拉升转化效率,实现降本省时、数字化高效运营
AI数字人直播
24小时
日不落直播,商品讲解
实时弹幕互动
自动回复,动态调整话术
全时段覆盖
填补深夜流量洼地
长尾渗透
千款商品自动化讲解
成本仅3%
边际成本趋近于零
核
心
能
力
核
心
价
值
• AI客服:动态生成个性化内容,支持文档
自动解析、实时学习、自动生成
• 客服质检:实时会话质检,提供实时告警
AI图片生成
• AI场景:低成本批量生成多场景,多风格
图片
• 详情页:模版化工具一键生成多尺寸
边际成本低:成单张图片边际成本趋近于零
迭代速度快:快速调整细节,无需重拍
自动优化:人力投入少,问答灵活性高
多语言支持:支持100+语言实时转换
AI视频生成
• 图生视频:基于产品图片生成动态视频内容
• AI短视频:AI生成短视频,AI文案,AI排版
海量覆盖:万级SKU视频自动化
极速响应:热点促销即时产出
分钟级迭代:参数化调整画面/文案
AI数据分析
• 可视化数据分析:对话式数据分析及可视化
• 对话式市场调研:自动获取经营数据,生成
报表
操作敏捷:自动执行全流程,秒级结果展示
决策辅助:自动归因分析并给予预测建议
学习成本低:自然语言交互,自动纠偏
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
43©2026 iResearch Inc.
京东官方数字人商家权益与开通指南
京东官方数字人支持商家免费一键开播,可享五大核心权益与平台流量扶持,开通流程简单便捷
▍核心商家权益
平台官方商家补贴
全面开放数字人直播,所有商家免费一键开播
公域流量全域开放
开播即享流量倾斜,高效触达亿级用户
▍五大免费权益
京东数字人直播开通路径
1 京麦服务市场搜索“京东官方数字人”
2 点击“立即订购”
3 进入“已订购服务-我的服务”
点击“立即使用”,按指引操作
开启专属数字人直播
4
5
形象自由选
• 近300款大姿态形象,200+专业
音色
内容零压力
• AI生成直播剧本,内容创作轻松
高效
流量最大化
• AI切片分发,批量内容裂变,触
达更多用户一键开播
• 开放定时开关播,操作门槛低,
运营无忧
互动更高效
• 数字人实时回复用户问询,高效
促单
运营
效率
要素
技术
支持
要素
数据
安全
要素
用户
体验
要素
生态
共建
要素
44©2026 iResearch Inc.
京东×联想:人机协同,打造日不落直播间
• 3C用户决策周期长,真人无法值守导致流失 • 直播人力成本高,闲时承接效率低,严重制约ROI提升
全时域覆盖难1 运营成本高企2
“真人+数字人”联动,数字人成为店铺运营新基建
• 2023年引入京东数字人,日均直播18小时,无缝衔接真人团队。黄金时段真人
互动,非黄金时段数字人补位,实现24H不间断直播
实战数据
数据周期::2025年期间
367%
观看量增长
80%
运营成本降低
59%
GMV同比增长
55%
数字人时段成交占比
时长即金钱
经营启示:未来的
方向
京东数字人
解决方案
核心挑战:覆盖难
及成本高
数字人深度应用案例
• 全时段流量覆盖是提升ROI的关键,尤其
对标品及高客单价品类
人机协同最优解
• “真人+数字人”双开策略,实现低成
本、高效率的全时域运营
数字资产化
• 数字人不仅是工具,更是可沉淀、可复用
的品牌核心数字资产
公模数字人 复刻数字人 数字人IP 打造
45©2026 iResearch Inc.
京东×东阿阿胶:全时覆盖,破局高客单转化
• 围绕阿胶相关专业问题、商品信息,数
字人进行多维度价值传递
真人+数字人,时段互补
智能互动,多维价值传递
• 真人+数字人协同直播,有效扩大流量
场域,依托高逼真数字人填补真人时段
空白,实现全天候流量承接
实战数据
历史数据统计
60%
公域流量占比
千万级GMV
数字人直播间全年累计
经营启示:未来的
方向
京东数字人
解决方案
核心挑战:转化与
覆盖难
高拟真化、真人化动作
• 打造真人级沉浸式直播体验,数字人讲
解支持直播间KT板展示、产品细节对比
等
全时流量覆盖
• 全时段流量承接,降本增效提效,激活大健康
行业 “非黄金时段” 的精准流量
标准化、专业化
• 专业内容标准化,破解 “专业讲解难、
知识传递不统一”行业痛点
行业实践应用案例
• 阿胶作为高客单产品,用户会多维度进行价值对比,决策
重,直播难以一次转化
• 用户购买时间分散,真人直播难以实现全时段流量承接
用户决策链路长1 全时域覆盖难2
标准化输出,实时迭代
• 通过“品牌专属Q&A库+标准化脚本”,将阿胶专业知识
固化为数字人讲解内容,可精准、无偏差地传递产品成分
功效、适用人群界定、合规性说明等核心信息
• 支持根据产品迭代、行业新规更新知识库,实现专业内容
的标准化、规模化输出
数
字
人
直
播
间
直
播
间
信
息
展
示
补位赋能
• 数字人直播不是“替代真人”,而是大健康行业的
“经营补位与升级”,与真人形成优势互补,共同构
建稳定、专业、高产出的直播经营体系
46©2026 iResearch Inc.
京东×海尔:双IP访谈,引领行业内容直播新模式
双IP访谈式应用案例
双IP访谈式直播创新
• 海尔AI总裁与京东AI马红红组成双 IP,
以播客访谈形式亮相直播间,围绕产品
功能、消费者诉求及优惠福利打造差异
化内容,引领行业内容直播新模式
实战数据
经营启示:未来的
方向
京东数字人
解决方案
核心挑战:形式固
化与全域增长难
内容创新
• 打破传统带货的单向输出,用访谈式双
IP 互动,能有效激活用户兴趣,在同质
化营销中突围
IP 联动
• 品牌数字人 + 平台 IP 的组合,可借
助双方流量与信任背书,实现 1+1>2
的传播与转化效果
• 品牌多采用传统单向带货直播,内容形式单一、用户参与
感弱,难以在海量营销中脱颖而出,破圈引流难度大
直播形式同质化1 全域增长乏力2
全域矩阵营销
• 联动站内外多维传播入口,实现矩阵式
扩散,助推声量高峰,放大直播影响
力,实现全域流量与业绩双提升
站内外联动
• 数字人直播与站内外传播矩阵协同,
以内容为触点,实现品牌曝光与销售
转化的双重跃升
历史数据统计
增长11%
海尔店播引导成交同比提升
200%+
海尔店播直播流量同比提升
超千万
全网传播曝光量级
播客访谈形式 场景使用、产品介绍
• 传统直播仅聚焦站内流量,站外传播力不足,无法实现全渠道曝光;同时
单向带货互动性弱,难以激发用户消费热情,制约成交与声量双提升
47©2026 iResearch Inc.
京东×十二品牌:组团破圈,开创硬件AI直播新玩法
创新实践应用案例
• 硬件品类用户圈层化明显,传统营销难以触达
Z 世代年轻群体,品牌声量局限于专业玩家
• 传统硬件直播以产品讲解为主,形式单一,用
户停留和转化效率低
圈层破圈难1 直播转化弱2
• 开创「AI 科技 ×DIY 直播」新范式,2026年3月在京东
「装机大师」直播间完成合体首秀,以数字人创意舞台秀
+ 青春采销上场带货的形式,打造沉浸式互动体验
虚拟偶像 IP 打造
AI + 直播创新形式
• 京东联合 12 大硬件品牌,推出行业首个虚拟偶像女团
「闪耀吧 十二姬」,将各品牌虚拟形象集结成团,以二
次元偶像文化连接 Z 世代
实战数据
注:开播24小时,对比2025年双11直播间数据
破1亿
硬件圈顶流女团首次集结
全网话题讨论度
3倍
单场直播
观看人数
IP 化破圈
经营启示:未来的
方向
京东数字人
解决方案
核心挑战:破圈难
与转化弱
• 虚拟偶像 IP 是破圈的关键抓手,通
过文化符号连接年轻用户,实现从专
业圈层到大众市场的渗透
场景化转化
• 「AI + 直播」创新场景,将产品科
普与娱乐体验深度融合,有效提升用
户停留与下单转化
品牌协同价值
• 多品牌虚拟形象集结成团,形成行业合
力,既放大了单品牌影响力,又构建了硬
件行业的文化标签
• 12 大硬件品牌各自为战,难以形成合
力,无法集中放大行业影响力与用户心智
品牌协同弱3
• 发布首支 AI 单曲《Unlock my love》
及成团 PV,48 小时登上 B 站热门推荐
• 直播间配套多元福利,强化转化链路
全链路营销协同 6倍
单场直播
成交GMV
2倍
单场直播
涨粉
10倍
超10款主机
成交额增长
48
数字人电商直播行业未来趋势展望04
49©2026 iResearch Inc.
未来展望:超越真人的“Agent智能体”时代
数字人直播的终极形态是迈向由Agent智能体驱动的全新范式,直播的终局是“超人”
如果说2025年之前,数字人直播的核心是对真人能力的复刻和效率的补位,那么从2026年开始,我们将进入一个全新的“超越”时代。这个时代的核心特征是三大本
质跃迁:数字人将从一个标准化工具,升级为全链路的经营主体;直播形式将从一对多的广播,进化为一对一的专属服务;而其价值也将从提升单点效率,延伸到重
构整个产业链
来源:艾瑞咨询研究院自主研究及绘制。
2025年之前:
复刻与补位(模仿人类)
完成从技术探索到规模化
落地,核心价值是真人直
播的能力复刻与效率补位,
本质是对真人主播的“模
仿”与辅助。
2026年及未来:
超越与新生(超越人类)
彻底突破“模仿真人”路径
依赖,正式迈入Agent智能
体能力超越时代,核心目标
是具备“超越人类”的全天
候、全链路经营能力。
1 • 从标准化工具升级为全链路经营主体
全链路的经营主体
2 • 从广播式带货进化为一对一专属化服务
一对一专属化服务
3 • 从单点效率提升延伸至全产业链价值重构
全产业链价值重构
数字人直播终极形态的三大本质跃迁
50©2026 iResearch Inc.
交互趋势:从“千人一面”到“千人千面”
下一代直播将从“一对多广播”进化为“一对一专属服务”
数字人直播的交互趋势可概括为从“标准化广播”向“AI驱动的全维度个性化专属服务”的根本性重构;将彻底跳出传统“广播模式”的桎梏,打破“万人同屏、同
话术、同形象”的同质化局限,核心趋势是从规模化的单向输出,升级为高并发的一对一专属交互。
来源:艾瑞咨询研究院自主研究及绘制。
现在的直播(无论是真人还是数字人)都是“广播模式”:一万个观
众进场,看到的是同一个主播,听的是同一套话术。这对男性/女性、
新客/老客的针对性不仅差,转化效率也存在天花板
当前局限:千人一面,直播内容针对性弱
一对多
广播模式
千人千面,VIP专属服务包间
交互的终极趋势是以用户为核心的价值回
归;直播间从流量聚合的「公共广场」,
转化为上万个并行的「VIP专属服务包
间」,彻底打破传统直播的转化天花板
价值跃迁
下一代范式:AI驱动的全
维度重构
交互体验的三重升级趋势
基于多模态大模型高并发推理能
力,打破传统模式,实现全维度
“千人千面”的交互体验升级
• 基于用户画像与偏好,实时匹配数字人形象、音色与风
格,实现“进房即适配”的个性化视听体验
形象适配个性化
• 融合商品知识图谱与行为数据,实时生成专属讲解与互动
策略,真正实现“千人千策”的精准服务
内容话术场景化
• 打通智能客服体系,从商品讲解到售后引导,升级为用户
的“全周期专属购物顾问”
服务链路全周期化
51©2026 iResearch Inc.
能力趋势:全知全能的“超级主播”
下一代直播将从“脚本驱动的提线木偶”进化为“具备全链路自主决策能力的零售经营智能体”
数字人直播的能力趋势,将彻底摆脱对预设脚本与人工场控的依赖,集成 “业务大脑”,从被动执行指令升级为主动理解生意、自主制定经营策略的零售 Agent
来源:艾瑞咨询研究院自主研究及绘制。
目前的数字人主要依赖“预设脚本”和“关键词触发”,它像一个记性很好的演员,但不懂
业务逻辑;本质是“真人直播的数字化复刻”
当前局限:高度依赖人工投喂与场控,缺乏业务理解
零售经营智能体,快速反应+处理
复杂业务决策
从“提线木偶”升级为“零售经营智能
体”,数字人不再需要运营人员“喂”脚
本,它能自己看懂生意数据,自己决定卖
什么、怎么卖。
价值跃迁
下一代范式:自主决策零
售Agent
能力体系升级:快慢双驱的 “超级主播”
彻底摆脱对人工运营的路径依赖,
从“被动执行指令”升级为“主动
理解生意、自主制定策略”的零售
经营Agent
• 负责处理基础交互与标准化运营,如用户进房欢迎、情绪
安抚、简单问答、直播流程推进,保障 7×24 小时无间
断、零延迟的稳定响应
快思考(实现毫秒级响应)
• 深度融合供应链、库存、流量、价格等全链路零售数据,
自主完成商品排品、库存调度、价格博弈、转化优化等核
心经营决策,例如:
检测到SKU库存紧张时,自动申请补货或切换替代商品
识别用户犹豫时,自动匹配专属优惠券进行精准逼单
慢思考(处理复杂业务决策)
52©2026 iResearch Inc.
产品创新趋势:直播间成为产品创新的“起点”
下一代直播将从 “销售渠道” 进化为 “研发实验室”
数字人直播中产品创新升级趋势,未来的直播间将突破销售属性,进化为集用户洞察、概念验证、市场测试于一体的 “产品研发实验室”。通过 AI 数字人实时捕捉用
户互动数据(如高频关键词、情绪反馈、停留时长),精准挖掘未被满足的市场需求。
来源:艾瑞咨询研究院自主研究及绘制。
当前直播间仅作为商品展示和销售的渠道,是商业转化的 “终点”,
与产品定义、研发、测试环节完全割裂。用户对产品的潜在需求、改
进建议等宝贵信息,无法直接赋能研发,导致产品迭代周期长,无法
快速响应市场变化
当前局限:直播间与产品研发严重脱节
仅为销售渠道
反馈滞后
降低创新风险,提升产品成功率
对品牌方,彻底改变传统 “研发-生产-销
售”的线性模式,转向以用户需求为核心
的C2M(用户直连制造)反向定制模式,
大幅降低创新风险,提升产品成功率
价值跃迁
下一代范式:AI 驱动的
“需求-生产” 极速闭环
产品创新升级:从用户需求
到产品上市的闭环创新
AI 数字人不仅是主播,更是整个商
业链条的智能中枢。它能实时分析
直播间的用户互动数据,精准定位
市场需求,并直接将洞察转化为品
牌方所需的产品创新方向
• AI数字人在直播中发现高价值用户需求点
实时需求洞察
• AI基于洞察自动生成融合新特点的产品概念图、渲染视
频,并即时开启预售或众筹,测试市场真实反应
快速概念生成
极速生产响应
• 品牌方与工厂在直播间后端实时接收 AI 生成的需求报告
和生产指令,直接启动小批量柔性生产,实现从用户需
求到产品上市的 “分钟级” 闭环
53©2026 iResearch Inc.
生态趋势:服务商的“算力转型”
下一代直播生态将从“人力资本驱动“进化为“算力与数据驱动“
数字人直播的商业化已经进入深水区,单纯依赖真人主播或纯技术堆砌的“代运营”模式难以为继。行业正在经历一场根本性的重构,核心竞争力正从“人力资本”
向“算力资本”倾斜。
来源:艾瑞咨询研究院自主研究及绘制。
目前的服务商生态主要靠“堆人力”:代运营团队越庞大,服务能力
越强,利润率越低
当前局限:单纯依赖真人主播或纯技术堆砌的“代运
营”模式难以为继
人力依赖
协同不足
服务商向“价值增值”迈进
服务商将从“流水线工人”进化为高技术
含量的“AI训练师”和“策略操盘手”,
成为“AI 原生的零售经营伙伴”,不仅提
供技术工具,更输出基于数据洞察的全链
路经营策略,成为品牌在AI时代不可或缺
的核心外脑
价值跃迁
下一代范式:全产业链角
色重构与价值共生
生态升级:根本性的价值重构
数字人直播已从单点效率工具,演
进为重构零售产业链的核心生产
力。行业正经历根本性重构,竞争
壁垒正从‘人力规模’向‘技术
Know-how 与数据资产’加速迁移
• 未来服务商的核心竞争力,将从人力管理转向AI 配置能
力(Prompt 调教、知识库搭建、人设设计),成为品牌
的 “数字经营伙伴”,打造可复用的数字经营资产
从“代运营”到“代配置”
• AI 彻底重构运营逻辑:3 人精英团队可高效管理 50 个品
牌的“日不落”直播间;服务模式从“按时长计费” 转
向“按GMV/ROI效果计费”,实现与品牌的深度共生共
赢,完成“算力转型”
从“卖时间”到“卖效果”
THANKS
艾 瑞 咨 询 为 商 业 决 策 赋 能