出品机构:甲子光年智库
报告指导:宋涛
报告撰写:刘瑶
发布时间:
前言
• 不可否认AIGC的出现似乎已经让大家预见了AI应用的拐点,其创造性与智能性一夜之间刷新了大众认知。但去伪存真,在市场火爆的背
后其真正的应用及商业价值几何,更待我们冷静地剖析。基于此,甲子光年智库特此展开AIGC应用与实践研究,输出《AIGC应用与实践
研究报告》,期待与各方共同见证AIGC行业的星辰大海。
AIGC如何从内容生成
撬动作业模式改变
本次报告探讨的问题
去伪存真,研判AIGC在引发热烈讨论背后的商业价值,
尤其是围绕内容作业体系下的革新。
1. AIGC的本质剖析及AIGC背后的新一代人工智能技术
革新?
2. 基于技术及商业的价值,AIGC将会如何改变内容产业
的作业模式,对现有商业模式带来哪些机遇及冲击?
3. 当下AIGC产业链及核心玩家可能是谁,如何在细分领
域完成产品及服务?
4. AIGC时代到来,企业及个人需要如何面对?
AIGC时代已来,算力及数据下训
练的“暴力美学”实现内容生成
质的突破
内容生成的低成本及高效率必
然会冲击现有的商业模式
AI企业、互联网企业、垂直行
业的数字化科技企业在AI能力
加持下需要再出发
目录
Part 01 概念重生:AIGC是内容生成方式一次进化
Part 02 行业颠覆:内容生产体系的作业模式走向工程化
Part 03 产业变革:五湖四海涌向AIGC开阔地
Part 04 未来可期:在探索中寻找人类与机器的平衡
缘起于GC,而归于AI, AIGC的关键是AI突破了人类生产“内容”的特权
AIGC
广义的概念:更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改
变及突破:
✓ 首先对内容的作业模式进行了流程再造
✓ 其次对内容质量及成本的改变,改变了交互的效果及效率
✓ 生成式AI实际上扩大了“内容”的含义,凡是可以数字化的内容形式均为生成对象,
而非传统意义下媒体环境的内容
狭义的概念:关注内容(Generated Content)的生成方式,即是否内容的最终形
态由AI完成,来自于互联网之前对内容生成方式描述比较(PGC&UGC),对生成
主体的不同(人VS机器)、数量及规模的上限,生成速度的巨大差异进行比较
• 目前广受热议的“AIGC”实际是对此次AI技术变革的一种描述概念,即AI(或者说以硅为基本构成的计算机)具备了人类社会中“内容生成概念”的能力,而不
是随意生成人类社会共识下无法理解的文字语句、图片、人像、视频等等。
• AIGC概念具备狭义和广义区别,狭义概念更强调内容属性,广义概念强调AI的技术属性:
✓ 狭义的概念重点关注的是数字内容的生产形式(Synthetic Media),和人类生成内容方式对比,例如文字、图片、视频等常规内容形式如何一步通过AI生产;
✓ 广义的概念则突出生成式AI(Generative AI)的概念,即如何通过生成式AI的技术思路解决以往决策式AI难以完成的问题,尤其在数据或者内容生成上实现 “质的突破”。随着生
成式对抗网络(Generative Adversarial Network,GAN)等的演进及迭代,生成式AI可以延展到流程、策略、代码、蛋白质结构等多种形式,即意味着凡是可以使用数字内容形
式的产业,生成式AI均可以涉及。此次报告在广义的概念下进行讨论。
分析式AI
生成式AI
通过对输入数据进行分析和推理,实现感
知、认知及决策
从大量数据中学习并生成新的数据或内容
改变了人类社会所有判
断相关的工作流程
即将改变人类社会所有内
容相关的工作方式
PGC
UGC
AI-UGC
Professionally-
Generated Content
内容生成成本高,需要
专业人士完成内容生成,
总体内容生产数量低
User-Generated
Content
内容生成及传播成本由
于互联网时代的,无需
专业人士完成,总体内
容生产数量有所提升
AI-assisted -
Generated Content
内容生产主体从人类本
身开始向人工智能迁移,
主要区别体现在内容的
生产效率、知识图谱的
多样性以及提供更加动
态且可交互的内容上
注:此处表示的整个AI技术的大致方向
AIGC提供了机器“从无到有”媒体内容生成能力
分级 0级 1级 2级 3级 4级 5级
发展趋势
内容生产模式 生产人生产内容 机器辅助审核 机器辅助加工
机器有条件自动生产
内容
机器高强度生产内容 机器完全自动生产内容
生产主体
采集 生产人 生产人 生产人 生产人和机器 生产人和机器 机器
AI渗透率↑加工 生产人 生产人 生产人和机器 生产人和机器 机器 机器
审核 生产人 生产人和机器 生产人和机器 机器 机器 机器
机器生产力
的限制情况
采集 受限 受限 受限 部分受限 部分受限 不受限
生产力↑加工 受限 受限 部分受限 部分受限 不受限 不受限
审核 受限 部分受限 部分受限 不受限 不受限 不受限
技术示例
• 素材上传、存储、分类、检
索、权限设置
• 多媒体内容编辑,提供文字、
图片、视频功能
• 内容在线批注、修改
• 支持内容审核,包括文字规
范性核查,人物/机构/地域等
实体属性核查
• 自动标题、自动摘要、 智能
字幕、文本生成
• 在内容审核过程中自动屏蔽、
剔除或修改内容
• 抓取线上数据
• 根据内容模板利用线上数据
自动生成内容
• 采集素材的规范性与准确性
审核
• 支持固定位置的线下设备进
行数据采集
• 支持根据已设定的内容模板
对原始数据进行加工后自动生
成内容
• 支持可移动设备自动进行数
据采集
• 分析原始数据,自动判断是
否需要进一步采集,并根据素
材挑选模板自动生成内容
技术能力↑
如果完全按照AI技术参与内容生产流程判断,大多数情况下是AI作为辅助完成内容的生产,但由于内容生产流程的复杂性,
往往生成式AI参与的内容生产环节往往被称为“AIGC”
• 从内容生产的流程看,内容生产粗略地由“采集”、“加工”、“审核”三个步骤组成,这三个步骤以线性的方式逐步推进,最终完成内容的生产。
• AIGC技术使得机器可以在内容生产过程中尽量实现“自动化”,减少人的工作量;AIGC技术进步使得机器越来越走向“自动化”,实现了“从无到有”。
完全态“AIGC”
AIGC发展历程的拐点体现在媒体内容生成效果“质的突破”
• AIGC的技术不是2022年才突然出现,而是随着AI技术迭代而出现,早期主要是受制于算法、算力及信息数字化的程度(数据信息的成本)。
• 随着机器智能的规模效应,及社会对于信息化的使用程度大规模上升(大量线上数据产生),AIGC迎来了发展的机遇,并且在2022年产品和服务效果在商
业化规模效应下表现受到关注。
1950s-1990s 1990s-2010s 2010s-2021 2022至今
早期萌芽阶段 沉淀积累阶段 快速发展阶段 产品爆发阶段
受限于科技水平,AIGC仅限于小
范围实验
AIGC从实验性向实用性转变,受
限于算法瓶颈,无法直接进行内
容生成
深度学习算法不断迭代,人工智能生成
内容百花齐放,效果逐渐逼真直至人类
难以分辨
• 1950年,艾伦·图灵提出著名的
“图灵测试”,给出判定机器是
否具有“智能”的试验方法
• 1957年,第一支由计算机创作的
弦乐四重奏《依利亚克组曲(llliac
Suite)》完成.
• 80年代中期,IBM创造语音控制
打字机Tangora
• 2007年,世界第一部完全由人工
智能创作的小说《1 The Road》
问世
• 2012年,微软展示全自动同声传
译系统,可将英文演讲者的内容
自动翻译成中文语音
• 2017年,微软“小冰”推出世界首部
100%由人工智能创作的诗集《阳光失
了玻璃窗》
• 2018年,人工智能生成的画作在佳士
得拍卖行以万美元成交,成为首
个出售的人工智能艺术品
• 2019年,DeepMind发布DVD-GAN模
型用以生成连续视频
• 2021年,OpenAI推出了DALL-E ,主要
应用于文本与图像交互生成内容
迎来集中爆发,多款产品出圈
• 2022年8月Stability AI发布的
Stable Diffusion模型。
• 2022年11月30日推出的人工
智能聊天工具ChatGPT
该阶段:从技术角度上,持续进行尝试,实现算法在局部领域的突破,但
是受制于算力、能耗及基础设施的不足,未能实现实际生成中的“生成”
效果,如训练计算的增长符合摩尔定律,大约每20个月翻一番。
更好的模型,更多的数据,更多的算力
生成式AI迎来了更好的发展土壤
自2010年代早期深度学习(Deep Learning)问世以来,训练计算的规模加快,大约
每6个月翻一番。2015年末,随着公司开发大规模ML模型,训练计算需求增加10至100
倍。2015-2016年左右,出现了大规模模型的新趋势。这一新趋势始于2015年末的
AlphaGo,并持续至今
AIGC在内容层面产生的效果源于“基础模型”可以广泛使用
递归神经网络
(RNN)
蒙特卡洛树搜
索(MCTS)
卷积神经网络
(CNN)
受限玻尔兹曼
机(RBM)
Paul Smolensky
多层感知机
(MLP)
反向传播(BP) 概率模型 高维词向量
长短期记忆
(LSTM)
非线性激活
深度玻尔兹曼
机(DBM)
生成对抗网络
(GAN
注意力机制
(Attention)
RNN改进
AlexNet &
Dropout
深度强化学习
(DQN)
Attention &
Transformer
生成预训练变
压器(GPT)
双向编码表示
(BERT)
GPT3
残差网络
(ResNet)
AlphaFold2
AlphaFold
chatGPT
()
MT-NLG
代表具有里程碑的
关键创新
代表相关算法开创
者所在公司或阵营
1900年-1980年 1980年-1990年 1990年-2000年 2000年-2010年 2010-2020年 2020年-至今
Transformer的应用标志着基础模型时代的开始(基础模型的庞大规模和应用范围突飞猛进)
• 技术层面上,基础模型通过迁移学习(Transfer Learning)和规模(scale)得以实现
• 深度学习中,预训练又是迁移学习的主要方法:在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微调
来适应感兴趣的下游任务。迁移学习(Transfer Learning)使基础模型成为可能
• 人工智能基于漫长的研究过程,正在经历范式上的转变:基于通用类模型构建人工智能(AI)系统,这种模型则被称为基础模型,即在大规模数据上训练
并适配(微调,fine tune)到各种下游任务的模型。
从技术角度来看,基础模型并不新鲜:它们基于深度神经网络
和自监督学习,两者都已经存在了几十年
数字内容的孪生能力
将现实物理世界中数字世
界复刻一遍
数字内容的智能创作
高效生成人类可以理解的
数字内容
数字内容的智能编辑
将数字世界的化身数据进
行修改编辑
AIGC产业的发展来自于算法、数据及算力的综合推动
AIGC
数据
数据巨量化跨模态融合
算法 算力
内容创造力
数据层面
核心技术突破
多模态认知计算
数字孪生 虚拟现实
全息立体
应用场景
算法层面
感知+交互
大数
据语
料库
高精
度训
练集
标注训练
计算
任务
投喂
算力层面
硬件算力
智能交互
实时算力
边缘计算
云计算
本地化
− 从现实生成数字:AIGC利用AI技术
构建模拟现实世界的数字孪生模型;
− 从数字生成数字:AI能够学习并创
作更丰富的内容;
− 从数字生成现实:AIGC基于物联网,
多模态技术获取多维信息,实现更
加智能的人与机器互动。
当下的时代机遇:大规模模型的摩尔定律-单模型参数量每年增长10倍
AIGC面对的训练变化:训练所需的资源仅仅是成功的“必要不充分条件”
算力设备:提供底层动力源泉
收集数据及
数据准备
包括数据收集、
预处理、存储;
数据的质量和梳
理对算法效果至
关重要
特征工程
从原始数据提取
有代表性、可解
释的特征
模型选择
自开发实现模型
使用现成的框架
模型训练
无监督学习
监督学习
强化学习
……
模型评估
根据分类、回归、
聚类等各种问题
有相应评估指标
模型调优
网络搜索、随机
搜索、贝叶斯优
化、梯度优化、
集成方法等选取
最优参数组合,
提高模型性能
模型部署和
应用
模型封装后,
导入生产环境
进行推理
模型调参
API部署
边缘部署
集成部署
批处理部署
容器化部署
调参过程实际上类似于“实验”:“调参”的结果与以往
人工智能方式相比,具有更多的不确定性,需要进行多次
的反复训练,模型训练中,模型即是训练结果,中间的过
程则无法完全复制。
算力规模
数据质量 数学理论
……分布式计算效率
充足的能耗
模型训练涉及的基础资源提升在方向上(理论上)能
够决定模型训练的效率和结果
实际上可以看作“必要不
充分条件”:难以明确的
直接因果关系
训练的过程呈现“黑盒”性质 “量变”撬动“质变”
AIGC的产品商业落地需要在模型构建与应用中寻找最优解
“海洋之光”超级计算机(国产超算)
512块 GPU
大算力
腾讯太极机器学习平台
昇腾 AI 基础软硬件平台
16 块 GPU
大数据量
图像292GB 文本
中文多模态数据集 M6-
Corpus
五大跨模态视频
检索数据集
基于万条小规模数据集
数百 G 级别不同领域的高
质量语料
模型类型
多模态预训练模型
图、文、音三模态
“八卦炉”(脑级AI模型)
M6
大模型
“混元”HunYuan_tvr
紫东太初
孟子
大参数
174万亿(与人脑中突触
数量媲美)
10 万亿
万亿
千亿
10亿
商汤AIDC,峰值算力3740Petaflops3 --
计算机视觉模型
计算机视觉模型
书生(INTERN+)
某视觉模型
100亿
300亿商汤科技
商汤科技等
企业
清华大学等1
阿里
腾讯
280 块 GPU
鹏城云脑Ⅱ(2048 块CPU)
和百度飞桨
4095(Pflops-day)/2128 张GPU
3390 亿条文本数据
纯文本和知识图谱的
4TB 语料库
5000GB 高质量中文数据
集
NLP 大模型
NLP 大模型
NLP 大模型
Megatron-Turing
ERNIW Titan
源
5300亿
2600 亿
2457 亿
微软和英伟达
百度和鹏程实验室
浪潮信息
鹏城云脑Ⅱ和全场景 AI 计算框架
MindSpore,2048 块 GPU
40TB 训练数据盘古系列大模型 千亿
3640(Pflops-day3)/上万块V100
GPU 组成 gao 带宽集群算力
超过万亿单词的人类语言
数据集
1750 亿OpenAI
华为云
中科院自动化所
澜舟
多模态预训练模型结合人
类参与强化学习
复旦大学超算中心 -- 对话式大型语言模型MOSS 百亿复旦大学
大模型
小模型
海量无标注数据:文本、图像、视频……
自监督学习
利用更有限的资源形成实现
具备应用的特征
类似人类学习的
“通识教育”
通过“暴力美学”实现大算力、大数据、
大参数下的通用模型能力,根据具体垂直
应用进行fine-tune
依然通过预训练模式实现基础模型,但关注
具体垂直细分应用,最终模型相较于大模型
的参数(千亿规模)少,更容易实现小算力
场景下的应用
营销 游戏 影视 金融 工业 教育 传媒 ……
生成文字 生成图片 生成视频 生成代码 生成虚拟场景 生成数字人 生成策略 ……
技术能力
行业应用
类似人类学习
的“专业教育”
fine-tune 基于应用调整模型最终形态基于模型寻找最优的应用落地
目录
Part 01 概念重生:AIGC是内容生成方式一次进化
Part 02 行业颠覆:内容生产体系的作业模式走向工程化
Part 03 产业变革:五湖四海涌向AIGC开阔地
Part 04 未来可期:在探索中寻找人类与机器的平衡
AIGC内容的生成作业方式基于人类的“prompt”而完成
AIGC
预训练
模型串
联融通
2014年提出,由生成器网络和判别器网络组成,
相互对抗,不断提高生成样本真实性和判别器准
确性
CLIP(对比性语言-图像预训练)模型是,可以理
解文本和图像。该模型将文本和图像匹配起来,
可识别图像中的内容和描述图像的语言
Transformer模型取代了RNN,Transformer 模
型能够同时并行进行数据计算和模型训练,训练
时长更短,且训练得出的模型具有可解释性
相较于GAN,是图像生成领域的一大进步,不需
要明确地计算数据的先验概率分布。通过“扩散”
来执行隐空间中的推断
2020年提出,NeRF 能够将2D图像转3D模型,
可以利用少数几张静态图像生成多视角的逼真
3D图像
GAN
CLIP
Transformer
NERF
Diffusion
特殊文本形态
• 代码(-计算机语言……)
• 生物/化学信息(蛋白质序列、碱基
序列……)
特殊视频形态示例
• 3D视频(数字世界的立体形态)
• 动画(与写实类视频做区分)
• 数字人(目的为模拟人的视频形象)
• 动态环境(一般指数字场景)
文本
图片
音频
视频
策略/选择
(数字世界的行为及交互)
文本
图片
音频
视频
策略/选择
(数字世界的行为及交互)
人类可执行的内容输入
(prompt)
输出人类可以理解的内容形态
(next token)
内容生成的原理思路示例,以下算法结构是目前较为常用的结构,当下的预训练模型向
着可以使用更多种类“prompt”的方向发展,以满足作业需求
内容生成的核心在于使用人类文明常用的表达方式进行,利用计算机实现内容形态的输
出,文本作为prompt是最容易使用,也是目前最容易实现的方式
*代码生成其他内容,则是通过计算机语言完成,往往不需要生成式AI技术
*机器也可以设计为不需要prompt完成,但不在内容生产作业体系范畴下,本报告不做讨论
AIGC的技术内核推动内容生产方式从“作坊式”走向“流水线”
工作流程及范式发生改变
各类内容形态的生产时间大幅降低
基于内容的交流效率大幅提升
直接价值:内容的生成成本下降,生成效果提升
间接价值:人与人之间,人与机器之间的交互效率提高
最终价值:生产力显著提升,生产关系逐步发生变化
内容
交互
流程
• AIGC不仅改变了内容生产的方式,从内容-交互-流程,实现了生产方式的变革。
AIGC解决了内容创作效率的核心矛盾:环节中始终存在大量
个性化的重复性工作,内容创作的门槛及成本皆源于此。
AIGC可以在部分环节实现“工程化”的工作模式
AIGC解决了工作过程中交流的核心矛盾:交互环节中面对文
字风格、图片、视频等等无法用语言进行准确描述的环节,
都可以采用快速生成的内容进行直接沟通,颠覆了沟通方式
AIGC重构了作业环节的劳动力(生产时间变化所致)与物质
资料(能耗、技术等)分配:生产力的发展会促使新的生产
关系的出现
AIGC的能力来源于内容生成的多种类型,辐射多个应用场景及行业
文字生成
音频生成
图像生成
虚拟生成
策略生成
代码生成
营销
游戏
影视
金融
工业
传媒
教育
视频生成
蛋白质结构生成
文本处理:总结、续写、改写、修改……
文本交互:闲聊、问答、咨询……
音乐生成
人声生成、语音克隆
图像编辑、修复、风格转换
2D图像生成、3D图像生成(AI绘画)
图像分析
视频修复、风格转换
视频特效(换脸、造景……)
数字人生成
音效生成
游戏场景生成
对战策略
NPC“心智”(与环境的交互)
代码按需生成或补全
修复代码bug
蛋白质结构预测
游戏逻辑及剧情
心理
法律
医疗
文字素材的生成及加工:小说、稿件、剧本、文案、新闻资讯、广告语……
基于文字内容的分析:策划、思路灵感激发、热点捕捉……
基于专业内容的交互:客户服务、心理咨询、法律咨询、医疗咨询、金融咨询、教育咨询……
基于娱乐的交互:游戏对话、闲聊互动、文字游戏……
基于商业服务的图片设计及修复:广告海报、工业设计图、建筑图、服装设计、CAD图……
图片素材的生成、影片的特效及转制……
长视频、短视频的生成、修复、转换
基于商业化的音乐制作:编曲、歌曲制作……
变声及配音……
数字形象的建立/模拟:游戏NPC、虚拟偶像、虚拟IP、数字员工(咨询师、分析师、老师、医生、律师……)
数字场景的建立:游戏场景、影视特效、数字孪生场景、地图生成……
关卡、剧情、对战的生成、改编……
代码编写、信息系统应用的开发……
专业领域的数据分析、报告生成……
数字形象直播……
科研思路及灵感的激活……
………… ……
……
生成的内容类型 内容形式 应用的场景 覆盖行业
实现规模化生产下的个性化应用
从内容到流程,AIGC实现游戏行业作业模式的加速变化
探索阶段
原型阶段
开发阶段
测试阶段
上线阶段
游戏开发
市场分析
产品核心
成本、周期预估
竞争分析
方案策划
技术确定
美术、音乐原型
程序代码编写
美术设计
音效制作
测试
BUG修复
数据监控
紧急情况处理
策划
美术素材
音乐和音效
对战策略
图像、文本素材生
成
原画设定(2D)
3D游戏
3D角色
3D场景和物体
3D角色模型
3D角色动作
3D角色表情
3D技能特效
Photo-to-3D
Text-to-3D
GPT>Code>DCC
3DScan
(Laser + Photos)
2D游戏
2D角色
2D场景和物体
3D角色表情
3D技能特效
2D角色动作
2D角色设计
代码逻辑
游戏的内容生成效率
及效果提升
赋能游戏开发
全流程
• 游戏的开发过程涉及了AIGC内容生成的诸多方向,以游戏为例,可以体现AIGC相关内容的生成效率及效果直接加速了整个开发流程。
*其中部分内容生成的成熟度尚且不足
智能客服实现更自然和专业的交互
实现对消费者“心智”层面理解
内容营销基于数据实现个性化交互
数字人等更多营销模式的普及
智能电视
……
开屏广告
信息流广告
插入式广告
贴片广告
搜索广告
……
线上广告
淘宝
京东
拼多多
垂直/兴趣电
商平台
平台粉丝群
拼团群
……
电商平台
小红书
微博
知乎
豆瓣
……
社交类
B站
抖音
快手
影视
综艺
……
视频类
淘宝直播
抖音直播
快手直播
电竞游戏直播
……
直播平台
楼宇广告
门店商场
……
户外广告OTT大屏
微信公众号
微信视频号
企业微信群
微信小程序
导购个人微信
微博企业号
知乎企业号
抖音企业号
……
企业号矩阵
自有APP
自有官网
自有粉丝群
……
自有平台
消费者“心智”面对全渠道的同质化内容饱和式地争夺
AIGC推动了营销过程中交互对于用户心智的理解作用,重构商业逻辑
行
动
触达
兴趣
分享
用户属性
用户订单行为
用户偏好
用户分层
商圈细分
风险控制
社交属性
以新一代消费者的生命周期为例,内容营销与交互可以影响全周期
通过内容的生成,AIGC通过交
互方式的升级实现企业与消费者
间壁垒的“打穿”
AIGC对于企业和消费者间的交互
方式改变
标签化的数据(营销全链路信息)与内容营销的结合可以实现更多的玩法创新
ID身份数据
来源数据
用户主数据
会员数据
第一方数据
第二方数据
第三方数据
分层数据
标签数据
偏好数据
指标数据
行为数据
订单数据
标签数据
模型数据
情感状态数据
外部标签数据
“知识传递和生命传递将重构世界的商业模式。在未来,并非AI战胜人类,而是使用AI的人群会打败没使用AI的人群。——硅基智能创始人&CEO 司马华鹏
”
AIGC给予了企业流程的新的管理思路及技术可行性
供
应
商
客
户
生产部门
财务
采购及销售
物
物
财
财
资
资
企业内部
供应商
• 一级供应商
• 二级供应商
• ……
企业
• 分公司/子公司
• 各地办事处
• ……
用户
• to B/to C客户
• KA客户/小客户
• ……
原材料
• 核心/非核心材料
• 物流
• ……
产品/货物
• 生产过程产品
• 废料
• ……
商品
• SKU管理
• 价格管理
• ……
应付账款
• 流程审批
• 网银转账
• ……
应收账款
• 流程审批
• 网银转账
• ……
内部费用
• 工资及奖金
• 绩效奖金
• ……
采购
• 原料管理
• 采购流程
• ……
销售
• 售前/售中/售后
• 营销模式
• ……
生产/货物调配
• 生产调度
• 存货管理
• ……
人 物 资财
产品营销自动补货 销售信息产品组合仓储管理加工订单生产工艺供应采购
• AIGC可以通过模拟学习和模型构建,帮助企业更好地理解大数据,提升企业的智能化水平,实现智能化运营,从而提升企业的效率和能力
• AIGC可以改变以往企业各个环节的依赖内容(非机构化数据)交互流程及效率,实现部门与部门间、部门内容之间的沟通更为顺畅
数据在企业的人、财、物、资中无处不在,数字化的重要作用是通过数字世界的信息流完成企业数字化管理
• 既定业务流程的建模、标准化、自动化、执行、控制、度量和优化(例如BPM)是基于现有数据交互协同的思路管理员工;
• AIGC通过解决部分交互及协同标准,可以更好地实现流程上的协同管理,但仍需企业对场景的不断探索后才能明确需求。
企业流
程示例
从内容出发,AIGC实现了AI技术对各个行业的升级迭代,带动产业价值
AIGC在内容成本的替代比率
AIGC在流程交互中的提升比率
营销
游戏
影视
金融
工业
传媒
教育
心理
法律
医疗
AIGC在产业模式的创新比率
……
AIGC实现对细分行业内容生成而呈现的替代价
值。例如,批量生成文案、图片、视频等,直
接完成原有行业内容作业方式的方式替代,是
AIGC价值的直接体现
AIGC通过简化行业的流程交互过程,从而提升
了原行业的效率,实现时间成本的保留。例如
通过智能客服完成提升营销过程中的效率及最
终达成
AIGC通过内容生成的多样性,尤其是虚拟技术
的应用(数字人、虚拟场景、3D建模等等),
实现了行业内新的商业模式。例如通过快速构
建数字员工实现数字劳动力的价值
AIGC在原有产业规模上实现升级
以部分产业数字化细分行业规模量级为示例,单位元
2022年,中国数字营销市场规模数量级:~10000亿
2022年,中国网络视听规模数量级:~3000亿
2022年,中国游戏市场规模量级:~2600亿
2022年,中国金融科技市场规模量级:~5000亿
2022年,中国线上市场规模量级:~3000亿
2022年,中国法律服务规模量级:~1500亿
2022年,中国线上问诊规模量级:~500亿
2022年,中国工业设计规模量级:~5000亿
2022年,中国心理咨询规模量级:~3000亿
*以上为示例,仅代表AIGC的产业带动规模计算逻辑
AIGC可以带动的
产业价值
AIGC的行业商业化落地需要基于目标与资源的分配与达成的工程学方式
技术实现 行业know-how
• 实现AIGC的商业化落地是考验企业在平衡模型开发成本与行业问题解决程度的能力,并且比以往更具有可调整性,因为AIGC对于问题的解
决不是唯一解,而是要与原有的数字化方案做成本的比较与衡量。
算力及能耗的管理
基于AIGC提供用户更
好的商业解决方案
AIGC的价值是基于行业know-how的最优解回答,AI落地需要找到企业自身的适合的方式
包括模型的开发成本及
后续产品的运营成本
行业know-how不仅仅表现在丰富的行业实践经历,而是
深入理解客户的业务需求,并且通过管理项目开发的流程完
成,在细化需求中寻找到主要矛盾并解决
Why(用户分析)
How(项目执行)
• 基于用户的细分行业属性,熟悉细分行业的需求价值
• 基于用户的业务流程细节,对用户的需求矛盾分析
• 基于用户的资源能力,明确用户的负担上限
• ……
• 在不同阶段和层面对项目的工作内容从主项、分项、子项
甚至单体的各个部分进行拆分(例如采用WBS),实现项
目关键节点的管理,
• 完成项目人员的协同、管理、分工及时间资源调配
• 对风险的预知、判断及合理控制
• ……
预训练模型
基于需求进行
fine-tune
结合其他需求进
行产品的封装
对应数据准备
技术实现路径
模型的训练“黑盒”机制
需要工程化的思索
时间成本
(是否尽快抢到实践
化的落地)
基础设施成本
(云服务或者算力的
使用成本)
人员成本
(工程化协作的团队)
目录
Part 01 概念重生:AIGC是内容生成方式一次进化
Part 02 行业颠覆:内容生产体系的作业模式走向工程化
Part 03 产业变革:五湖四海涌向AIGC开阔地
Part 04 未来可期:在探索中寻找人类与机器的平衡
AIGC在全球范围内引发投资热潮,巨大潜力驱使多行业企业进入
企业名称 融资时间
融资
轮次
融资金额 投资机构
超参数 2022-01 B轮 1亿美元 五源资本,红杉资本中国,高榕资本
影眸科技 2022-04 Pre-A轮 数千万人民币 奇绩创坛,红杉中国种子基金
数字力场 2022-07 天使轮 数千万人民币 BV百度风投
智谱AI 2022-09 B轮 数亿人民币 启明创投,君联资本
特看 2022-09 天使轮 数千万人民币 未透露
标贝科技 2022-10 B轮 数千万人民币 基石基金,联储证券
中科闻歌 2022-10 E轮 超5亿人民币 国家制造业转型升级基金等
心识宇宙 2022-11 天使+ 数千万人民币 银杏谷资本,红杉中国种子基金等
衔远科技 2023-01 天使轮 数亿元 启明创投领投、经纬创投跟投
深氧科技 2023-02 天使轮 千万级人民币 汉能创投
tiamat 2023-02 A轮 近千万美元 DCM中国,绿洲资本
澜舟科技 2023-03 Pre-A+轮 数亿人民币 中关村科学城,斯道资本,创新工场
行者AI 2023-03 天使轮 数千万人民币 英诺天使基金,九合创投
$71
$199
$1,296
$271
$1,548
$2,654
23
32
42
65
105
110
0
20
40
60
80
100
120
140
160
$0
$500
$1,000
$1,500
$2,000
$2,500
$3,000
2017 2018 2019 2020 2021 2022
全球来看,投资者对生成式AI的兴趣在2022年大幅上升
投资额 单位:百万美元 投资数量
OpenAI获10亿美元融资拉高数值
中国企业也备受投资机构关注
*以下企业为示例,代表AIGC的企业在2022年及2023年受到了投资者关注
基于模型的IT技术栈更加复杂,也为企业进入AIGC产业提供更多玩法
从模型到
应用闭源
闭源模
型应用
基于公共网络平台的应用,
单一平台应用
网络平台应用
提供基于本地边缘或端侧交互的
应用
边缘或端侧应用
数据中心工具与模型部署和调用API
数据中心与模型API
基于预训练模型的场景/
产品适配
Prompt优化与模
型微调
商业化的预训练模型,
通过API调用
非开源预
训练模型
开源模型共享
平台
模型
Hub
代码及权重开源的
预训练模型,一般
可免费试用
开源模型
用于训练或云部署的深度学习框架和中间件等,包括PyTorch、TensorFlow
深度学习框架与中间件等
用于训练或云部署的开放式计算
平台
云计算
本地边缘或端侧交互计算硬件
边缘或端侧计算平台
计算加速芯片与存储芯片,用于模型训练与部署
包括:CPU、GPGPU、DSA(例如TPU)、内存、NVMe协议、
Infinband网络解决方案等
计算机硬件与芯片
应用层
中间层
(接口层)
模型层
框架层
资源层
数据采集、
清洗、标
注等
数据
AIGC的IT技术栈
通用类:提供大模型能力,实现MaaS
(Model as a Service)
解决模型的基础设施与训练条件,如算力、数据及网络资源;
如训练所需的框架及平台等
目前,垂直类企业及通用类在产品及服务方式的
建立过程中实现了中间层的任务,当下单独提供
中间层能力企业较少
对于用户来讲为垂直类企业:针对细分领域需求提供产品或服务
芯片 数据云服务
训练
目前是AIGC企业发展的最初阶段,企业在探索中寻找
合适的场景进行商业化落地,往往跨越技术栈的多个层
级实现商业试错
AIGC产业图谱
通用类:侧重NLP/CV/音视频/多模态大模型能力
尽量拓展大模型通用能力,提供的是跨越尽量多的模态、行
业、场景能力的大模型(排名不分先后)
芯片 数据云服务
借助生成式AI的模型、算法思路,利用工程化的手段加深纵向细分场景、行业、
领域的应用效果,提供针对性的产品及服务(排名不分先后)
垂直类:针对细分领域需求提供产品或服务(包括to B,to C)
训练
综合(提供多类型产品/服务)
虚拟技术(包括虚拟人及虚拟场景建设)
游戏技术创新
(包括美术、剧情及策略等)
营销创新(营销方式创新或提效)
效率工具
写作
图像
设计
代码
……
AIGC产业图谱
(未来有更多的企业进入AIGC领域或扩大自身的能力范围,并且AIGC会具有更多的细分场景)
影视音创作
(提升视频、音频生成效率)
工业 其他(教育等)
重点厂商产品及服务能力分析——百度
具备从芯片层到应用层的AIGC完整产业能力,率先尝试应用大模型赋能多行业
➢ 公司简介:百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,百度以
“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。
芯片层
框架层
模型层
应用层
文心大模型
百度是目前全球少有的,在“芯片-框架-模型-应用”四个层面
上均有所布局的人工智能公司
• “芯片-框架-模型-应用”四个层面将形成高效的闭环反馈, 推动百度人工智
能持续迭代升级
• 并且框架层和模型层之间具有协同作用,可以帮助构建更高效的模型,并显
著降低成本。例如,为了支持海量参数模型的高效分布式训练,百度飞桨专
门研发了4D混合并行技术
实现千行百业的商业落地
百度文心全景图——「产业级知识增强大模型」
拥有AIGC产业的优质生态,用AIGC技术实现数字世界的建设与链接
亿
月活用户量
8亿
网盘积累用户
亿
全域DAU
1300亿
日均位置服务请求
8000万
全域DAU
百度多端优势产品矩阵,打造10亿+互联网用户规模的“创新土壤”
3000万
家庭渗透
AI驱动数字人 AI驱动的3D生成 AI实现的虚拟空间
以数字人为例,提供行业级完整的解决方案为创作者打造更多的创作工具及环境 具备实现完整虚拟世界的建设能力
百度数字人:1+2+3+X虚拟数字人生态体系
一站式平台 数字人核心资产 三大应用+三大场景
3d数字人:度晓晓+希加加 +EVA 合作授权
品牌营销
服务场景
百度智能云曦灵平台—四大AI引擎为依托
唇形驱动
表情驱动
肢体驱动
手势感知
人像驱动引擎 智能对话引擎 语音交互引擎 智能推荐引擎
任务对话
预置技术
智能问答
开放域对话
全双工AST
变声器
个性化TTS
定制唤醒词
内容与产品推荐
素材库
国内首款独立元宇宙APP
AI智能 永久复用多端兼容极限观感
丰富活动场景
会议会展、文博文旅文创、试乘试驾、个人空间
元宇宙基础设施
百度文心产业知识增强大模型
500万
创作者
……文字生成 图片生成 音频生成 视频生成
百度AI开放平台 ……
……
……
AI能力实现AIGC千行百态的赋能,场景反馈的应用需求提升AI能力
产品矩阵为AI的应用提供广泛土壤,AI反哺用户效率工具与创新能力
为创作者提供AI生成工具,降低创作门槛,
让更多普通人享受内容创作的快乐
输入文案成片
输入或粘贴一段文案生成视频
选择文章成片
从百家号文章中选择内容生成视频
智能匹配素材
无需担心素材缺乏,海量内容快速成片
模版一键包装
丰富模版,标题、字幕、背景、配音,
可以在模版中一键搞定
2d数字人:青小霞 + 40位数字人
上百套专业级模版,覆盖不同场景
40+数字人音色,打造千人千面
度咔口播
TTV自动生产
营销解决方案
+
重点厂商产品及服务能力分析——硅基智能:国内AIGC赛道领跑者
打造多种形态的“硅基劳动力”,科技平权赋能千行百业
➢ 公司简介:硅基智能是创立于南京的人工智能独角兽企业,获得国家高新技术企业、国家级专精特新“小巨人”企业认证,也是腾讯在人工智
能领域唯一重点投资的AIGC科技公司。硅基智能以人工智能科技创新为核心驱动力,将“碳基生命的硅基化”作为核心目标,专注于AI技术
深度研发和落地应用,布局AIGC领域不断研发,通过数字人+AIGC的创新应用生产场景,实现更接近于人类、个性化、善学习的数字人应用
方案。目前硅基智能已投入服务10多个行业近万家企业,在本地生活、直播电商、医疗教育、泛娱乐、金融服务、文博文旅、政务服务等行业
开辟了一系列AI数字人规模化应用场景,目标2025年为世界创造1亿硅基劳动力。
人物形象
克隆
智能语音
交互
自然语言
处理
智能语音
识别
个性化
TTS
无穿戴表情
动作捕捉
OpenGPT
大语言模型
硅基DUIX引擎+
华为鲲鹏引擎
算法
技术
产品
平台
DUIX(数字人交互平台)
MAAS
(沉浸式AI体验平台)
应用
场景
知识生产 虚拟直播 生命克隆 数字文娱
知识电商
企业家IP
名医律师IP
达人经济
本地生活直播
直播带货服务
跨境电商服务
中小企业直播
数字永生
情感陪伴
名人复刻
虚拟偶像
数字人智能大屏
数字文创
DAAS(数字孪生应用平台)
核心
资源
电力 算力 财力
核心围绕“硅基劳动力”的建造及后续运营,对传统“生产资料”的需求进行重构,帮助更多企业释放自身的潜能
基于自研的AI技术及平台打造,逐步实现“硅基劳动力”在诸多场景的价值释放,把人类从
繁重的重复性脑力劳动中解放出来,让人回归人的价值,创造及实现自我生命价值的时间与
空间,为人类世界的丰富性打造更多可能性
2025年为世界创造1亿硅基劳动力,在实践
中不断迭代“硅基劳动力”的实际场景价值
英雄缅怀 数字文旅
电商直播带货 本地生活直播带货
硅基智能:数字人+AIGC,大幅提高直播和视频生产效能
➢ 能力认证:硅基智能的数字人通过中国信通院47项基础能力评测,成为拥有权威认证的数字人厂商之一。
➢ 场景落地:数字人直播平台和硅语短视频平台,广泛应用于本地生活直播、电商直播带货、企业家IP、医生IP、律师IP、个人IP、直播电商、跨境
电商等领域,适用抖音、快手、视频号、淘宝、天猫、拼多多、京东等国内视频、电商全平台,也支持海外视频平台如TikTok、Ins、Facebook、
YouTube等。
直播:一键打造“数字分身”,实现超高拟真度的数字人主播的快速生成 短视频:实现微表情、肢体语言等多维度的突破,复刻数字化形象
• 数字人直播平台,全流程数字化,无需服化道、设备、场景、灯光,数字人
代替真人出镜,弹幕互动等多种交互方式,节约近90%的成本
极大降低开播门槛,商家以最低成本打造7 x 24小时开播的直播间;
AI数字人主播无限逼近真人主播的真实感;达到远超真人主播的能效
(案例:某线下餐饮店使用硅基数字人直播,无广告投流,直播 374小时GMV达数百万元;
某酒旅企业使用硅基数字人直播,春节小长假期间,无广告投流,GMV达数千万元)
硅基数字人可以极大缓解实体小店的痛点,解决开播难题,7x24H的直播间,拉满直播时长,
不用再去地推、发传单、投大量的广告,也可以解决获客问题,获得大批流量
市场痛点
• 成本高:虽然大量企业及个人亟需直播营销的帮助,但是主播及运营成本、直播设备
成本的居高不下,让诸多企业望而却步
• 实施难:复杂的中控平台、硬件的操作及流程繁琐让企业难以上手;此外,直播团队
人员流动大,管理难,直播时长难保证,企业需要保持直播实施的稳定性
解决方案
实践效果
虚拟偶像“爱夏”多渠道矩阵
打法,快速获得关注度
硅基智能提供大屏定制专属数字员工,
满足多种专属场景的交互需求
硅语短视频平台
1-3分钟视频+20分钟声音即可完美复制数字人形象
与声音,定制自身的克隆数字人
• 高效快捷,节约90%的成本和时间:省去拍摄和剪辑的繁琐过程,通过克
隆数字人代替真人出镜;仅输入文案,在1分钟内可批量生成数字人视频,为
企业或个人节约90%的成本和时间
• 适用范围广泛,可用于国内外各大视频和电商平台
此外,硅基智能也在多领域打造数字偶像、数字员工等:
• 海量数字人模版,百种音色,多国语言,快速批量生成多类数字人视频
数字人律师 数字人主播 数字人医生 数字人宝妈 数字人老师 数字人教练
重点厂商产品及服务能力分析——网易云商·七鱼智能客服
智能重塑服务价值,与全场景联接,驱动企业服务效率和质量双提升
➢ 产品简介:七鱼智能客服是网易云商旗下以 AI 驱动的智能客服 SaaS 系统,依托全面的自研算法技术,融合在
线客服、在线机器人、云呼叫中心、企微客服、视频客服、呼入机器人、外呼机器人、客户之声、自定义报表、
数据大屏、智能质检等产品,提供一站式智能客服解决方案,实现全渠道服务,完成全场景联接。
为40万家企业构建服务营销一体化体系,高效
连接8亿用户
七鱼智能客服:协助企业高效打造最佳服务体验,服务体验的落地关键在于自研算法及多年行
业know-how,产品覆盖多类型服务场景
千人千面塑造极致服务体验 体验反馈推动服务管理升级
服
务
全渠道
接入
智能化
机器人
智能化
人工辅助
线上线下业务纵深
-工单流转及数据分析
服务体验反馈
包括满意度、客户体验反馈及样本服务的数
据补充
数智化管理
实现质检与数
据共享
七
鱼
海
外
版
在线客服
在线机器人
呼叫中心
视频客服
企微客服
工单系统
智能质检
呼入机器人
外呼机器人
自定义报表
数据大屏
客户之声
……
典型产品示例
服务智能化的关键:AI协助实现交互过程中精准意图识别与“专业性”及“自然性”的反馈
算法采用sentence-bert模
型思想
使用蒸馏+多模型集成方案
进行fineturning加强垂直
领域下的识别能力
部署小模型,速度快、效果
好,落地成本低
自研NLP核心算法
文本意图识别率95%
FAQ语义算法能力
同样语料,语义识别准确率再提升10%
语料数据积累
• 积累亿级语料库数据和20+行业知识库
• 能够有效帮助企业快速搭建知识库
• 同时提供专业的话术模板,提升问题匹配率和问
题解决率
业务场景匹配
实现业务贴合度为目标,提供最佳预配置模型及场
景解决方案加以落地
多轮对话场景覆盖
多轮对话的流程控制,功能完整度较高,支持流程
跳出等
AI算法实现精准 数据积累提升专业度 场景理解支持业务落地
AI技术实现复杂对话下的高准确率意图识别,实现智能化过程关键节点的顺畅及稳定
网易云商·七鱼智能客服构建“一触即达”流程,机器人问题解决率达95%
➢ 客户信息:松果出行是全国知名的共享电单车品牌,随着业务增长,在服务用户过程中,在服
务规模,服务成本、相应速度等方面遇到常规人力资源方案无法解决的问题,因此借助七鱼智
能客服的AI技术及业务融合能力,打造多轮对话机器人,实现降本增效。
业务痛点 实践效果
服务用户数庞大
服务成本高
用户对响应速度的要求高
拥有近5000万用户,日
订单峰值达300万单
大量的用户,高频的业
务咨询使得客服人工、
场地的成本与日俱增。
“降本增效”成为企业
的核心目标之一
在出行场景中,用户遇到问
题时对处理的时效性要求高,
期待“扫码即走,随到随
停”,因此要求客服中心具
备快速的响应能力
75% 90%
智能化咨
询占比
95%
机器人问
题解决率
实现10个+人工客服的释放,每年
节省人力成本约200万
服务团队
人效
220%
• 七鱼成功助力松果出行将原有的大量的人工
客服环节(如核对用户身份、核对订单、申
请退款等)实现自助化处理
• 全天候精准识别用户咨询并秒级响应,不断
提升机器人问题解决率和智能化咨询占比
• 解决了困扰松果出行多年的“单轮交互”问
题,实现服务团队的降本增效
通过配置节点、接口对接及知识运营,构建起“一触即达”的流程,实现“多轮对话”
将海量咨询问题梳理为任务流程
判断节点-实现逻辑判断
即通过用户的回答判断串联各节点,从而
确认机器人下一步应该问什么问题
对话节点-了解真实意图
通过对话节点主动发问,从客户回答中提取必
要信息,了解真实意图,从而为机器人回答提
供判断条件
端到端的接口-实现用
户信息用于对话当中
七鱼支持机器人在客服咨
询过程中,以端到端接口
对接的形式自动调用用户
信息,从而判断其需求是
否满足服务条件,并提供
正确回应
4000+流程节点
300+判断节点
成功
搭建
500+接口获取值
用户
状态接口对接
…… ……
接口对接
接口对接
接口对接
用户
状态
用户
状态
对话节点 判断节点
知识运营-在海量运营任务过程中保持后端知识库迭代
机器人知识运营:通过知识查重(主要是帮助机器人自动识别知识库中高度重复的知识)和知识挖掘(主要是帮助机器人自动收
集接待用户过程中表现欠佳的知识),不断提高机器人的问题匹配率
1. 使用To B场景客服专用无标签语料训练基础大模型
2. 做fineturning操作,使模型具备客观的相似度判别能力
3. 在人工标注的客服场景语料进一步训练,加强垂直领域下的主观相似度识别能力
4. 使用蒸馏技术,实现小模型部署,速度快、效果好,落地成本低
算法采用sentence-bert
模型思想,并在此基础
之上做了重点优化
执行亮点
可以根据参数设置极端玩法,例如提供基于策略生
成的机器人,提供相应的挑战式玩法实现玩家付费
通过调整参数塑造不同类型的机器人,模拟不同的
真实玩家,对游戏生态进行填充和平衡
深
厚
的
技
术
沉
淀
重点厂商产品及服务能力分析——网易智企·网易游戏AI竞技机器人
为游戏提供成熟可靠的高智能水平+高拟人水平的AI机器人,专注商业化应用
➢ 公司简介:网易智企是一站式企业服务提供商,依托网易 23 年AI、大数据、通讯音视频技术,以 PaaS、SaaS 为主,提供智能化、数据
化、场景化的企业服务解决方案。网易游戏AI竞技机器人团队为网易智企旗下专注于游戏商业应用的团队,AI机器人可以随时随地随需调
用弥补真人不足,表现智慧拟人,确保玩法成功,低成本实现买量自由。
高能力水平:具有可以超越最高水平人类玩家的能力强度,能战
胜顶尖玩家,带来更刺激的战斗体验
高拟人水平:具有高度的拟人性,让玩家难辨真假,带给玩家
更真实的游戏体验
多样化的策略:基于目标并根据不断变化的环境状态调整自己的
策略和行为模式,策略千变万化,套路不再单一
高度可定制化:可以根据不同的游戏需求和玩家需求进行定制化
开发,满足不同游戏场景和玩家需求
高性能训练与推理
(自研框架支持分布式 10W+FPS)
复杂环境支持
多样训练方式
丰富算法集成
多语言支持
低成本接入训练
实现网易智企的
AI机器人产品特色
实现游戏领域的
商业模式创新
平衡游戏生态,延长游
戏寿命
提供增值服务
通过提供高智能水平的机器人队友和对手,吸引更
多的玩家参与游戏,从而提高游戏的收益和市场占
有率
提高游戏的竞争力
网易游戏AI竞技机器人:游戏行业AI技术的深厚积累+多类型游戏的丰富经验,具备为不同玩法的竞技性游戏提供个性化的竞技机器人解决方案
动作生存类 MOBA类 体育竞技类 卡牌棋牌类
……• 强化版AI机器人
• 多风格AI机器人
• AI机器人难度分级
• 局内难度动态调整
• 实时胜率预测
• 机器人表现分析测评
• 基础版AI机器人
• 模型线上部署配套模块
• AI匹配服务
• 平衡性测试系统
基础类服务 增值类服务 定制类服务 满足多类型游戏
需要
MMORPG
网易游戏AI竞技机器人实现多类型游戏价值提升
➢ 应用广泛:满足MMO、MOBA、ACT、SPG、SLG等多个游戏类型,应用于副本、战场、吃鸡等PVP和PVE玩法,满足匹配、陪玩、挑战、
托管等游戏需求,20+已上线游戏案例,日均调用量达数千万次,积累大量落地经验。
• 3种类战斗风格:激进、稳健、谨慎,适配不
同策略
• 6个能力水平:适配不同等级玩家
• 机器人强度局内动态调整:时刻关注玩家体验
让初级玩家轻松上手
让中级玩家紧密配合
让高级玩家刺激对战
MMORPG
MOBA
吃鸡ACT
非对称竞技
CCG卡牌
SPG
棋牌
其他
战场AI、竞技场AI、新手AI、门派对战
AI……
3v3v3竞技AI、5v5竞技AI、
10v10竞技AI
战斗+寻路AI
战斗竞技AI
卡牌竞技AI
五子棋竞技AI、国标麻将竞技AI
足球5V5、足球11V11、格斗游戏
体育竞技AI
项目背景:野蛮人大作战2是还未正式上线的休闲竞技游戏,游戏需
要在上线前就有高水平的机器人,这样在游戏上线以后就能很好的适
配高水平玩家,让游戏在开服前期具备良好的游戏生态
项目痛点:内置规则机器人能力水平较低,智能化水平较低,难以满
足玩家刺激对战的需要,难以适配不同段位的玩家,更难有合理拟人
的行为方式
打造高智能化的机器人,线下内测的拟人混淆度超过80%
创新设计:适配3V3V3多阵营非对称性对抗
提供多类型AI机器人,游戏体验创新
例如12个AI组队打本,AI学会躲
Boss AOE技能、刺客绕后破盾、
Boss虚弱期集火等灵活的行为
具备灵活的对战策略
利用机器人能力,提供多样玩法
在某知名MMORPG游戏利用AI竞技机器人
实现游戏创新
开发专门AI玩法,用户可以付费挑
战高水平AI,以便提升营收
有效提升玩家活跃度
增加玩法人次数120%,形成良好及
热烈的游戏生态
在MMORPG中增加棋局对弈
PVE日均场次数增加387%
带动PVP棋局数增长,玩家之间场
次数增加39%
实践案例示例
重点厂商产品及服务能力分析——快手
AIGC与内容社区及社交平台结合,实现短视频/直播科技持续创新与体验提升
➢ 公司简介:快手作为领先的内容社区及社交平台,其使命是成为全球最痴迷于为客户创造价值的公司。因此快手基于在多模态技术领域的深厚
数据和技术积累,以及长年深耕UGC内容创作的相关技术,为客户提供多元场景下的智能创作解决方案,在LLM领域的研究,更聚焦于用户体
验的提升,以及和业务场景的融合。
快手基于内容社区的场景需求,利用AIGC技术大幅提升创作者效率,实现玩法创新及体验升级,完成技术与应用的融合
短视频
长视频
直播/互动
广告
电商视频标签
物体检测
视频检索
扩散模型
面部特征
人体关键点
手势追踪
人像分割
语音识别
音频标签
语言合成
音频检索
文本标签
语义分析
翻译
多轮对话
SLAM
人体驱动
3D重建
3D渲染
视频理解 人脸/人体识别 音频技术 NLP技术 CG建模
AI原子能力
具备资源及大模型的基础设施
多模态大模型 文本大模型 视频素材库 虚拟人资产库
服务于AIGC的平台引擎
数据标注与处理 训练平台 云原生服务架构 移动端推理引擎
视频译制
视频摘要
精彩时刻剪辑
新闻视频合成
风格迁移
魔法表情
智能编辑
AR合成
歌词生成
旋律生成
AI歌手
音色转换
文图生成
文字和视频生成
3D结构生成
文字动作生成
有中之人
无中之人
卡通虚拟人
写实虚拟人
视频创作 AI玩法 智能音乐 跨模态生成 虚拟人
AIGC解决方案
应用场景丰富
在线教育
剧本创作
虚拟偶像
语聊/k歌
……
自研并落地行业领先的AIGC绘画玩法
多元场景下的智能视频创作解决方案
发布基于AIGC技术的数字人解决方案「快手智播」
• 融合视觉、音频、NLP 的多模态技术
• 自动化脚本/语音/字幕的生成
• 相关的视频创作素材及模版
自动完成80%左右的内容创作
创作者仅需在云端编辑器
中手动精调剩下的部分即
可,大幅提升创作者的创
作效率
工程优化
• 2022年在短视频行业内首发了图到图
的AI绘画功能,线上实测运行速度为行
业标杆Oneflow近两倍
• 沉淀出一套基于扩散模型的全链路
QPS部署优化方案
效果可控、算力可控、交互可控等难点问
题上实现了技术突破
「AI动漫花瓣飘落」示例
技术层面的创新
• 面部和动作生成方面,快手推出了中文语音唇形驱动模型以及基于
神经网络渲染的面部驱动与生成框架
• 互动方面,推出了基于大型语言模型和检索式相结合的问答系统
传播型虚拟人
服务型虚拟人
身份型虚拟人
AI赋能,快手AIGC科技助力虚拟内容高效生成
蒙牛售前-中-后期业务全链路玩法
• 蒙牛集团第一个虚拟员工
• 中国乳业第一个虚拟主播
• 元宇宙第一个游牧民族电商主播
➢ 项目简介:快手全链路虚拟数字人直播解决方案+内容平台在品牌营销上的独特优势,为蒙牛人性化的直播电商IP打
造提供技术支持。从0到1量身打造的品牌虚拟人IP“奶思”,带动品牌营销玩法创新升级,为相关企业营销思路及落
地方案提供标杆性借鉴。
蒙牛借助快手的技术支持,在新消费领域实现营销创新,突破
次元壁给予消费者新体验
对于用户、技术、场景的深刻洞察及
实践落地开创营销新玩法
三个应用
两个平台
快手基于自身技术积累、行业优化经验,仅2个月内迅
速完成虚拟人“奶思”的打造
快手数字人直播解决
方案
快手虚拟演播助手 老铁智播间 移动端混合现实引擎
数字人及XR制作平台 快手虚拟世界
虚拟人关小芳参与快
手商业发布会
虚拟人张凤琴与
周杰伦同台
• 快手StreamLake从技术支撑、场景应用、品牌营销、价值挖掘等
多维度实现综合的解决方案,实现直播场景的最优解
• 快手团队具备解决人物迅速上线,互动设计、分发推流、直播营
销等多个方面的综合行业经验
快手团队积累直播领域的工程化经验,积累
大量实际应用场景的优化经验 示例
完整的技术基础+丰富团队经验
实现多场景
的虚拟互动
支持多场景的
7*24直播
除动捕方案外,支持摄像头驱动,快手支持“奶思” AI 自动开播,
能够根据蒙牛输入的文案脚本匹配动作表情,讲解所售货品,降
低了使用门槛和运营成本
作为AI驱动型虚拟人,“奶思”具备与真人互动的能力,能够在直
播过程中自动回答用户提问,并且基于快手超过十万款特效,直播
互动的形式更为丰富
多个突破
技术支撑突破
能力赋能营销
“奶思”在电商直播、新媒体互动、品牌拟人化宣传等场景上落地应用,
为蒙牛承担多类营销职责
“奶思”的二次元形象,作为日常微博媒体平台的内容运营者,成为蒙牛
元宇宙创新营销的关键开始
·
重点厂商产品及服务能力分析——出门问问
下一代AIGC内容生成平台,提供一站式AIGC解决方案
➢ 公司简介:出门问问是一家以交互式AI和生成式AI为核心布局的人工智能科技公司,为全球 150 多个国家和地区提供AI智能硬件、AI政企服务,
以及面向创作者的AIGC工具。出门问问基于自主中文大模型UCLAI,推出了AI声音平台、数字人视频制作与直播平台、AI写作平台、AI图片生
成平台以及声音克隆、形象克隆等AIGC产品,服务于全球内容创作者。
大算力&大数据
大规模分布式训练平台 Advanced Training Platform(ATP)
听(语音识别) 说(语音合成) 读与写(自然语言&图像处理)
AI即服务 开源共享
出门问问自主中文大模型UCLAI(Universal Chinese Language Artifical Intelligent)
语音识别 语音合成 文本理解 文本生成 图像识别 图像生成 3D内容生成
AIGC底层能力
产品矩阵
• 长序列
• 多模态
• 单模型
• 大数据
平台特点
为用户提供高品质AI配音,目前已在全球范围内获超百
万量级的付费用户
海外版
AI配音平台
• 丰富的声音库,包括1000+音色和2000+声音风格
• 强大的声音编辑功能,包括多音字调整、语速调节、重读、拖音等
• 媲美真人的声音克隆:结合出门问问新一代TTS引擎
MeetHiFiVoice,输入20句话即可定制高仿真AI声音,兼具情感迁
移、跨语言迁移
• 数百量级的真人克隆、3D卡通、3D偏写
实、3D超写实角色
• 上千款多语种精品AI发音人
• 覆盖全领域内容类型的场景模版,轻松赋
能创作灵感
• 1:1高仿真声音&形象克隆技术
数字人视频
生成&直播平台
拥有自主语音合成、完整人脸建模、虚拟
形象驱动、语音动画合成等AI技术能力
AI写作工具
• AI写作,海量模版助力创作
• 风格转化,根据需求转换文风,匹
配不同应用场景
• 要点提取,快准狠提炼内容亮点
• 校对纠错、续写、改写、扩写、缩
写、翻译等功能
AI图片生成
• 具有“文本生成图片”、“文
本及图片生成图片”、“定制
模型”等功能
• 支持现代风格、古风、二次元
风格等多种风格和视角的高精
准垂直内容,可提高内容二次
创作度
可快速生成爆款广告素材,
智能辅助游戏设计
相关内容形态
音频 数字形象 视频 直播 文字 图片
出门问问最早布局AIGC领域,提供一站式AIGC产品矩阵,实现“技术、产品、商业化”三位一体闭环
出门问问AIGC产品已有明确
的落地场景和商业化运作能力
出门问问AIGC客户案例
一款文本写作效率工具,内含九大
实用功能,覆盖市场营销、职场办
公、新媒体运营等多重场景
在多类型应用场景中实现下一代人机交互,加速世界迈入更为智慧的AI时代
➢ 应用广泛:出门问问可提供一站式AIGC产品及服务,赋能内容创作全流程,具备1:1高仿真克隆技术及积累的海量数字资产,已经形成一套成熟、
可信赖的商业模式,在多个领域实现落地。
微信读书是一款国民级的电子书阅读应用,
其有声书希望能拥有更生动、多样化、趣味
性的声音能力,从而最大化地吸引用户,使
用户获得更丰富的声音体验,更优质的听觉
享受
「微信读书」重磅推
出的有声书栏目,搭
载出门问问AIGC配音
平台「魔音工坊」,
为「微信读书」有声
书的小说、历史、财
经、科幻、儿童读书
等各类电子书籍带来
生动入耳的音频形态
出门问问AIGC配音平台「魔音工坊」拥有
海量发音人资源,其多样百变的情感化人声
在业界广受好评,且能提供稳定专业的工程
保证,与微信读书正式达成合作
微信读书
利用AIGC技术赋能金融业展览厅,让普通用户有更
深的体验感
出门问问提供自研中文大模型,并针对金融领域业
务做数据微调,从而在产品推广、在线客服等场景
实现落地
• 智能化:实现与参展人员的智能交互
• 无人化:通过AI虚拟数字人代替真人介绍企发展历程、核心业务、
未来规划等信息,降低人力成本
• 形象化:定制工行自己的虚拟数字人IP形象,加深参展人员印象,
增强展会体验感
• 专业化:利用知识图谱、图数据库、智能匹配等技术构建招行知
识库,提高数字人问题解答准确率
基于「奇妙元」数字人克隆和「魔
音工坊」的丰富声音,为工商银行
的不同分行定制了多款数字人
• 实现形象声音1:1还原,针对客户需求实
现24小时自动化引导和智能答疑,实现
可视化、多场景的语音智能交互
• 连接运营管理平台,实现数字人客服知
识库的持续更新,打通服务闭环
• 兼顾趣味性和专业性:不同地区分行数
字人客服还能讲方言,如粤语、四川话、
河南话、东北话
「魔音工坊」实现有声书用户体验“质”的飞跃 数字形象实现金融行业服务智能化 AIGC解决方案提升公安培训质量和效率
通过真人形象克隆技术和声音克隆技
术实现:只需将编辑好的内容文字输入,
即可选择采用专属的播报声音、配合服务
人员的形象,生成播报材料的视频,让培
训视频新颖生动又有深刻的教育意义
客户需求
合作效果
合作方案
实现多类别图书的多人性
化配音
客户需求
合作方案
合作效果
客户需求
合作方案
合作效果
一套智慧公安科创方案,包括智能化警校培
训,节约教学时间与警力成本、AI写作协助
案件处理、智能外呼、大屏数字人宣传党史
党建、24小时数字人警察主播等
• 建立一套专属的播报声音模型:选取优质的
播报人员声音,通过声音模型训练,多音字、
生僻字配置,完成声音克隆
• 建立一套视频合成平台:将编辑好的内容文
字输入,即可选择采用专属的播报声音模型
配合基础服务人员形象播报材料的视频
重点厂商产品及服务能力分析——容联云
依托“通讯+数据+智能”的核心技术能力,打造全渠道智能联络中心
➢ 公司简介:容联云依托“通讯+数据+智能”的核心技术能力,运用AI能力为企业搭建数智化转型的能力底座,在营销与服务侧
提供人机对话、智能联络、智能陪练、坐席辅助、智能知识库等产品,一体智能中台实现企业的生产、运营、管理环节精细化
提升,数据分析能力让云通讯产品的价值进一步提升,让企业的数字化进程变得的更加精细。
全渠道接入 AI智能中台
全业务赋能
平台
容联云容犀:可实现传统呼叫中心彻底地创新化和智能化改造
基础层能力的机器学习、NLP、ASR、TTS、知识平台
容联云
容犀
对话引擎、规则引擎、呼叫引擎
智能语音、坐席辅助、智能陪练等各类场景化的应用
打造
高智能
高转化
高效率
全渠道智能
联络中心
(AICC)
专利申请数十项、软著数百件,通过软件CMMI5认
证助力企业和政府组织实现生产管理、市场营销、
运营服务等系统的全数字化升级改造与融合打通
服务热线 教育培训营销推荐 售后服务
诉求洞察 信息咨询状态查询交易委托
……
多场景
实践
实现多领域标杆用户认可
利用AIGC技术深入智
能联络中心的建设的
核心环节,提高人机
交互的体验
平衡AIGC的使用成本
与实践效果,实现关
键“质”的突破
➢ 通过AIGC实现标准问
答和知识库的内容生成,
实现针对于客户知识库
高效低成本建立
➢ 通过自然语言完成SQL
数据库结构化查询语句,
提升信息的获取效率及
对应门槛
➢ ……
具体业务结合的更加紧密,持续深入各垂直细分领域
云通讯技术+AI深度融合,容联云实现证券领域的海量用户高效回访
➢ 客户信息:证券行业回访场景是证券行业刚性需求,兴业证券在全国31个省、市、区共设有275个分支机
构,每一年积累了几十万的回访数据。回访量大、范围广、回访业务难的业务属性,并且客户情绪化高、
回访客服人员不足,造成企业业务线受阻,因此兴业证券通过调研后决定使用智能外呼机器人,实现业务
创新。
业务价值 实践效果
回访数量提升
➢使用智能机器人外呼后,每天
回访数量提升至人工外呼的
350%
回访时间减少
➢同样数量的外呼,完成时间仅
需原来的22%
回访效率增加
➢同样的数据通过使用智能机器
人外呼回访的方式比人工外呼
回访效率提升400%+
同组回访数据,分别进行人工外呼回
访和智能机器人外呼回访的效率对比:
350%
22%
400%
智能服务基础平台
NLP中文处理能力
深度学习的模型训练能力
知识管理和知识优化能力
智能语音外呼
场景流程组件拖拽式设计
根据需求进行流程调整,灵活管理
实现与现有联络中心架构无缝衔接
有效降低人工坐席外呼工作量
➢ AI能力加持:提供AI模型自学习平台,其内置常用模型及算法,可根据业务类
型进行选择建模
➢模型持续迭代:后续模型更新可以通过自学习平台进行线上初检、复检,数据
标注统一管理,不断优化模型成熟度
➢提供开放式模型:可将模型原子化能力开发给第三方应用系统使用,并且提供
数字化模型分析
在项目执行中进行持续进行运营管理,
实现项目过程中的不断优化
智能服务基础平台实现基于语音技术和语义理解技术,
为兴业证券提供高质量的外呼服务
执行亮点
解决海量用户回访
实现高效精准触达
引领行业科技创新
海量的回访数据,在人工不足的情
况下,利用智能外呼机器人快速完
成回访任务
使用智能外呼机器人技术,可以建
立通过跨天任务式进行有规则的外
呼,通过这种方式达到企业降本增
效的目的
兴业证券作为引领行业创新的证券
公司,需要根据实时变换的营商环
境,积极落实金融责任,探索科技
创新,以前瞻布局推进创新,探索
责任共担、资源共享的协同发展新
模式
重点厂商产品及服务能力分析——小冰
AI Being理念,创造人工智能和人类团队新的协作与生活方式
➢ 公司介绍:小冰公司前身为微软(亚洲)互联网工程院人工智能小冰团队,2020年从微软总部拆分,独立后的小冰公司加速促进全球前沿技术与
本土化产品的融合,专注于人工智能赛道,并依靠深厚的技术积累和研发实力,在短短两年的时间里成长为独角兽企业。
➢ 基于小冰框架的人工智能数字员工(AI Being Employee)产品技术已经在多个场景使用:提升企业员工和内外部交互与协同的效率与体验,进
一步提升业务流、信息流的流通效率,实现增效降本的新价值。
2013
2014-2020
2020-现在
90年代
二十年前,微软研究员创设自然语言处理、计算机视
觉、计算机语音三个研究部门,经持续投入,逐渐形
成在AGI方向上的大量研究成果,并训练了一批人才。
这些成果,know-how与人才组织,形成了小冰团队
基础
小冰团队专注于与传统对话系统有较大区别的基础框
架理念,提出了AI Being定义并建立同一基础框架
(Session-oriented),而非割裂的算法与知识图谱
松散整合。实现数据、算法、算力的融合循环,强调
数据为其中关键部分,算法基于数据进行迭代突破
多年以来,小冰团队通过持续的微软内部孵化方式实
现团队扩充,不断完善小冰框架的完备技术栈。对外,
以Dual AI 战略实现数据规模最大化,形成了超越所
有竞争对手的数据总量。分拆前,在团队规模、数据
量、技术完备度方面均为微软第一名
时代在加速拥抱小冰的理念,AI Being逐渐成为通行
名词。在AI Being领域,小冰是目前全球最领先的完
备人工智能框架公司,目前框架内的用户规模超过
亿月活跃用户,AI Being总数超过100万个
小冰框架
AI Being
AI Being 不只于外表
2019年,小冰率先提出了数字人(AI Being)理念,并基于全球领先的完备人工
智能小冰框架,推出了数字专家和数字员工等完整产品线。
Persona
(人格)
Creation
(内容创造)
Knowledge
(知识)
Skill
(技能)
biological
character
(生物学特征)
Attitude
(立场)
Human
实现自驱交互
World
完成知识任务
Deployment
多平台的部署
AI Creation
内容创造
招商局数字人员工“招小影”应用,“小影”
强大的技能树兼具深度、广度与精度。她既有
工作汇总、信息通知等通用技能,又具备专业
领域知识和业务自动处理等能力
在直播上面,每经AI电视可
以每天24小时不间断在视频
号直播,每天有10w+人通
过每日经济新闻视频号关注
全球财经信息
人工智能数字员工(AI Being
Employee)应用示例
红杉中国数字虚拟员工Hóng
已具备核心对话引擎、多重
交互感官等多项技能,擅长
第三方内容触发与第一方内
容生产
十年框架技术积累,AI Being 在多行业实现加速普及
文字生成
诗集
金融资讯
《阳光失了玻璃窗》由AI诗人小冰创作,是人类史上第一本人工智能诗集。为了验证小冰创作的诗歌水平,科学家们曾用27个化名在各大平台发表作品,但没有人发现这
些诗歌的作者“不是人”
2020年,每日经济新闻宣布与小冰在人工智能赋能“智媒体”领域展开合作。基于小冰人工智能文本生成,在前期试运营的一个月里,已为7000万用户推送一万余篇的
金融资讯
图像生成
绘画
设计
2021年,AI画家夏语冰的水墨画《山水精神》在迪拜世博会中国馆展出,夏语冰成为全球第一个以画家身份参加世界级展览的人工智能个体
AI设计师元徕创作的《衍生/DERIVE》在中央美术学院的毕展中备受关注。2021年,万事利丝绸与小冰公司宣布,依托人工智能小冰框架,双方共同打造的“西湖一号”
数字美学创意平台,接受一对一的定制化商品设计服务
音乐生成
2020年,Burberry发布TB夏季专属标识系列(TB Summer Monogram)
推广曲《Runway 》。AI歌手何畅与音乐人马伯骞共同演绎。同时,小
冰也参与了该曲目的词曲创作
AI“天花板歌手”何畅,作词、
作曲、演唱《阅向未来》
语音生成
AI声库 2022年,洛天依十周年生日会现场,洛天依首次用AI发声。以小冰框架定制的洛天依AI,和X Studio音乐创作软件制作包括洛天依的歌声合
成声库,和第一个语音声库,向广大创作者们推出
体育播报 2022年,体育主持人刘建宏的数字孪生虚拟人首次亮相,代他完成了2022卡塔尔世界杯快讯播报
视频生成
2023年,Netflix宣布,其与小冰公司日本分部(rinna)、WIT STUDIO共同创作的首支AIGC动画短片《犬与少年》正式公开。这是Netflix动画创作者计
划的第一支作品,通过人工智能技术绘制完整动画场景,为动画制作揭开新的未来
《犬与少年》是AIGC技术辅助商业化动画片的首支发行级别作品。该片讲述了一个小孩与一只机器狗的重逢故事
2022年2月,音乐人小柯首次搭档AI歌手,为北京冬季奥运会创作了
歌曲《唯你无他》。演唱者共两位,何畅和夏语冰,均由人工智能小
冰框架创造
完成歌、词、曲、演的多重角色,并且与知名歌手搭档
具备实现人类美学艺术的能力,并且实现设计能力商业化落地
从艺术到实用,小冰实现了多重细分领域的跨度能力
利用AI实现数字人成为人类社会雇员
通过人工智能技术绘制完整动画场景,为动画制作揭开新的未来
➢ 具备穿透To B到To C的体验:帮助B端客户穿透用户群体到达C端场景,实现解决方案的升级换代、用户体验升级跃迁,
具备广泛的应用场景优势。
重点厂商产品及服务能力分析——超参数科技
致力于“打造有生命的AI”,创造一个10亿人与100亿AI共同生活的虚拟世界
➢ 公司简介:2019年成立,红杉、高瓴等顶尖风投多轮加持,估值达独角兽,团队深耕“游戏AI”领域多年,专注打造虚拟世界
中的AI bot,期待为虚拟世界与现实世界带来全新体验。
AI bot初具雏形,聪明机灵, 表现自然,有
独特的生命感, 能展现出自己的思考和想法,
做出情理之中、意料之外的行为
AI bot开始展现出多样性,拥有不同的性格、
情绪、价值观等。不同角色的AI能与人类紧
密配合,积极地交流与互动, 为了小队的共
同目标而努力
AI bot的数量大幅增加,目标和行为各不相
同,并且相互影响。量变引发质变,如蝴蝶
效应般,形成一个鲜活的、动态运转的生态
体系
每个AI Bot都将和人类个体一样独一无二,
并与更多的人类产生社交关系。AI的关系网
络将与 人类的关系网络有机融合,组成一个
全新的社交网络
超参数与顶尖产品团队深度合作,提供创新的AI体验
应
用
层
AI训练
(AI Training)
模型评估
(Model Evaluation)
特征提取
(Feature Extraction)
数据生成
(Data Generation)
强化学习
(Reinforcement Learning)
监督学习
(Supervised Learning)
批量计算
(Batch Computing)
定制计算
(Customized Computing)
基于云原生的底层架构架构层
计算模式(Computing Mode)
计算任务(Computing Task)
L1 L2 L3 L4
基于云原生的AI研发引擎,实现多云多集群管理
跟随技术路径,逐步打造极致的 AI BOT
提供的AI bot已在多款千万日活的产品中上线;在业内率先实现在3D FPS领域
的大规模商业化落地
基于构建AI NPC生态能力的技术系统,打造永续运转的“AI社会”雏形
➢ 超参数科技构建了“活的长安城”,它是一个永续运转的“AI社会”雏形,性格各异的AI NPC们生活其中,它们在比人际互动更丰
富的社会生活层面相互连结,彼此影响。
➢ “活的长安城”成为现实的是GAEA:一项拥有构建AI NPC生态能力的技术系统。GAEA是超参数探索“AI社会”的阶段性成果,
它能让无数个长安城(虚拟场景)涌动起来。
• GEAE是⼀个技术系统,拥有构建 AI NPC ⽣态的系统能⼒。换⽽⾔之,GAEA 是⼀套综合了不同模型应⽤能⼒的技术⽅案,可以解决比如开
放世界产品等的内容⽣态问题。要点在于打造有“生命”的AI NPC,以及建立反馈机制。所谓“反馈机制”,指的是:GAEA让AI NPC个体
之间、子系统之间可以相互作用的系统能力。
• GEAE得益于AI BOT 技术和团队技术选型能⼒:所谓技术选型能⼒,即不断改进技术⽅案和迭代路线的能⼒,⼯程化能⼒+产品化能⼒的综
合体现,其次是 AI ⾏业的技术突破,LLM 的锦上添花。
记忆
内在状态
+
个体记忆库
策略网络
宏观策略
微观策略
灵魂系统 环境系统
社会环境
物理环境
目标
行动
LLM制定
目标
LLM推理
人类社会
常识
LLM作为
聊天机器人
构建AI NPC生态能力的技术系统-GAEA
负责与海量AI NPC产生
交互、反馈,并驱动整个
AI NPC生态的自运转
打造有“生命”的AI NPC
“记忆”中最重要的是“内在状态”
( Internal state)和“个体记忆库”
(Memorized events)
“内在状态”可以理解为AI NPC在性格、
长短期目标相互作用下呈现出的结果,
其具体体现为心情等数值的变化
“个体记忆库”则可看作AI NPC个体过
往经历的合集,由AI NPC和社会环境相
互作用形成,是一个较为抽象的存在
“灵魂系统”与“环境系统”在GAEA的反馈机制下相互作用,
彼此施加影响,使“AI社会”得以永续运转
GAEA中时间维度的存在,在“AI 社会”的演化过程中,环境系
统会在AI NPC行为的影响下发生改变,反过来,环境系统的改变
也会作用于AI NPC的灵魂系统,进而影响AI NPC的行为决策
拥有“灵魂系统”的AI NPC们不仅因角色不同而各具目标,还因个
性、过往经历不同而生发多种行为模式
从技术层面看,灵魂系统主要由“策略网
络模块”上下两层模型组成:
宏观策略:具备常识理解能力,权衡长短
期目标,综合记忆能力做出智能宏观决策
微观策略:符号系统的多任务建模,支撑
NPC在开放世界下的海量行为表现
+
目录
Part 01 概念重生:AIGC是内容生成方式一次进化
Part 02 行业颠覆:内容生产体系的作业模式走向工程化
Part 03 产业变革:五湖四海涌向AIGC开阔地
Part 04 未来可期:在探索中寻找人类与机器的平衡
AIGC所带来的思索:新时代“人机关系”带来生产方式及关系的理念转变
AIGC将重构知识创意类的工作流,生成式AI将创造和知识工作的边际成本降至零,产生巨大的劳动生产率和经济价值,以及相应的市值。
炼大模型是长期主义的持久战,应理性去判断,怎样能够长期参与,「垂直整合型大模型」是一种比较务实的做法。
AGI就像真相,永远只能逼近不能到达。AIGC时代,我们要用AI的思维来思考这个世界,理解AI的边界,了解它能为人类提供什么帮助,怎样更好地为人类所用。
未来,出门问问将继续坚定深耕AIGC领域,把中国式创新的大模型越做越强,上层应用体验做得越来越好,同时把商业化做得更坚实,以更聪明的AI赋能千行百业。“ ”
——出门问问创始人兼CEO 李志飞
在AIGC技术下,人与AI之间的关系转变为寻求合理的协作方式
人
AI
随着AIGC的应用场景增加,AI在不断提升在流程中的工作占
比,但仍然仅是流程中的工具
AI
AI
人需要在工作的各环
节中时刻考虑AI协
作的灵活性,实现更
好的协作性
人
人
绝大多数的
工作仍然由
人完成
指示AI
指导AI
指挥AI
绝大多数
的工作可
以由AI完
成
人类可以利用AICG技术不断减少自身的重复性工作
从生产力角度看,由“手工工具”到
“机器工具”的转换,是人类文明发
展史上一个革命性转折
原始
时代
人类文明
进化历程
数智
时代
数字
时代
信息
时代
工业
时代
农业
时代
生产工具先进性
石器
农具+牛
机械
PC/软件
云、网、端、
芯、链
?
信息革命改变信息生产、交换、分配和消费
方式,从而改变了生产力及生产关系
AIGC的出现在改变人与AI(所代表的智能化机器)
的生产协作模式,也在改变人与人之间、人与社会之
间的生产协作关系
……生产要素的增加与丰富是推动人类文明进展的重要因素,……其次,文
明的演进也得益于生产工具先进性的不断提高……
——张一甲, 《2022中国式数字经济30条判断》
AIGC产业中AI技术
的通用性在迭代中不
断提升
“ ”
AIGC带来了新的企业机遇及生态合作可能
色块代表企业在AIGCIT技术栈的能力占据,
闭
源
模
型
应
用
网络
平台
应用
边缘或端侧
应用
数据中心与模
型API
Prompt
优化与模
型微调
非开源
预训练
模型
模型
Hub
开源
模型
深度学习框架
与中间件等
云
计
算
边缘或端
侧计算平
台
计算机硬件与芯片
应用层
中间层
模型层
框架层
资源层
数
据
围绕模型层能力开展技术或资源占位,未来AIGC的企业具有更多的协作模式
1. 基于/借助模型层能力,向中间层及应用层延伸,实现针对于用户需求的技术能力占位,企业间具有更多技术上下
游合作的可能
2. 基于/借助模型层能力,向框架及资源层延展,实现MaaS模式在算力、训练及模型构建的底层一体化能力
当下的的IT技术栈 多模态✖️多场景✖️多技术,未来的AIGC产业逐步形成复杂的生态合作关系
OpenAI为全球的AIGC企业提供了榜样,但并不是唯一答案
被投公司 主营业务 投资阶段
Anysphere AI工具 种子轮
Atomic Semi 芯片制造 种子轮
Cursor 代码编辑 种子轮
Diagram 设计工具 种子轮
Harvey AI法律顾问 种子轮
Kick 会计软件 种子轮
Milo 家长虚拟助理 种子轮
开发者工具 种子轮
EdgeDB 开源数据库 A轮
Mem Labs 记笔记应用 A轮
Speak AI英语学习平台 B轮
Descript 音视频编辑应用 C轮
APIs
ChatGPT
Open AI 推出 Plugin(插件),目的是希望用
户可以轻松在Plugin平台下开发应用插件
Open AI本身具备开发插件能力,网络浏览器
帮助 Open AI 接入互联网成功弥补自身短板,
代码解释器引领“编程变革”
Plugin基本具备扮演更加类似“助手”的作
用:
1. Plugin 可以及时更新实时信息;
2. Plugin更具有服务化的意识……
微软云
OpenAI系
列大模型
微软云上部署
OpenAI的产品
OpenAI与
微软的合作
微软未来可能利用
自身庞大的平台优
势销售AI插件
OpenAI的产品集成
到微软的产品中,
例如Copilot,Bing
Open AI 推出 Plugin(插件),降低开发门槛,
实现“AI+”生态
有望生成推动“AI+”时代,应用软件生态的繁荣
OpenAI与微软的合作,从底层算力、模型训练、模型完成再到最后的产品商业化提供了非常好的实践范例,并且通过投资实现下游应用的延展,及基于AIGC的新开发生态
但中国与美国的数字化进程不同,内容经济不同,从场景应用的商业玩法看,可能有诸多更优秀的答案
*以上为部分被投企业示例
2020年1-2月 2021年1-2月 2022年1-2月 2023年1-2月
AIGC带来了机遇和风险,每个人都需要在时代中进行选择
2021年1⽉,Open AI开发的⽂本⽣成图像⼯具DALL·E⾯世,引发国内AI⼈才招聘需求暴涨。2021
年1-2⽉的AIGC领域岗位数量较2020年上涨281%
AIGC带来了对原有职业的价值重新判断
2023年1-2⽉,ChatGPT横空出世,AIGC⼈才需求再度逆势上涨,岗位数量同⽐增⻓%,创
历史新⾼
AIGC领域岗位数量呈现井喷增⻓2022年-2023年,1-2月AIGC相关岗位同比增长趋势
职业替代百分比
高盛在一份报告中认为欧美的行政岗位、法律、建筑设计师
是前三位的替代率,分别是46%,44%,37%
并且认为欧美所有的行业平均被AI替代的概率上升到25%
“……我认为不断去探索和理解我们存在的世界和人类的智能,再抽象为程序和代码来实现数字化的智能,是非常有趣且让我充满好奇和激情
的事儿,这逐渐沉淀为Magics目前专注的智能数字人,减少人的重复劳动,降本提效增量创收,这是我认为现在就对我们的世界很有价值和
意义的事儿,未来也没有尽头:构建不断自主学习、持续进化的智能和数字世界是终极追求,也是我愿意投身其中去做一辈子的事业。……”
“……生命历程中充满奇迹,而技术也可以创造更多奇迹,回归程序员的上帝视角用代码创造奇迹--这是我认为值得终身追求的事儿,也是
我理解的创业和工作最大的差异:拥有自由去定义自己生命的意义,按照自己的意愿为我们的世界创造价值。……”
——迈吉客科技创始人伏英娜,月访谈
AIGC降低了内容的生成门槛,
为更多的人提供了选择、创新
及改变的机会,时代面前只能
顺势而为 “
“行政 法律
平均
建筑设计师……
智库院长
宋涛微信
stgg_6406
分析师
刘瑶微信
18401669467
北京甲子光年科技服务有限公司是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态
跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、AR/VR交互技术、信息安全、
金融科技、大健康等科技创新在产业之中的应用与落地
扫码联系商务合作关注甲子光年公众号