ChatGPT研究框架(2023)
2023年02月07日
行业专题研究
诚信 · 责任 · 亲和 · 专业 · 创新 2
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
01
ChatGPT市场反应热烈,国内外巨头纷纷入场
据统计,ChatGPT日活跃用户数的增速远超Instagram,1月份平均每天有超过1300万名独立访问者使用ChatGPT,是去年12月份的
两倍多;国内外科技巨头都非常重视ChatGPT引发的科技浪潮,积极布局生成式AI,国内厂商(百度、腾讯等)也高度关注ChatGPT,
积极探索前沿技术,相关深度应用也即将推出。
02
03
04
摘要
ChatGPT经历多类技术路线演化,逐步成熟与完善
ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累。Transformer建模方法成熟
以后,使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟,随后GPT-1、GPT-2、GPT-3模型持续演化升级,最终孵
化出ChatGPT文本对话应用。
AIGC跨模态产业生态逐步成熟,商用落地未来可期
AIGC产业生态当前在文本、音频、视频等多模态交互功能上持续演化升级,奠定了多场景的商用基础。跨模态生成技术也有望成为真
正实现认知和决策智能的转折点。
ChatGPT乘东风,商业架构日益清晰
随着ChatGPT Plus发布,商业化序幕已经拉开。ChatGPT在传媒、影视、营销、娱乐以及数实共生助力产业升级等领域均可产生极大
助益,提升生产力曲线,多维度赋能虚拟经济和实体经济。
3 诚信 · 责任 · 亲和 · 专业 · 创新
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
目录 / CONTENTS
市场概况:ChatGPT——AI平民化里程碑 01
技术路径:基于人类反馈系统,ChatGPT助力跨模态AI生成应用 02
行业进程:AIGC多模态交互功能持续演化,奠定多场景商用基础 03
商业方向:多领域多功能应用密集落地,ChatGPT商用前景可期
03
4 诚信 · 责任 · 亲和 · 专业 · 创新
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
01
市场概况:ChatGPT——AI平
民化的里程碑
诚信 · 责任 · 亲和 · 专业 · 创新 5
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
OpenAI在成立之初便备受资本瞩目,与微软合作加速商业化进程 01
ChatGPT是由OpenAI 团队研发创造,OpenAI是由创业家埃隆·马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线
支付平台PayPal联合创始人彼得·蒂尔等人于2015年在旧金山创立的一家非盈利的AI研究公司,拥有多位硅谷重量级人物的资
金支持,启动资金高达10亿美金;OpenAI的创立目标是与其它机构合作进行AI的相关研究,并开放研究成果以促进AI技术的
发展
2019年7月 2020年6月 2020年9月
OpenAI发展的里程碑
OpenAI宣布从”非盈
利 “性质过度到”封
顶盈利“性质,利润
上限为任何投资的100
倍(创立了OpenAI
LP公司)
微软向OpenAI投资了
10亿美金,并获得了
OpenAI技术的商业化
授权。从此,OpenAI
的一些技术开始出现
在微软的产品和业务
上
OpenAI发布了OpenAI
API,这是OpenAI第
一个商业化产品,
OpenAI正式开始了商
业化运作
OpenAI授权微软使用
GPT-3模型,微软成
为全球首个享用GPT-
3能力的公司
2019年3月
图1:OpenAI发展势头强劲,商业化趋势明显
资料来源:OpenAI官网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 6
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
OpenAI 的ChatGPT是生成式人工智能技术(AIGC)浪潮的一部分 01
资料来源:中国信息通信研究院,国泰君安证券研究
AIGC发展
特点
人工智能总
体阶段 早期萌芽阶段
(20世纪50年代-90年代中期)
沉淀积累阶段
(20世纪90年代-21世纪10年代
中期)
快速发展阶段
(21世纪10年代中期-至今)
受限于技术水平,AIGC仅限于小
范围实验
AIGC从实验性向实用性转变,受
限于算法瓶颈,无法直接进行内
容生成
深度学习算法不断迭代,人工智能生成内容
百花齐放
AIGC典型
事件
1950年,艾伦·图灵提出
著名的“图灵测试”,给
出判断机器是否具有“智
能”的方法
1966年,世界第一
款可人机对话机器
人“Eliza”问世
80年代中期,IBM
创造语音控制打字
机 “Tangora”
2012年,微软展
示语全自动同声传
译系统,可将英文
语音自动翻译成中
文语音
2007年,世界上
第一部完全由人
工智能创作的小
说《1 The Road》
问世
2014年,Lan J. Goodfellow
提出生成式对抗网络GAN
2018年,英伟达发布
StyleGAN模型用于自动生成
高质量图片
2019年,DeepMind发布
DVD-GAN模型用于生成连续
性视频
2022年,OpenAI发布
ChatGPT模型用于生成自然能
语言文本
图2:随着算法的不断迭代,生成式人工智能技术(AIGC)不断发展
诚信 · 责任 · 亲和 · 专业 · 创新 7
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT是在GPT基础上进一步开发的自然语言处理模型 01
GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大
型文本语料库上学习到的语言模式来生成自然语言文本
从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是 GPT-4 正式推出之前的序章
资料来源:CSDN,国泰君安证券研究
GPT-1(亿参数)
GPT-1 有一定的泛化能力,能够用
于和监督任务无关的 NLP 任务中
2018
2019
2020
GPT-2(15亿参数)
除了理解能力外,GPT-2 在生成方面表现出了
强大的天赋:阅读摘要、聊天、续写、编故事,
甚至可以生成假新闻、钓鱼邮件或在线进行角
色扮演
GPT-3(1750亿参数)
GPT-3 作为一个自监督模型,
可以完成自然语言处理的绝大
部分任务:将网页描述转换为
相应代码、模仿人类叙事、创
作定制诗歌、生成游戏剧本,
甚至模仿已故的哲学家预测生
命的真谛
InstructGPT
InstructGPT是一个经过微调
的新版 GPT-3 ,可以将有害
的、不真实的和有偏差的输
出最小化
ChatGPT
ChatGPT 是 InstructGPT 的
衍生产品,它将人类的反馈
纳入训练过程,更好地使模
型输出与用户意图保持一致
图3:ChatGPT由GPT-1到InstructGPT模型的不断成熟而逐步形成
诚信 · 责任 · 亲和 · 专业 · 创新 8
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT发布后用户数持续暴涨,市场影响力迅速提升 01
根据UBS发布的研究报告显示,ChatGPT在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者应用
相比之下,TikTok花了九个月的时间月活跃用户数才破亿,而Instagram则花费了两年半的时间,同时,根据Similar Web的披露信息,Spotify
在四年半后仅积累了1亿月活跃用户
根据Similar Web的数据,1月份平均每天有超过1300万名独立访问者使用ChatGPT,是去年12月份的两倍多
资料来源:UBS,Similar Web,ARK Invest,第一财经,国泰君安证券研究
2个月 9个月 30个月
54个月
图4:ChatGPT日活跃用户数的增速远超Instagram 图5:对比各大热门平台月活跃用户数破亿所需时长,ChatGPT的成长速度惊人
42个月 54个月 90个月
资料来源:第一财经,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 9
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT已能覆盖较多能力域 01
由于ChatGPT包含了更多主题的数据,能够处理更多小众主题。ChatGPT能力范围可以覆盖回答问题、撰写文章、文本摘要、语言翻译和生
成计算机代码等任务。
资料来源:ChatGPT,国泰君安证券研究
用鲁迅口吻写一篇评价新冠疫情的散文 用Python写一段CCI量化投资策略 写一篇信创产业的研究报告
用藏文、俄罗斯语、韩语和日文说一句话 用C++写一段爬虫代码
图6:ChatGPT的使用案例如下所示
代码阅读理解和Debug
诚信 · 责任 · 亲和 · 专业 · 创新 10
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT具备诸多先进性特征 01
ChatGPT嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景
当前,ChatGPT所利用的数据集只截止到2021年。在对话中,ChatGPT会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的
回复,因而ChatGPT也可实现连续对话,提升了交互模式下的用户体验。同时,ChatGPT也会屏蔽敏感信息,对于不能回答的内容也能给予相关
建议。
资料来源:知乎,国泰君安证券研究
图7:ChatGPT提升的核心点如下所示
连续对话能力
用户意图有效捕捉
上下文理解
敢于质疑
承认不知道
提升准确度
ChatGPT
算法屏蔽
连续对话
人类意图
诚信 · 责任 · 亲和 · 专业 · 创新 11
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
科技巨头不断下注AI行业, ChatGPT带动新一轮AI发展浪潮 01
2023年初,微软和谷歌均宣布裁员计划,但都加大了在AI行业的投入
资料来源:UBS,《财富》,华尔街见闻,国泰君安证券研究
1月18日,微软宣布将于3月底前在全球裁员1万人,约占公司员工总数的5%
1月23日,微软宣布对 ChatGPT 创建者 OpenAI 进行第三轮投资,将向OpenAI进行为期多年、
金额达数十亿美元的投资,以加速其在人工智能领域的技术突破
此外,微软还计划在未来几周内发布其 Bing 搜索引擎的 GPT-4 版本,预计该版本将比
ChatGPT 模型更快、更强大
1月20日,谷歌母公司Alphabet宣布将裁员约万人,占公司员工总数的6%以上,同时公司
CEO表示,公司将会进一步聚焦AI技术核心业务的研发投入
2月4日,谷歌注资3亿美元投资ChatGPT竞品——Anthropic,和Open AI一样, Anthropic也
在开发生成式人工智能
图8:科技巨头纷纷加大ChatGPT相关投入
诚信 · 责任 · 亲和 · 专业 · 创新 12
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
国内外科技巨头积极布局生成式AI,部分公司已有成型产品 01
国内外科技巨头都非常重视ChatGPT引发的科技浪潮,积极布局生成式AI
国外公司
公司名称 相关布局
谷歌 面对ChatGPT构成的威胁,注资3亿美元投资竞品Anthropic
微软 作为OpenAI的最大投资方,利用ChatGPT提高产品竞争力
亚马逊 ChatGPT受到重点关注,已广泛运用在各种工作职能中
国内公司
百度 预计在3月份完成其ChatGPT产品——文心一言(ERNIE Bot)的内测,并面向公众开放
腾讯 目前已经公布一项人机对话专利,能够实现机器与用户之间自然且顺畅的沟通
表1:国内外科技公司积极布局生成式AI
资料来源:各公司公告,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 13
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
谷歌:面对ChatGPT构成的威胁,注资3亿美元投资竞品Anthropic 01
在ChatGPT发布后,谷歌CEO在公司内部发布了“红色警报” (Code Red),敦促团队解决ChatGPT对公司搜索引擎业务构成的
威胁,同时批准了在谷歌搜索引擎中加入AI聊天机器人的计划
2月4日,谷歌注资3亿美元投资ChatGPT竞品——Anthropic,谷歌将获得约10%的股份, Anthropic计划将次轮资金用于购买谷歌云计算部
门的计算资源;Anthropic开发了一款名为Claude的智能聊天机器人,据称可与ChatGPT相媲美(仍未发布)
Anthropic和Open AI渊源颇深,其联合创始人曾担任OpenAI 研究副总裁
资料来源:腾讯新闻,国泰君安证券研究
图9:Anthropic的联合创始人曾担任OpenAI 研究副总裁 图10:聊天机器人Claude据称可与ChatGPT相媲美
资料来源:新浪财经,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 14
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
微软:OpenAI的最大投资方,开始利用ChatGPT提高产品竞争力 01
微软将ChatGPT视为新一代技术革命,将ChatGPT整合进Bing搜索引擎、Office全家桶、Azure云服务、Teams程序等产品中
微软近期宣布推出视频会议及远程协作平台的高级付费版Microsoft Teams Premium,订阅者可享用OpenAI GPT提供支持的大型语言模
型技术,用AI自动生成会议笔记,此举或对Zoom、谷歌会议等平台形成巨大冲击。
资料来源:微软官网,国泰君安证券研究
图11:Microsoft Teams Premium 使用 ChatGPT 做笔记,使远程协作更高效 图12:集成了ChatGPT的新版 Bing 曾短暂上线,搜索框类似一个聊天框
资料来源:Windows Central,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 15
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
亚马逊:ChatGPT受到重点关注,已广泛运用在各种工作职能中 01
ChatGPT 已经被亚马逊用于各种不同的工作职能中,包括回答面试问题、编写软件代码和创建培训文档等
公司内部员工在 Slack 表示,亚马逊Amazon Web Services(AWS)云部门已经成立了一个小型工作组,以更好地了解人工智能对其业务的
影响。
资料来源: Business Insider,新浪科技,国泰君安证券研究
图13:ChatGPT 已经被亚马逊用于各种不同的工作职能中
资料来源:Encaptechno,国泰君安证券研究
图14:亚马逊AWS云部门的职能与人工智能联系紧密
诚信 · 责任 · 亲和 · 专业 · 创新 16
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
美国新媒体巨头Buzzfeed踩准ChatGPT风口,两天内股价飙升3倍 01
1月29日,美国新媒体巨头Buzzfeed宣布计划采用ChatGPT协助内容创作,其股价一夜间暴涨近120%,两天内飙升逾300%,
成交量突破亿股(其月平均成交量不足2500万股)
消息公布后同类型公司股票成交量也迎来历史高峰:本月成交量超过7200万股,为自去年6月以来最多;语音AI软件公司SoundHound AI
的成交量约为6450万股,几乎是其月平均值的三倍
资料来源:腾讯新闻,国泰君安证券研究
图16:Buzzfeed宣布计划采用ChatGPT协助内容创作后,股票成交量暴涨 图15:Buzzfeed宣布计划采用ChatGPT协助内容创作后,股价一夜间暴涨近
120%
资料来源:澎湃新闻,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 17
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
Stability AI:Stable Diffusion大热, Open AI在图片生成AI大有可为 01
Stability AI有着与Open AI相同的创业理念:构建开源AI项目,促进AI发展,其成功证明Open AI在图片生成领域同样大有可为
公司的开源模型Stable Diffusion可以根据文字生成图片,只需要几秒钟,就可以生成分辨率、清晰度高,同时不失真实性和艺术性的图片。
资料来源:网易新闻,国泰君安证券研究
图17:用户使用基于Stable Diffusion算法构建的工具创建了数百万张图像 图18:Stability AI有着与Open AI相同的创业理念,其成功证明Open AI在图片
生成领域同样大有可为
资料来源: Stability AI官网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 18
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
Jasper: 采用同类底层技术,进一步证明ChatGPT的巨大商业潜力 01
文案自动生成平台Jasper,其技术底层是 OpenAI 的 GPT-3,在成立仅 18 个月后就达到了 15 亿美元的高估值
IBM、Autodesk等巨头公司均是Jasper的付费用户,足以证明ChatGPT底层技术具备巨大的商业潜力。
ChatGPT出现后,其技术领先性和受欢迎程度对Jasper形成了强烈冲击。
资料来源:搜狐新闻, Jasper 官网,国泰君安证券研究
图19:ChatGPT的出现,对采用同类底层技术的热门公司Jasper形成强烈冲击 图20:相比ChatGPT的免费开源,Jasper需要付费使用
资料来源:Jasper 官网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 19
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
国内厂商(百度&腾讯): 高度关注ChatGPT,积极探索前沿技术 01
百度:1月10日,百度宣布将升级百度搜索的“生成式搜索”能力,智能解答用户的搜索提问;2月7日,百度宣布将在3月份
完成其ChatGPT产品的内测,面向公众开放,该项目名字为文心一言(ERNIE Bot)
百度指出,生成式AI和搜索引擎是互补关系而不是替代;据路透社报道,百度计划于 3 月将类似 ChatGPT 的 AI 对话服务作为独立应用推出,
之后再逐步将其合并到搜索引擎中。
腾讯:2月3日,腾讯公布一项人机对话专利,能够实现机器与用户之间自然且顺畅的沟通
图22:腾讯发布相关专利,积极涉足ChatGPT领域
资料来源:腾讯新闻,国泰君安证券研究
图21:百度研发的ChatGPT产品“文心一言”将于3月份问世
资料来源:中国经济网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 20
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC创业公司大比拼,国外ChatGPT的优势遥遥领先并有望延续 01
国内对比国外AIGC创业公司的相关产品,国外ChatGPT的优势遥遥领先并有望延续
公司名称 主要AIGC产品 产品领域
OpenAI GPT-3、ChatGPT 文本、图片
Stability AI Stable Diffusion、Dreamstudio 图片、音频
Midjourney Midjourney 图片
Jasper Jasper 文本
文本
Copysmith Copysmith 文本
表2:国外创业公司涉及的AIGC产品领域十分丰富,相关应用日渐成熟
资料来源:各公司官网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 21
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AI 需要大量资金、人力投入和数据积累,国内市场中巨头更具优势 01
人工智能不仅需要巨大的投入,还需要庞大的用户数据基础,只有互联网巨头才有这个能力产出伟大的产品
国外是微软、谷歌、亚马逊,而国内则是百度、腾讯等互联网巨头最具潜力;相比国外巨头,国内巨头正投入大量资金和人
力成本快速发展人工智能技术,在没有硝烟的人工智能竞赛中,中国企业也将异军突起
资料来源:腾讯AI LAB官网,国泰君安证券研究
图24:腾讯的AI 产品在游戏场景中不断提升人机协作与内容生成能力 图23:百度构建了云智共生的生态,助力AI发展
资料来源:百度官网,国泰君安证券研究
22 诚信 · 责任 · 亲和 · 专业 · 创新
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
02
技术路径:基于人类反馈系统,
ChatGPT助力跨模态AI生成应
用
诚信 · 责任 · 亲和 · 专业 · 创新 23
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
2022年
ChatGPT经历多类技术路线演化,逐步成熟与完善 02
资料来源:真格基金,国泰君安证券研究
ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累
GPT-1 GPT-2 GPT-3
Instruc
-tGPT
ChatGPT
T5 BART
M2m-
100
BigBird
BERT RoBERTa XLM ALBERT
ELECTRA
Transfo
-rmer
CNN
RNN
神经网络
Machine
Learning
基于规则
的少量数
据处理
1950年开始 1980年开始
1990年开始;
2006年获得突破
2017年
2018年 2019年 2020年
基于模板和
规则的前深
度学习阶段
根据一定范
围的数据进
行参数分类
开始模仿人
脑进行大量
数据的标记
和训练
对人脑学习
过程进行重
点关注
进行海量数据学习训练,人类的反馈信息成
为模型学习的内容
图25:ChatGPT经过多类技术积累,最终形成针对人类反馈信息学习的大规模预训练语言模型
GAN
诚信 · 责任 · 亲和 · 专业 · 创新 24
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
资料来源:ChatGPT,国泰君安证券研究
ChatGPT模型在以往模型的基础上有了多方面的显著提升 02
更大的语料库
ChatGPT使用了更大的语料
库,以更好地捕捉人类语言的
复杂性。
更高的准确性
ChatGPT的训练效果比以往
的大语言模型更好,因此它的
准确性更高。
更加通用的预训练
ChatGPT的预训练是通用的,
因此它可以更好地适应各种不
同的任务。
更强的自我学习能力
ChatGPT具有自我学习能力,可
以在不断接触新语料的过程中持
续提高自己的性能。
图26:ChatGPT是基于Transformer架构的语言模型,它在
以往大语言模型(如ELMo和GPT-2)的基础上有诸多性能提
升
更高的计算能力
ChatGPT使用了更高的计算
资源,以获得更好的训练效果。
更高的适应性
ChatGPT具有较高的适应性,可
以根据不同的场景和任务进行微
调,以提高其在特定领域的效果。
诚信 · 责任 · 亲和 · 专业 · 创新 25
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
Transformer的应用标志着基础模型时代的开始 02
转移学习(Transfer Learning)使基础模型成为可能
技术层面上,基础模型通过转移学习(Transfer Learning)(Thrun 1998)和规模(scale)得以实现。转移学习的思想是将从一项任务中学习到
的“知识”(例如,图像中的对象识别)应用于另一项任务(例如,视频中的活动识别)。
在深度学习中,预训练又是转移学习的主要方法:在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微调来适应感兴趣的
下游任务。转移学习(Transfer Learning)使基础模型成为可能。
大规模化(scale)使基础模型更强大,因而GPT模型得以形成
大规模需要三个要素:(i)计算机硬件的改进——例如,GPU吞吐量和内存在过去四年中增加了10倍;(ii)Transformer模型架构的开发
( Vaswani et al. 2017 ),该架构利用硬件的并行性来训练比以前更具表现力的模型;以及(iii)更多训练数据的可用性。
基于Transformer的序列建模方法现在应用于文本、图像、语音、表格数据、蛋白质序列、有机分子和强化学习等,这些例子的逐步形成使
得使用一套统一的工具来开发各种模态的基础模型这种理念得以成熟。例如,GPT-3( Brown et al. 2020 )与GPT-2的15亿参数相比,
GPT-3具有1750亿个参数,允许上下文学习,在上下文学习中,只需向下游任务提供提示(任务的自然语言描述),语言模型就可以适应下
游任务,这是产生的一种新兴属性。
资料来源:《 Attention Is All You Need 》论文,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 26
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
Transformer奠定了生成式AI领域的游戏规则 02
资料来源:《Attention Is All You Need》,Ashish Vaswani 2017
Transformer摆脱了人工标注数据集的缺陷,模型在质量上更优、
更易于并行化,所需训练时间明显更少
Transformer通过成功地将其应用于具有大量和有限训练数据的分
析,可以很好地推广到其他任务
2017年,在Ashish Vaswani 的论文《Attention Is All You Need》
中,考虑到主导序列转导模型基于编码器-解码器配置中的复杂递归或卷积
神经网络,性能最好的模型被证明还是通过注意力机制(attention
mechanism)连接编码器和解码器,因而《Attention Is All You Need》
中提出了一种新的简单架构——Transformer,它完全基于注意力机制,
完全不用重复和卷积,因而这些模型在质量上更优,同时更易于并行化,并
且需要的训练时间明显更少。
Transformer出现以后,迅速取代了RNN系列变种,跻身主流模型架构基
础。(RNN缺陷正在于流水线式的顺序计算)
图27:Transformer模型架构如下所示
诚信 · 责任 · 亲和 · 专业 · 创新 27
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
Transformer实现的不同技术场景对应的不同技术原理 02
资料来源:量子位智库,国泰君安证券研究
Transformer架构可分为自回归系列(例如GPT-3,偏好生成性任务)、双向Transformer+Mask的自编码系列(例如BERT,
偏好自然语言理解)、Encoder-decoder架构(例如T5,使用双向/单向attention,偏好条件文本生成)
首先通过词嵌入(Word Embedding)将字、词、
句进行区分,然后基于特征评分、序列标注、
分类模型等提取内容特征计算相关文本单元权
重其次洗择相应的文本单元子集组成摘要候洗
集,完成内容选择,最后针对字数要求等限定
条件,对候选集的内容进行整理形成最终摘要,
完成内容组织。其细分路径又包含生成式文本
摘要(AATS),即形成抽象认知并创造新词灵活
概括,和抽取式文本摘要(EATS),即直接抽取
原始素材并拼接成简单概要
摘要/标
题生成
内容续写
(例如文
章续写)
文本风格
迁移
整段文本
生成
产品
特色
通过随机Mask(即遮挡)数据库文本中的
词语或语段,让神经网络自主学习复原被
遮挡部分,从而拥有“猜测”缺失内容的
能力,产出预训练模型。再通过大规模预
训练模型理解上文或给定条件,从概率层
面推测最符合要求的输出结果。其本质是
借助超大规模的训练参数猜测上下文的过
程
主流思路是分离文本属性及文本内容
隐式方法即使用某类无监督学习学习或强化学
习模式将文本属性及内容自动分离,常见的有
生成对抗方式,即通过GAN实现目标属性和
文本量性完全由不同的编码控制的状态。
对话式文本生成适用于智能客服等任务型和闲聊型机器人等
非任务型人机交互场景,可分类为管道模式及端对端模式。
结构性的文本生成,首先通过注意力机制、多层感知器等系
统进行语句内容预选,对数值、时间等类型数据进行推理。
增强数据间的结构信息。其次通过Transformer等模式结合
上下文进行推导,生成最终文本。
图28:Transformer典型技术场景下的原理介绍如下所述
诚信 · 责任 · 亲和 · 专业 · 创新 28
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
GPT-1:借助预训练,进行无监督训练和有监督微调 02
资料来源:《 Improving Language Understanding by Generative Pre-Training 》论文,稀土掘金,国泰君安证券研究
GPT-1模型基于Transformer解除了顺序关联和依赖性的前提,采用生成式模型方式,重点考虑了从原始文本中有效学
习的能力,这对于减轻自然语言处理(NLP)中对监督学习的依赖至关重要
GPT(Generative Pre-training Transformer)于2018年6月由OpenAI首次提出。GPT模型考虑到在自然语言理解中有大量不同的任
务,尽管大量的未标记文本语料库非常丰富,但用于学习这些特定任务的标记数据却很少,这使得经过区分训练的模型很难充分执行。
同时,大多数深度学习方法需要大量手动标记的数据,这限制了它们在许多缺少注释资源的领域的适用性。
在考虑以上局限性的前提下,GPT论文中证明,通过对未标记文本的不同语料库进行语言模型的生成性预训练,然后对每个特定任务
进行区分性微调,可以实现这些任务上的巨大收益。和之前方法不同,GPT在微调期间使用任务感知输入转换,以实现有效的传输,
同时对模型架构的更改最小。
图29:GPT-1模型的核心手段是预训练(Pre-training)
无监督预训练
(Unsupervised pre-training)
不需要标注数据集,即大规
模自学阶段,在保证AI算力
充足的条件下,根据
attention机制进行自学
有监督微调
(Supervised fine-tunning)
微调,用来修正模型理解力。
即小规模指导过程,让AI在
小样本数据下进行调整
结合形成了一种使用无监督预训练和有监督微调相结合的语言理解任务的“半监督方法”
诚信 · 责任 · 亲和 · 专业 · 创新 29
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
GPT-1:模型更简化、计算加速,更适合自然语言生成任务(NLG) 02
资料来源:《 Improving Language Understanding by Generative Pre-Training 》论文,稀土掘金,国泰君安证券研究
GPT相比于Transformer等 模型进行了显著简化
相比于Transformer,GPT训练了一个12层仅decoder的解码器(原Transformer模型中包含Encoder和Decoder两部分)。
相比于Google的BERT(Bidirectional Encoder Representations from Transformers,双向编码生成Transformer), GPT仅采用上文
预测单词(BERT采用了基于上下文双向的预测手段)。
注:ChatGPT的表现更贴近人类意图,部分因为一开始GPT是基于上文的预测,这更贴近人类的话语模式,因为人类言语无法基于将来的话来做分析。
VS
图30:GPT-1模型相比于Transformer模型有了显著简化
Transformer架构 GPT-1架构 GPT用于对不同任务进行微调的输入转换的示意图
诚信 · 责任 · 亲和 · 专业 · 创新 30
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
GPT-2:采用多任务系统,基于GPT-1进行优化 02
资料来源:《 Language Models are Unsupervised Multitask Learners》论文,国泰君安证券研究
GPT-2在GPT-1的基础上进行诸多改进,实现执行任务多样性,开始学习在不需要明确监督的情况下执行数量惊人的任务
在GPT-2阶段,OpenAI去掉了GPT-1阶段的有监督微调(fine-tuning),成为无监督模型。
大模型GPT-2是一个参数的Transformer,在其相关论文中它在8个测试语言建模数据集中的7个数据集上实现了当时最先进的结果。
模型中,Transfomer堆叠至48层。GPT-2的数据集增加到8 million的网页、大小40GB的文本。
GPT-2的核心抓
手——采用多任
务模型(Multi-
task)
GPT-2要
实现的目
标
• GPT-2调整优化的目的是为了解决零
次学习问题( zero-shot)(注:
zero-shot问题,就是针对AI在面对
不认识的事物时,也能进行推理)
• 多任务模型的特点:跟传统ML需要专
门的标注数据集不同(从而训练出专
业AI),多任务模型不采用专门AI手
段,而是在海量数据喂养训练的基础
上,适配任何任务形式。
转向更通用的系统,使其可以执行许
多任务,最终无需为每个任务手动创
建和标记训练数据集。
机器学习系统通过使用大型数据集、高容
量模型和监督学习的组合,在训练任务方
面表现出色,然而这些系统较为脆弱,对
数据分布和任务规范的轻微变化非常敏感,
因而使得AI表现更像狭义专家,并非通才。
GPT-2要
解决和优
化的问题
图31:GPT-2通过调整原模型和采用多任务方式来让AI更贴近“通才” 水平
诚信 · 责任 · 亲和 · 专业 · 创新 31
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
GPT-2仍未解决应用中的诸多瓶颈 02
资料来源:《 Language Models are Few-Shot Learners》论文,国泰君安证券研究
GPT-2聚焦在无监督、zero-shot(零次学习)上,然而GPT-2训练结果也有不达预期之处,所存在的问题也亟待优化
在GPT-2阶段,尽管体系结构是任务无关的,但仍然需要任务特定的数据集和任务特定的微调:要在所需任务上实现强大的性能,通
常需要对特定于该任务的数千到数十万个示例的数据集进行微调。
存在的问题02:
• 预训练加微调范式中,可能在这种范式下实现的
泛化可能很差,因为该模型过于特定于训练分布,
并且在其之外无法很好地泛化。
• 微调模型在特定基准上的性能,即使名义上是人
类水平,也可能夸大基础任务的实际性能。
存在的问题03:
因为人类学习大多数语言任务不需要
大型受监督的数据集,当前NLP技术
在概念上具有一定的局限性。
存在的问题01:
从实用的角度来看,每一项新任务都需
要一个标记示例的大数据集,这限制了
语言模型的适用性;
对于其中的许多任务(从纠正语法到生
成抽象概念的示例,再到评论一个短篇
故事等等),很难收集一个大型的监督
训练数据集,特别是当每个新任务都必
须重复该过程时。
问题 02
问题01 问题03
GPT-2阶段
存在的问题
点
图32:GPT-2尚未解决诸多瓶颈问题
诚信 · 责任 · 亲和 · 专业 · 创新 32
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
GPT-3取得突破性进展,任务结果难以与人类作品区分开来 02
GPT-3对GPT-2追求无监督与零次学习的特征进行了改进
GPT-3利用了过滤前45TB的压缩文本,在诸多NLP数据集中实现了强大性能
GPT-3是一个具有1750亿个参数的自回归语言模型,比之前的任何非稀疏语言模型多10倍。对于所有任务(在few-shot设置下测试其
性能),GPT-3都是在没有任何梯度更新或微调的情况下应用的,仅通过与模型的文本交互来指定任务和few-shot演示。
GPT-3在许多NLP数据集上都有很强的性能(包括翻译、问题解答和完形填空任务),以及一些需要动态推理或领域适应的任务(如解
译单词、在句子中使用一个新单词或执行三位数算术)。 GPT-3可以生成新闻文章样本(已很难将其与人类撰写的文章区分开来)。
图34:GPT-3相关研究显示,few-shot(少量样本)的综合表
现是在无监督模式下最优的
资料来源:《 Language Models are Few-Shot Learners》,国泰君安证券研究
图33:GPT-3的模型参数在GPT-2的基础上增加110多倍
资料来源:《 Language Models are Few-Shot Learners》,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 33
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
InstructGPT模型在GPT-3基础上进一步强化 02
资料来源:《Training language models to follow instructions with human feedback》论文,稀土掘金,国泰君安证券研究
InstructGPT使用来自人类反馈的强化学习方案RLHF(reinforcement learning from human feedback),
通过对大语言模型进行微调,从而能够在参数减少的情况下,实现优于GPT-3的功能
InstructGPT提出的背景:使语言模型更大并不意味着它们能够更好地遵循用户的意图,例如大型语言模型可以生成不真实、有毒或对
用户毫无帮助的输出,即这些模型与其用户不一致。另外,GPT-3虽然选择了少样本学习(few-shot)和继续坚持了GPT-2的无监督学
习,但基于few-shot的效果,其稍逊于监督微调(fine-tuning)的方式。
基于以上背景,OpenAI在GPT-3基础上根据人类反馈的强化学习方案RHLF,训练出奖励模型(reward model)去训练学习模型(即:
用AI训练AI的思路)
InstructGPT的训练步骤为:对GPT-3监督微调——训练奖励模型(reward model)——增强学习优化SFT (第二、第三步可以迭代
循环多次)
图35:InstructGPT训练三步骤各自对应的数据集规模如下图所示(labeler指的是OpenAI的标注人员,
customer指GPT-3 API的用户)
诚信 · 责任 · 亲和 · 专业 · 创新 34
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT核心技术优势:提升了理解人类思维的准确性 02
资料来源:《Training language models to follow instructions with human feedback》论文,国泰君安证券研究
InstructGPT与ChatGPT属于相同代际的模型,ChatGPT只是在InstructGPT的基础上增加了Chat属性,且开放了公众测试
ChatGPT提升了理解人类思维的准确性的原因在于利用了基于人类反馈数据的系统进行模型训练
(注:根据官网介绍,GhatGPT也是基于InstructGPT构建,因而可以从InstructGPT来理解ChatGPT利用人类意图来增强模型效果)
图36:基于人类反馈强化的核心训练流程如下所示:
步骤1:搜集说明数据,训
练监督策略
步骤2:搜集比较数据,训
练一个奖励模型
步骤3:搜集说明数据,使
用增强学习优化模型
搜集说明数据(基于
prompt 训练方式的数
据集),训练监督策略
Labeler(标记者)揭
示期望的输出行为
这个数据用来联合监
督学习,对GPT-3进
行微调
对这个prompt训练的数据集
和若干模型的结果进行抽样
Labeler(标记者)从
最优到最差将输出
结果进行排序
这个数据用来训练反
馈模型
新的prompt从
数据集中抽样
借助模型生成输出
反馈模型为输出计算
一个反馈结果
反馈结果用来优化策
略
诚信 · 责任 · 亲和 · 专业 · 创新 35
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT得益于通用(基础)模型所构建 AI 系统的新范式 02
基础模型(Foundation Model)在广泛的应用中整合构建机器学习系统的方法,它为许多任务提供了强大的杠杆作用
基础模型是在深度神经网络和自我监督学习的基础上演化而来。基础模型基于广泛数据(通常使用大规模自我监督)训练的任何模型,可以适
应(例如微调)广泛的下游任务,目前例子包括BERT( Devlin et al.)、GPT-3(Brown et al. 2020)和CLIP(Radford et al. 2021)。
机器学习使学习算法同质化(例如,逻辑回归),深度学习使模型架构同质化(如卷积神经网络),而基础模型使模型本身同质化(比如,
GPT-3)。
资料来源:《On the Opportunities and Risks of Foundation Models 》论文,国泰君安证券研究
图37:人工智能的发展呈现同质化的过程
随着机器学习的引入,任务是如何执行的
(自动推断)从例子中显现出来
随着深度学习,
用于预测的高级
特征出现
有了基础模型,甚至出现了情境学习等高级
功能
诚信 · 责任 · 亲和 · 专业 · 创新 36
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT以基础模型为杠杆,可适用多类下游任务 02
ChatGPT采用了(InstructGPT)大规模预训练模型,在
自然语言理解和作品生成上取得极大性能提升
鉴于传统NLP技术的局限问题,基于大语言模型(LLM)有助于充分利
用海量无标注文本预训练,从而文本大模型在较小的数据集和零数据集
场景下可以有较好的理解和生成能力。基于大模型的无标准文本书收集,
ChatGPT得以在情感分析、信息钻取、理解阅读等文本场景中优势突
出。
随着训练模型数据量的增加,数据种类逐步丰富,模型规模以及参数量
的增加,会进一步促进模型语义理解能力以及抽象学习能力的极大提升,
实现ChatGPT的数据飞轮效应(用更多数据可以训练出更好的模型,
吸引更多用户,从而产生更多用户数据用于训练,形成良性循环)。
研究发现,每增加参数都带来了文本合成和/或下游NLP任务的改进,
有证据表明,日志丢失与许多下游任务密切相关,随着规模的增长,日
志丢失呈现平稳的改善趋势。 资料来源:《On the Opportunities and Risks of Foundation Models 》论文
图38:基础模型可以集中来自各种模态的所有数据的信息,
然后这一模型可以适用于广泛的下游任务
诚信 · 责任 · 亲和 · 专业 · 创新 37
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT大模型架构也是ML发展到第三阶段的必然产物 02
ML中的计算历史分为三个时代:前深度学习时代、深度学习时代和大规模时代,在大规模时代,训练高级ML系统的需
求快速增长
计算、数据和算法的进步是指导现代机器学习(ML)进步的三个基本因素。在2010年之前,训练计算的增长符合摩尔定律,大约每20个
月翻一番。自2010年代早期深度学习(Deep Learning)问世以来,训练计算的规模已经加快,大约每6个月翻一番。2015年末,随着公
司开发大规模ML模型,训练计算需求增加10至100倍,出现了一种新趋势——训练高级ML系统的需求快速增长。
2015-2016年左右,出现了大规模模型的新趋势。这一新趋势始于2015年末的AlphaGo,并持续至今( GPT-3于2020年出现)。
文章 研究结论
Amodei & Hernandez
(2018)
∼ month doubling time between
2012 and 2018
Sastry, G., (2019,
November).
∼2 year doubling period between
1959 and 2018
Lyzhov, A. (2021, April). >2 year doubling period between
2018 and 2020
表3:ML相关计算规模呈现持续快速攀升趋势
数据来源:《 compute trends across three eras of machine learning 》,
Jaime Sevilla
图40:2010年至2022年间102个里程碑ML系统的训练计算趋势如下所示
数据来源:《 compute trends across three eras of machine learning
》,Jaime Sevilla ,国泰君安证券研究
38 诚信 · 责任 · 亲和 · 专业 · 创新
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
03
行业进程:AIGC多模态交互功
能持续演化,奠定多场景商用基
础
诚信 · 责任 · 亲和 · 专业 · 创新 39
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC: 利用人工智能产生内容,提升生产力曲线 03
代码生成
文本问答
图像生成
视频生成
其他
AIGC
AIGC: Artificial Intelligence Generated Context,即可以利用人工智能技术自动产生内容,常见如代码生成,文本问
答等
ChatGPT 可与人类进行流畅的文本问答 Copilot 可自动编写代码
DALL·E2 由文字描述生成图像,如:
An astronaut riding a hourse as
a pencil drawing
资料来源:OpenAI官网,Copilot官网,Synthesia官网,国泰君安证券研究
Synthesia可将输入文本合成不
同述说风格的视频
图41:AIGC应用功能简单如下图所示
诚信 · 责任 · 亲和 · 专业 · 创新 40
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT已成为AIGC功能矩阵中的重要板块 03
ChatGPT是AIGC“数字内容智能编辑” 功能中的重
要组成部分,ChatGPT 模型的出现对于文字/语音
模态的 AIGC 应用具有重要意义
随着深度学习技术的快速突破以及数字内容的海量增长,
AIGC领域相关技术打破了预定义规则的局限性,使得快速
便捷且智慧地输出多模态的数字内容成为可能。
在技术创新以及多模态模型的持续突破下,AIGC根据功能
和对象的不同,按顺序可包括三种主要实用功能:数字内
容孪生、数字内容的智能编辑、数字内容的智能创作。这
三种功能相互嵌套与结合,可以让AIGC产品具备超越人类
的创作潜力。而ChatGPT正是AIGC的数字内容智能编辑这
一大功能领域中的重要组成部分。
资料来源:Sam Altman,机器翻译观察(公众号),国泰君安证券研究
模型托管、交易平台
面向C端和B端的应用
OpenAI GPT
DeepMind
Gopher
Google
GlaM
Azure
云计算平台
Google Cloud AWS Ali cloud
BERT EMLo
大型语言模型(LLM)
Hugging
Face
Replicat
Langu
ageX
中间层
Startup … …
图42:ChatGPT是AIGC的产品应用框架中大型语言模型
的重要板块
诚信 · 责任 · 亲和 · 专业 · 创新 41
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC相关技术包含了三大前沿能力 03
资料来源:中国信通院,国泰君安证券研究
数字内容孪生能力构建现实世界-虚拟世界映射
孪生能力包括智能增强与转译技术,其中增强技术弥补内容数字化过程中的信息损失,转译技术在理解基础上对内容进行多种形式呈现
数字编辑能力打通现实世界虚拟世界交互通道
编辑能力包括智能语义理解与属性控制,语义理解帮助实现数字内容各属性的分离解耦,属性控制则在理解基础上对属性进行精确修改、编辑与二次
生成,最终反馈于现实世界,形成孪生-反馈闭环
数字创作能力从数据理解走向数据创作
创作能力可分为基于模仿的创作与基于概念的创作,前者基于对某一类作品数据分布进行创作,而后者从海量数据中学习抽象概念,并基于概念创作
出现实世界不存在的内容
计算机视觉技术 自然语言处理技术 其他单模态技术 多模态技术
孪生能力 编辑能力 创作能力
智能增强 智能转译 语义理解 属性控制 基于模仿创作 基于概念创作
三维重构 音频修复 语音合成 视觉描述 摘要生成 数字人 智能作画 短片创作
图43:AIGC三大前沿技术能力架构如下图所示
诚信 · 责任 · 亲和 · 专业 · 创新 42
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
快速发展阶段
2010s-至今
IBM推出基于
HMM架构的
语音控制打字机
Tangora,可处
理约20000个单
词
80年代中期 1957年
莱杰伦·希勒
与
伦纳德·艾萨克森
利用计算机完成世
界首曲由计算机完
成的音乐
《依利亚克组曲
(Illiac Suite)》
1966年
约瑟夫·魏岑鲍姆
与
肯尼斯·科尔比
推出世界首款人
机可对话机器人
Eliza
2007年
世界首部完全由
人工智能创作的
小说
《1 The Road》
微软公开展
示全自动同
声传译系统,
可讲英文语
音自动转化
为中文语音
2012年 2014年
对抗生成网络
GAN被提出,
GAN网络极大
提高AI生成内
容的逼真度
2017年
微软人工智能“小
冰”创作世界首部
100%由人工智能创
作诗集
《阳光失了玻璃窗》
2018年
英伟达发布
StyleGAN,
其可以自动
生成人眼难
以分辨真假
的高质量图
片,
2019年
谷歌
DeepMind
提出DVD-
GAN是用AI
自动生成连
续视频
2021年
OpenAI提出
DALL·E2
输入文字即可
生成极高质量
且风格多样的
图片
早期萌芽阶段
20世纪50年代-90年代中期
受限于科技水平,AIGC仅限于小范围试验
沉淀积累阶段
1990s-2010s
由实验性向实用性转变 模型结构不断创新,AIGC内容多样性与逼真度不断提高
AIGC行业发展经历了三个主要时期 03
资料来源:中国通信研究院,国泰君安证券研究
AIGC发展经历了早期萌芽、沉淀积累和2014年之后的快速发展阶段
图44:AIGC经历了大致三个阶段的演化发展
诚信 · 责任 · 亲和 · 专业 · 创新 43
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
从分析式AI到生成式AI逐步演化,生成式AI赋予AIGC创新力 03
生成式AI起源于分析式AI,分析式AI发展过程中的技术积累为生成式AI的产生奠定基础
分析式AI其学习的知识局限于数据本身;生成式AI在总结归纳数据知识的基础上可生成数据中不存在的样本
最新生成式AI技术如GAN,Diffusion等,催生多款AIGC产品如:OpenAI系列、DALL·E2(Diffusion),Starry .(基于GAN)等
资料来源:OpenAI官网,Starry .官网,国泰君安证券研究
分析式AI
利用机器学习技术学习数据分布,
进行如分类,预测等任务。
发展过程中诞生了卷积神经网络,
残差深度网络,Transformer网络
结构等
推荐系统:挖掘用户与物品的关联关
系
人脸识别:根据输入人脸信息进行身
份判别
文字识别:根据文字图片输出文本
…
生成式AI
在学习归纳数据分布的基础上,学习数据
产生的模式,并创造数据中不存在的新样
本。
在分析式AI技术基础上诞生大型
Transformer网络,Diffusion等新模型
文字创作:通过提示文本生成完整文
案
图像生成:根据关键信息生成风格多
样图片,如博客配图,海报图片等
代码生成:根据上下文生成完整代码
…
数据学习 数据学习+新数据生成
图45:AIGC是在分析式AI的基础上,学习数据产生模式,实现新样本内容的创造
诚信 · 责任 · 亲和 · 专业 · 创新 44
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC:学习范式更新奠定基础,模型结构升级助力腾飞 03
深度变分自编码器 对抗生成网路 卷积神经网络模型
在视觉识别任务上表现
远超传统机器学习算法,
开启深度学习序幕
通过将隐特征建模为可采样的分布,
首次稳定地生成从未观测过的图像,
极大推动AI生成技术发展
通过生成器与判别起的不断博弈
学习,提高生成样本的清晰度与
逼真度,可以生成真假难辨的内
容
扩散模型
扩散模型在GAN基础上进一步提高
样本多样性与逼真度
Transformer结构
提高上下文建模能力,并行的结构加快训练
速度,使得构建超大规模模型成为可能
模型结构不断升级 学习范式更新
基于规则的机器
学习
基于预先定义的统计
模型或规则完成任务,
模型自身并不具有学
习能力
基于损失函数
与梯度下降
通过损失函数与梯
度下降更新模型参
数,模型自身可对
数据内容进行学习
人工智能技术推动AIGC行业不断发展,其中学习范式的更新赋予AI模型主动学习能力,模型结构升级提升AI模型学习、归
纳与创新能力
资料来源:中国通信研究院,国泰君安证券研究
图46:AI模型的升级迭代为AIGC性能跨越式发展奠定基础
诚信 · 责任 · 亲和 · 专业 · 创新 45
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC产业链涵盖了从硬件到多类终端应用的广泛领域 03
资料来源:机器翻译观察(微信公众号),国泰君安证券研究
AIGC关联产业可分为应用层、模型层、云计算平台与计
算硬件层
计算硬件层结合云计算平台为AIGC提供机器学习训练与推理算力,其
中GPU与TPU为硬件核心,主要参与厂商包括英伟达(GPU)与谷歌
(TPU);云平台参与厂商则包含AWS,GCP,Azure以及
Coreweave;计算硬件层中云计算平台厂商分布稳定,竞争出现于模型
层面与应用层面。
模型层面,闭源基础模型提供商如OpenAI通过API向用户提供服务,
而开源基础模型则通过在托管平台如Hugging Face、Replica公开模
型权重。模型训练其高计算力需求推动了模型层厂商与云计算厂商建
立合作关系(如 OpenAI+Azure,GCP+DeepMind。模型层面闭源
模型较为普遍,各厂商依靠模型建立技术壁垒
在应用层面,MidJourney,Runway等自主研发、持有模型;而
Jasper,Github Copilot则通过调用闭源模型商提供的API或采用托管
平台共享的模型。
计算硬件层
提供模型训练与推理的加速芯片
如:GPU(英伟达),TPU(谷歌)
闭源基础模型
通过API开放大规模
预训练模型
如:Open AI的GPT-
3
云计算平台
为开发者提供云计算服务
如:AWS,GCP,Azure,Coreweave
模型托管平台
储存与分享模型
如:Hugging Face,
Replica
开源基础模型
开放训练完成的模型权重
如:Stable Diffusion
(stability)
应用
面向B2B、B2C应用,自身不持有模型
如:Jasper,Github Copilot
端到端应用
自身持有模型
如:Midjourney,
Runway
模型层
应用层
图47:AIGC市场框架可由基础设施层、模型层、托管平
台以及应用层来进行划分
诚信 · 责任 · 亲和 · 专业 · 创新 46
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC产业链上下游玩家百花齐放 03
资料来源:中国信通院,国泰君安证券研究
数据供给方
(业务数据联通、素材数据收集等,如第三方营
销公司、版权图库方)
数据拆分及标注
创作者生态
生物资产及内容素材提供
底层配合工具
渲染引擎、混音设备等
相关算法/模型研究机构 相关开源算法 嵌入/结合能力的业务平台/业务生态
上
游
下
游
各类内容创作及分发平台
(基于AIGC激发PGC及UGC活力
第三方分发渠道
内容终端生产厂商
新闻媒体机构、金融机构
消费品厂商
AIGC内容检测
第三方内容服务机构
如MCN、公关公司等
中
游
内容设计
视觉设计、文案设计、结构设计等
内容制工具
音频/视频编辑工具、新闻采编、游戏制作
周边售卖
NFT个性化产品等
运营增效
智能客服、简单决策等
自动实时交互 数据梳理
内外部数据分享及更新、数据分析及算法训练
个性化市场营销
广告植入、品牌虚拟形象打造、各模态营销内容生成
彩云小梦 赅推智能 智搜科技
秘塔科技-秘塔写作猫
香侬慧语-火龙果写作
黑狐科技-写作狐
文字
诗云科技
图像
视频
音频
灵动音科技
游戏
AIGC虚拟人
其他机构 垂直赛道初创公司 综合赛道初创公
司
AIGC上游主要包括数据供给方、算法机构、创作者生态以及底层配合工具等,中游主要是文字、图像、音频和视频处理厂商,其中
玩家众多;下游主要是各类内容创作及分发平台以及内容服务机构等。
图48:AIGC产业链上下游参与者分类如下图所示
诚信 · 责任 · 亲和 · 专业 · 创新 47
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC厂商之间的竞争在于模型层面竞争 03
资料来源:各公司官网,腾讯研究院,量子位,国泰君安证券研究
追根溯源,AIGC依赖于底层机器学习模型产生内容,因此模型为AIGC行业厂商真正竞争力所在
文本生成产品多依赖GPT系列模型,自己训练的模型在图像/视频模态产品中较为普遍(图像/视频模态产品通常拥有自己训练的模型,而不
是如文本模态调用OpenAI提供的模型服务)
比较而言,OpenAI依靠模型建立先发竞争优势,技术到产品转化相对亮眼
Open AI Stability AI Midjourney Meta
• GPT系列模型
• ChatGPT,
• CLIP
• DALL·E 2
• Codex
• …
Midjourney Stable Diffusion
Make-a-scene
Make-a-video
模型
基于GPT-3:
Snazzy AI,Copysmith,
基于Codex:
Github Copliot
基于DALL·E 2:
DALL·E 2
Dreamstudio
开源算法Stable
Diffusion应用于DALL·E
2, Diffusion等其他公司
模型中
—— —— 产品
图49:AIGC模型产品之间存在激烈竞争
诚信 · 责任 · 亲和 · 专业 · 创新 48
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC取长补短,有望成为主流内容生产模式 03
AIGC所属内容生产生态的发展经历了专家生产内容(PGC)、用户生成内容(UGC)、AI辅助生产内容、AI生产内容
(AIGC)四个阶段,目前处于一、二阶段为主,第三阶段为辅的境况
AIGC克服PGC与UGC存在的 质量、产量 无法兼具的缺点,其有望成为未来主流的内容生产模式
资料来源:,中国信通院,国泰君安证券研究
PGC UGC
AIGC
辅助
由专业团队生产,内容质量高
✗ 内容生产门槛高,垄断严重
✗ 生产周期长,难以满足大规模
生产需求
电视,电影,游戏等
创作工具下放,用户可自行生产
内容,创作门槛、成本降低
内容生产参与者众多,创作生态
繁荣,个性化程度高
✗ 创作者参差不齐,内容质量不高
短视频,社交媒体文章,播客等
AI技术学习的专业知识辅助内
容生产环节,提高内容质量
AI技术实现自动化内容生产,
减少创作耗时,提高内容生产
规模天花板
✗ 人在关键环节依然需要输入指
令,没有做到完全自主性
AI辅助文字创作,图片创作等
AIGC
实现完全自主性
AI自主文字创作,图片创作等
图50:AIGC生态内容生产模式理论上会经历四个发展阶段
诚信 · 责任 · 亲和 · 专业 · 创新 49
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC生成技术可按模态进行分类 03
AIGC
视频
视频画质增强
视频内容创作
视频风格迁移
…
文本
文本创作
代码生成
对话问答
…
图像
图片编辑
图片生成
3D图像生成
…
音频
文本合成语音
语音克隆
音乐生成
…
跨模态
文字合成图片
文字合成视频
…
AIGC根据其内容模态不同可分为文本、视频、图像,音频与跨模态生成
资料来源:各公司官网,中国通信研究院,国泰君安证券研究
图51:AIGC应用功能简单如下图所示
诚信 · 责任 · 亲和 · 专业 · 创新 50
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC不同模态对应着各种生成技术及应用场景 03
AIGC不同模态对应的技术应用场景也有着各自的细分品类
资料来源:量子位智库,国泰君安证券研究
图52:AIGC各技术应用场景对应的特征及
细分品类如下图所示 文本生成
分为非交互式文本和交互式文本
音频生成
包括语音克隆、文本生成特定语
音,音乐生成
视频生成
视频属性编辑,视频自动剪辑,视
频部分编辑
跨模态生成
文字生成图像,文字生成视频,图
像/视频到文本
图像生成
分为图像编辑工具和图像自主生
成工具
策略生成
AI基于特定问题和场景, 自主提出解决方
案的过程。 此类技术在游戏、 自动驾驶、
机器人控制等领域有极高
应用价值。
GameAl
游戏本身为AI提供了最佳的研发
场景, 有大量数据和贴近实
际场景
虚拟人生成
指存在于非物理世界(如图片、 视频、
直播、 一体服务机、 VR)中, 并具有
多重人类特征的综合产物。
AIGC各
模态应用
领域
诚信 · 责任 · 亲和 · 专业 · 创新 51
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC文本生成技术场景可分为交互式和非交互式 03
结构化写作
基于结构化数据,在特定场景类型下生成结构化文本内容,如新闻,财报等简讯写作。
现有产品如:WordSmith,AX Semantics等
创作型(非结构化)写作
相比结构化的文本,创作型文本具有更高的开放度与自由度,需要一定的创意与个性
化,如社交媒体,营销文案,博客文案等。现有产品如:WriteSonic、Retresco等
闲聊机器人
在一个上下文中进行文本交互,如客服问答,机器人聊天等。现有产品如:小冰岛等
非交互式文本
交互式文本
文本交互游戏
使用AI技术生成游戏内容,现有产品如AI Dungeon等
文本生成
AIGC非交互式文本生成技术中,结构化写作其形式相对固定,生成难度较小,商业化应用较为广泛;而创作型写作开放性
较大,在长文本生成中难度较大,仍需技术进一步发展
随着通信互联网技术发展,线上社交需求快速增长,如闲聊机器人等交互式文本产品将迎来快速发展
资料来源:量子位智库,国泰君安证券研究
图53:文本内容生产领域相关细分特征如下架构图所述
诚信 · 责任 · 亲和 · 专业 · 创新 52
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
图54:文本生成技术商业化落地有比较优势
AIGC文本生成技术商业化落地有望优势先发 03
文本领域预训练大模型技术成熟,文本领域细分垂类较多,产品数量居首位,模型数量发展超过其他模态技术
数字内容中,文字模态数据远大于图片/视频/音频等,发展前景相对较大
基于GPT-3的文字生成功能已嵌入如Writesonic、、Copysmith等软件中,商业化前景相对清晰
资料来源:量子位智库,国泰君安证券研究
文本易于获得
相较于其他模态数据,文本数据易于获得且数量
庞大,满足大规模预训练模型对数据量的需求
文本表达信息更为高效
相比图片,语音,视频等模态,文本信息在存储、
处理、传输时占用资源少,而信息量不逊色于图
片等。在这种优势文本将成为人机交互等领域的
首选
大模型趋势下文本预训练实现难度小
文本数据其离散的性质使得相同模型架构下大模
型训练消耗资源低与图片/视频
BERT
GPT
UniLM
ELMO
word2vec
XLNet
T5
ALBE
RT ALBERT
BART
图55:AIGC文本模态技术(包括文本与代码)商业
化领跑视频/图像模态技术
资料来源:红杉,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 53
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC图像生成技术随着模型结构的优化而明显提升 03
图像编辑工具
更改或复刻图片风格,或根据提示更改图片的其中一部分或在图片中添加新的构成元素等
现有产品如:NightCafe、Metaphysics等
创意图像生成
自由或按照一定风格产生图像
现有产品如:Starry .等
图像自主生成 图像生成
2D图像生成3D模型
输入2D图像,由AI生成图像中物体的3D模型
现有产品如:英伟达GANverse3D
功能性图像生成
按照指定要求产生海报,logo等有一定格式限制的图像
现有产品如: DeepDreamGenerator等
模型结构不断进化提高了AIGC生产图像的多样性,但要求较高的功能实现还有待于技术的进一步提升
“图像编辑” 难度低于“图像生成” 与“2D-3D” 转换,目前已存在多款产品支持“图像编辑” ,而对于“图像生成”任务,由于图片相
较包含更多元素,其生成效果仍存在不稳定性,对于要求较高的功能类图像生成仍需要技术上的提升。
变分自编码
器
对抗生成网
络
Transformer
网络
扩散模型
图57:模型结构进化不断提高了图像生成质
量
图56:图像生成技术具体实现包括图像编辑、2D-3D转换以及自主生成
资料来源:量子位智库,国泰君安证券研究
资料来源:量子位智库,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 54
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC音频生成技术正朝更富情感等人类特征演化 03
音频生成细
分技术
文本到语音任务已比较成熟,语音质量已达到自然的标准,未来将朝更富情感、富韵律的语音合成以及小样本语音学习方
向发展
音乐生成任务中仍需解决音乐数据难以标注的问题,数据标注其颗粒度大小影响音乐生成任务的可控性。若可控性得以解决,则可指定风格、
情绪等因素的音乐生成任务有希望在影视、游戏等场景下的到大量应用。
资料来源:量子位智库,国泰君安证券研究
文本到语
音合成
音乐生成 音乐
生成
输入文字,输出特定说话人的语音,主要应用于机器人,语音播报等任务
现有产品/厂商如:科大讯飞、思必驰、ReadSpeaker等
语音克隆
语音克隆 给定一段目标语音,将输入的语音或文字转换为目标语音中说话人的语音,其
可视为指定说话人的语音合成任务,主要应用于智能配音等场景
现有产品/厂商如:ResembleAI、Replica等
根据开头旋律或文字描述等利用AI自动生成特定乐曲
现有产品/厂商如:AmperMusic、IBM Watson Music等
文本到语音合成
图58:AIGC音频细分生成技术特点如下图
所示
诚信 · 责任 · 亲和 · 专业 · 创新 55
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
视频生成 为AIGC应用生态中的高潜力场景 03
资料来源:量子位智库,国泰君安证券研究
视频生成本质上与图片生成类似,通过对视频进行帧数级别的切割,实现对每一帧的处理
视频生成过程包括三个阶段:数据的提取、训练和转换,当前技术正在着重提升视频修改精准度和实时性两个维度。鉴于视频本身的文
本、图像和音频的综合属性,视频生成也是跨模态生成领域的重要应用场景。
图59:视频生成技术具体包括视频属性编辑、 视频自动剪辑、 视频部分编辑
视频属性编辑
视频画质修复,添加特定内容,视频美颜等
其产品如:Runway ML、Wisecut等
视频自动剪辑
利用AI技术检测视频片段,生成预告片,
宣传视频等
其产品如:IBM Watson
视频内容动态编辑
利用AI技术对视频中的内容进行动态编辑,
更换演员面部等
其产品如:Faceswap,Deepfakes等
诚信 · 责任 · 亲和 · 专业 · 创新 56
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
跨模态生成技术是真正实现认知和决策智能的转折点 03
资料来源:量子位智库, Nova AI官网,国泰君安证券研究
现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种
模态能力之间打通,例如文字-图像、文字-视频等跨模态生成能力
大型预训练模型的发展使得跨模态逐步成熟,“文本-图像” 生成正在快速落地,“文字-视频”的实验效果也已较为理想(视频时长、 清
晰程度、 逻辑等还有较大提升空间)。
图60:跨模态生成 领域当前的主要功能类型如下所示
文字生成图像
根据文字描述生成创意图像
其产品如:Open AI的DALL·E2
等
文字生成视频(拼接图
片素材生成视频)
其产品如:Lumen5等
文字生成视频(以端到
端的方式生成视频)
其产品如:CogView2等
图片/视频生成文字
用于视觉问答系统,自动字幕
等
其产品如:Noval AI等
诚信 · 责任 · 亲和 · 专业 · 创新 57
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC改变数字内容生产模式 03
电商
传媒
其他 娱乐
影视
新闻采编
新闻稿写作
视频剪辑
新闻传播
商品虚拟化
虚拟主播
购物会场虚拟化
教育
金融
医疗
工业
趣味音视频合成
建立虚拟偶像
开发C端数字化身
剧本创作
拓展角色与创作空间
助力影片剪辑
AIGC
AIGC作为新的内容生产模式,其具有内容多样,可控性强与生产效率高的优点,符合传媒,电商,影视,娱乐等行业对内
容数字化程度高、内容多样以及内容更新快的要求,AIGC在以上行业逐渐替代传统内容生产模式的趋势十分显著
资料来源:中国信通院,国泰君安证券研究
图61:AIGC对各大行业的影响维度如下图所示
诚信 · 责任 · 亲和 · 专业 · 创新 58
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC渗透传媒领域各个环节 03
新闻采编
新闻稿件写作
视频剪辑
新闻播报
AIGC技术逐渐渗透传媒领域包括采集、编辑、传播等环节,有助于加快内容生产效率,提高内容质量,扩
宽内容影响力
资料来源:中国信通院,国泰君安证券研究
语音转换文字:自动化
录音整理,保证新闻时
效性,减少机械性重复
劳动
结构性文本写作:基于
算法纂写新闻稿,加速
内容生产,提高内容准
确度
视频自动剪辑:从素材
中快速生成视频,减少
人工剪辑劳动量,加快
视频发布
跨模态视频生成文字:
自动生成与视频同步的
字幕
视频属性编辑:视频增
强工具提高视频清晰度,
带给观众更好体验
跨模态视频合成:从新
闻稿合成主播播报视频,
提高了播报效率与准确
度,带给观众不一样的
播报体验
图62:AIGC对传媒领域的赋能如下图所述
诚信 · 责任 · 亲和 · 专业 · 创新 59
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC化2D为3D,拓展电商展示维度 03
商品
3D模型
3D
虚拟会场
虚拟主播
• 基于不同角度的商品图像,借助
视觉生成算法生成商品3D模型,
720° 全方位展示商品,减少消
费者选品与沟通时间
• 3D商品模型提供线上虚拟“试、
穿、看、戴”,高度还原商品真
实效果,减小订单退换货率
• 通过AI技术打造虚拟主播介绍商品信息
并提供客服服务,可实现直播24小时
不间断,为客户提供更灵活的观看时间
与更方便的购物服务
• 虚拟主播人设可控性强,因主播自身原
因导致品牌受损的几率小
• 虚拟主播易于拉近品牌与年轻消费者的
距离,同时构建元宇宙潮流下的品牌形
象,为未来多元化的虚拟世界打下基础
• 通过从2D图像构建3D场景的AI
技术,降低商家搭建3D线上购
物空间的门槛与成本。商家可向
消费者提供线上沉浸式购物体验,
可降低门店扩张成本,扩大品牌
知名度
AIGC 2D图像生成3D模型技术为传统电商提供多维度的展示空间
虚拟合成主播为客户提供更及时、可靠、亲和的服务体验
资料来源:中国信通院,国泰君安证券研究
图63:AIGC对有助于为电商行业降本增效
诚信 · 责任 · 亲和 · 专业 · 创新 60
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC打破传统娱乐体验边界 03
趣味图像
或音视频
合成
打造虚拟
偶像,释
放IP价值
AIGC
+娱乐
开发C端用户
数字化身
为用户提供趣味性AIGC应用,
在图像视频方面如AI换脸,AI
合影;音频方面如语音变声器
等
1. 通过粉丝创作词曲,真人提
供声源,AI语音软件合成歌
曲的方式,实现偶像粉丝共
创,增加粉丝黏性
2. AI合成音视频及AI 3D建模
等技术支撑虚拟偶像在多样
场景下进行内容变现
通过用户的一张图片,可自动
化生成具有“我”个人特色的
虚拟形象,可在未来作为用户
虚拟世界中的数字化身
AIGC技术打破物理边界,使粉丝可与偶像亲密互动,并形成新的发展点
AIGC为用户打开虚拟世界入口,通过趣味方式体验虚拟世界
图64:AIGC在娱乐领域也有诸多赋能点,有助于进一步提升产业空间
资料来源:中国信通院,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 61
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC拓宽影视行业创意边际 03
助力剧本创作
拍摄中
拓展角色和场景创作空间
赋能视频剪辑,后期制
作
利用AI技术分析学习海量
剧本数据,并根据预设风
格快速产生剧本,创作者
再进行筛选与二次加工,
可极大缩短剧本创作周期,
并激发创作者创造力,激
发创作灵感
1. 减小演员自身局限对影视作品的
影响,如通过AI“数字复活”已
故演员或替换劣迹艺人;减小演
员自身与角色的年龄差距并辅助
拍摄高难度动作拍摄
2. 通过AI合成虚拟场景,将无法实
拍的场景呈现出来,拓宽作品想
象力边界,给观众带来更好作品
体验
1. 利用AI技术可实现影
视图像修复,还原,
提升清晰度等任务,
提升画面质量
2. 快速生成电影预告片
3. 利用AI技术加速2D
影视内容到3D的转
制速度
资料来源:中国信通院,国泰君安证券研究
AIGC技术以其内容多样性为作品内容带来更多灵感
AIGC技术帮助拍摄突破物理限制,还原剧本效果,提高作品质量
图65:AIGC在剧本创作、拍摄过程以及后期制作方面均有助益
诚信 · 责任 · 亲和 · 专业 · 创新 62
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
AIGC促进各行业转型升级 03
教 育
赋予教育材料
新活力
金 融
实现降本增效
医 疗
赋能诊疗全过
程
工 业
提升产业效率
与价值
利用AI技术使抽象,平面的
课本具体化,立体化,使知
识传播更生动,趣味
实现金融资讯、产品介绍视
频内容的自动化生产,提升
机构运营效率
塑造虚拟数字客服,完善金
融服务
AIGC将工程设计中重复、耗时、低层
次的任务自动化,缩短整体设计时间
将基于物理环境的数字几何图形快速转
化为实时3D模型,高效创建工厂,设
备等数字孪生系统
改善医学图像质量,录入电子病历,
减轻医生工作压力
辅助病人康复治疗,如使用语音合
成技术为失语者合成语言音频等
资料来源:中国信通院,国泰君安证券研究
AIGC技术在各行业数字内容相关领域均有发挥空间
图66:AIGC在教育、金融、工业、医疗领域的应用优势如下图所示
63 诚信 · 责任 · 亲和 · 专业 · 创新
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
04
商业化:多领域多功能应用密集
落地,ChatGPT商用前景可期
诚信 · 责任 · 亲和 · 专业 · 创新 64
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT试点订阅计划——ChatGPT Plus发布,商业化序幕已经拉开 04
2023年2月2日,OpenAI发布ChatGPT试点订阅计划——ChatGPT Plus,每月20美元
ChatGPT Plus订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权
资料来源:OpenAI官网,国泰君安证券研究
图67:ChatGPT Plus处于OpenAI官网的醒目位置,凸显商业化倾向 图68:ChatGPT Plus订阅者可获得比免费版本更优质的服务
资料来源:OpenAI官网,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 65
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT+传媒:实现智能新闻写作,提升新闻的时效性 04
ChatGPT可以帮助新闻媒体工作者智能生成报道,将部分劳动性的采编工作自动化,更快、更准、更智能地生成内容
资料来源:中国信息通信研究院,国泰君安证券研究
2014年3月,美国洛杉矶时报网站
的机器人记者Quakebot,在洛杉
矶地震后仅3分钟,就写出相关信
息并进行发布
美联社使用的智能写稿平台
Wordsmith 可 以 每 秒 写 出
2000篇报道
中国地震网的写稿机器人在九寨
沟地震发生后7秒内就完成了相
关信息的编发
第一财经“DT稿王”一分钟可
写出1680字
图69:过往成功案例众多,ChatGPT在传媒领域的商业化大有可为
诚信 · 责任 · 亲和 · 专业 · 创新 66
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT+影视:拓宽创作素材,提升作品质量 04
ChatGPT可以根据大众的兴趣身定制影视内容,从而更有可能吸引大众的注意力,获得更好的收视率、票房和口碑
ChatGPT可以为剧本创作提供新思路,创作者可根据ChatGPT的生成内容再进行筛选和二次加工,从而激发创作者的灵感,开拓创作思路,缩
短创作周期。
ChatGPT 有着降本增效的优势,可以有效帮助影视制作团队降低在内容创作上的成本,提高内容创作的效率,在更短的时间内
制作出更高质量的影视内容
2016年,纽约大学利用人工
智能编写剧本《Sunspring》,
经拍摄制作后入围伦敦科幻电
影48小时前十强
2020年,美国查普曼大
学的学生利用OpenAI
的GPT-3模型创作剧本
并制作短片《律师》
国内海马轻帆科技公司推出的“小
说转剧本”智能写作功能,服务了
包括《你好,李焕英》《流浪地球》
等爆款作品在内的剧集剧本30000
多集、电影/网络电影剧本8000多
部、网络小说超过500万部
图70:内容生成在影视领域运用广泛,ChatGPT在影视领域的商业化大有可
为
资料来源:中国信息通信研究院,国泰君安证券研究
案例1
案例2 案例3
诚信 · 责任 · 亲和 · 专业 · 创新 67
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT+营销:打造虚拟客服,赋能产品销售 04
ChatGPT 可以打造虚拟客服,助力产品营销
全天候
营销
01
ChatGPT虚拟客服为客户提供24小时不间断的产品推荐介绍以及在线服
务能力,同时降低了商户的营销成本,促进营销业绩快速增长
02
ChatGPT虚拟客服比人工客服更稳定可靠,在人工客服有
限并且素质不齐的情况下,虚拟客服展现的品牌形象和服
务态度等由商户掌控,比人工客服的可控性、安全性更强
03
塑造品
牌形象
ChatGPT虚拟客服能快速了解客户需求和痛点,拉近商户
与消费人群的距离,塑造跟随科技潮流、年轻化的品牌形
象
稳定可靠
图71:利用ChatGPT打造的虚拟客服,具备无可比拟的营销优势
资料来源:国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 68
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT+娱乐:人机互动加强,激发用户参与热情 04
ChatGPT可以成为线上的实时聊天对象,增加互动的趣味性和娱乐性
图72:ChatGPT的对话具备趣味性和娱乐性
资料来源:ChatGPT,国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 69
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
ChatGPT+其他:促进数实共生,助力产业升级 04
ChatGPT+教育:赋予教育教材新活力,让教育方式更个性化、更智能
ChatGPT+金融:帮助金融机构降本增效,让金融服务更有温度
ChatGPT+医疗:赋能医疗机构诊疗全过程
ChatGPT给教育工作者提供全新的教学工具,学生可以通过自主提问的方式快速查缺补漏,让每个学生得到更个性化、更
智能的教育
ChatGPT+教育
ChatGPT+金融
ChatGPT+医疗
一方面,金融机构可以通过ChatGPT实现金融资讯、金融产品介绍内容的自动化生产,提升金融机构内容生产的效率;
另一方面,可以通过ChatGPT塑造虚拟理财顾问,让金融服务更有温度
ChatGPT可以快速了解患者的病情并给出较合理的及时反馈,通过人性化的方式第一时间抚慰患者,从而舒缓患者的情绪,
加速其康复;同时,让医者有更多的时间和精力集中在关键患者的关键治疗环节
图73:ChatGPT在教育、金融和医疗产业中也大有用武之地
资料来源:国泰君安证券研究
诚信 · 责任 · 亲和 · 专业 · 创新 70
ChatGPT——生成式AI迎来拐点,商用落地前景可期
请参阅附注免责声明
短期来看,ChatGPT的快速推广阻力仍存 04
短期来看,ChatGPT仍存在诸多不足,亟待解决的问题主要有两方面:合规性问题和技术性问题
资料来源:零壹财经,第一财经,国泰君安证券研究
SUCCESS
技术性问题
合规性问题
1. ChatGPT产生的答复是否产生相应的知识产权?
2. ChatGPT进行数据挖掘和训练的过程是否需要获得相应的知识产权授权?
3. ChatGPT是基于统计的语言模型,这一机制导致回答偏差会进而导致虚假信息
传播的法律风险,如何降低其虚假信息传播风险?
1. ChatGPT的回答可能过时,因为其数据库内容只到2021年,对于涉及2022年之后,或
者在2022年有变动的问题无能为力
2. ChatGPT在专业较强的领域无法保证正确率,即使在鸡兔同笼此类初级问题中仍然存在
错误,并且英文回答和中文回答存在明显差异化
3. ChatGPT对于不熟悉的问题会强行给出一定的答案,即使答案明显错误,依然会坚持下
去,直到明确戳破其掩饰的内容,会立马道歉,但本质上会在不熟悉的领域造成误导
图74:合规性问题和技术性问题是当前ChatGPT主要面临的挑战
本公司具有中国证监会核准的证券投资咨询业务资格
分析师声明
作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正
,结论不受任何第三方的授意或影响,特此声明。
免责声明
本报告仅供国泰君安证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何
广告。
本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投
资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发
出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。
本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资
者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。
本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或
期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。
市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。
本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰君安证券研究”,且不得对本
报告进行任何有悖原意的引用、删节和修改。
若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构
成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。
免责声明
北京
地址:北京市西城区金融大街甲9
邮编:200032
电话:(010)83939888
电话:(021)38676666
上海
深圳
地址:深圳市福田区益田路6009号
邮编:518026
电话:(0755)23976888
国泰君安证券研究所
E-mail:gtjaresearch@
地址:上海市静安区新闸路669号
邮编:200041