中国金融四十人研究院课题报告
明珠湾智能金融发展报告
(2022)
课题类型: 中国金融四十人研究院课题
2023 年 12 月
课题组
1
课题负责人: 肖钢
课题组成员:
1. 技术篇:李鸣、王晨辉、廉贵清、刘冕宸、彭涛
2. 应用篇:吕仲涛、金海旻、赵小建、雷赛龄、胡
国强、金昕、张佳颖
3. 探索篇:高峰、陈志明、祝世虎、赵辉、刘越
4. 监管篇:尹优平、汪天都、钟瑞仪、杨守富
5. 政策篇:石锦建、邵宇
1 本课题人员以个人名义参加此项研究,所表达观点不代表所在机构观点。
目 录
序言
第一部分:技术篇
一、人工智能技术和产业发展状况
(一)学术进展 ..................................................................................7
(二)主要技术发展情况 ................................................................11
(三)产业进展情况 ........................................................................15
二、通用语言模型技术分析
(一)发展历程 ................................................................................19
(二)发展情况 ................................................................................21
(三)发展趋势 ................................................................................24
(四)对金融业带来的影响 ............................................................26
第二部分:应用篇
一、金融智能应用概述
(一)应用规模稳步增长 ................................................................32
(二)应用质效不断提升 ................................................................33
(三)应用成效显著增强 ................................................................35
二、银行业智能应用
(一)产品创新 ................................................................................37
(二)客服营销 ................................................................................41
(三)运营管理 ................................................................................43
(四)风控合规 ................................................................................46
三、保险业智能应用
(一)产品创新 ................................................................................51
(二)客服营销 ................................................................................54
(三)运营管理 ................................................................................56
(四)风控合规 ................................................................................58
四、证券基金业智能应用
(一)产品创新 ................................................................................59
(二)客服营销 ................................................................................60
(三)运营管理 ................................................................................65
(四)风控合规 ................................................................................66
五、总结和展望
第三部分:探索篇
一、生成式 AI(AIGC)对金融行业的影响
(一)决策式AI 与生成式AI...........................................................71
(二)AIGC 的技术特征、要素与发展.........................................72
(三)AIGC 的成功应用-----ChatGPT............................................83
(四)AIGC 对金融行业的影响......................................................96
(五)AIGC 发展的建议与举措....................................................109
二、元宇宙与金融
(一)金融元宇宙的内涵 ..............................................................114
(二)国内外金融业的元宇宙应用 ..............................................119
(三)国内金融元宇宙建设面临的技术难点 ..............................125
(四)国内金融元宇宙建设所面临技术难点的解决对策 ..........129
第四部分:监管篇
一、智能金融监管的基本原理
(一)智能金融的伦理标准考量 ..................................................137
(二)智能金融技术风险与系统安全 ..........................................139
(三)金融数据安全与个人信息保护 ..........................................140
(四)市场行为与金融消费者权益保护 ......................................142
(五)智能技术所引起的金融风险 ..............................................143
二、国内关于智能金融的治理政策与监管行动
(一)国内治理政策与监管行动 ..................................................147
(二)小结 ......................................................................................150
三、国外关于智能金融的治理政策与监管行动
(一)国外治理政策与监管行动 ..................................................151
(二)小结 ......................................................................................159
第五部分:政策篇
一、关于智能金融发展的建议
(一)加强技术安全研究,鼓励业务安全实践 ..........................162
(二)积极利用智能技术,推动金融服务创新 ..........................162
(三)强化智能金融治理,筑牢科技道德和社会责任 ..............162
(四)提升数据开放与共享水平,完善智能金融创新生态.......163
(五)加强人才培养与引进,夯实智能金融发展基础 ..............164
二、关于智能金融监管的建议
(一)完善对话机制,不断凝聚智能金融监管共识 ..................164
(二)制定智能金融监管规则,厘清各主体权责利边界...........164
(三)发展监管科技,运用智能监管应对新问题新挑战...........165
(四)加强模型治理,着力破解智能金融监管痛点难点...........165
(五)倡导行业自律,发挥参谋助手作用 ..................................166
(六)加强金融教育,着力推动消费者金融素养体系建设.......166
附录:大事记
近年来,人工智能技术发展进入了第三次发展浪潮,新算法、新
应用不断涌现,人工智能成为引领新一轮科技革命和产业变革的战略性
技术。我国把发展人工智能技术作为一项重要的国家战略,发布和实
施了《新一代人工智能发展规划》,提出了建设世界主要人工智能创
新中心的发展目标,有效推动人工智能技术快速成熟、产业快速发展
和在经济社会各领域广泛应用。
人工智能技术具有溢出带动性很强的“头雁”效应,金融行业与人
工智能具有天然的耦合性,是人工智能技术应用最重要的领域之一。通
过发挥我国海量数据和巨大市场应用规模优势,坚持需求导向发展路径,
加快金融行业人工智能平台建设,推动技术、产品、应用和服务全方位
创新,帮助金融机构提高决策效率和产品质量,更好地满足客户需求。
智能金融是指人工智能技术与金融业深度融合的新业态,是用机
器替代和超越人类部分经营管理经验与能力的金融模式变革。人工智
能有望引领我国金融科技,为未来我国金融业发展提供无限可能。
要深入理解智能金融,首先需要比较分析三个相关概念:互联网金
融、金融科技、智慧金融。互联网金融,是指传统金融机构与互联网企
业利用互联网技术和信息通信技术实现资金融通、支付、投资和信息中
介服务的新型金融业务模式;金融科技,指通过利用各类科技手段创新
金融产品和服务,提升效率并有效降低运营成本。智慧金融, 通过物联网、
金融云等现代化信息技术的支撑,使金融行业在业务流
1
程、业务拓展以及服务模式等方面更加自动化、精细化。
相比互联网金融、金融科技、智慧金融,智能金融更具革命性的优
势在于,它能对金融生产效率带来更大提升,对金融服务模式带来根本
性颠覆。智能金融通过感知人类信息,并结合机器算法决策,实现替代
甚至超越人类行为和智力,更精准高效地满足各类金融需求, 推动我国
金融行业变革与跨越式发展。也可以说,智能金融是互联网金融、金融
科技、智慧金融等的更高级阶段。
从 2019 年起,我们持续跟踪我国智能金融发展情况,智能金融
的应用从一开始的身份识别、智能营销等方面的浅应用,逐渐向智能
风控、量化投资等领域深化。回顾过去的 2022 年,尽管受到疫情持
续冲击,我国数字经济仍保持较快发展势头,人工智能技术取得新突
破,我国智能金融发展呈现出以下新趋势和新特点:
一是生成式人工智能技术取得突破性进展。继去年学术界掀起用
人工智能技术解决科学重要难题(AI for Science)的科研新范式之后,
以 ChatGPT 为代表的通用人工智能取得了爆发式技术突破。2022 年大
模型参数超过了千亿,并将持续呈现指数级增长。技术上“预训练
+微调”的技术路径有效解决了过往人工智能技术泛化能力不足的问
题,人工智能开始从学习走向了创造,通用人工智能技术有望开启新
一轮人工智能技术创新周期。
二是大模型在金融领域应用成为热议话题。我国已出现一批通用
语言大模型,包括百度发布的文心一言,阿里的通义千问,华为的盘
古大模型、腾讯的混元大模型、京东的 ChatJD 等。金融机构普遍秉
承开放包容、守正创新、稳慎推进的理念,积极研究拥抱新技术、新
2
应用,按照先内部使用后客户服务的顺序,稳步推进。同时,金融机
构正在深入研究和评估通用语言大模型对未来金融行业可能产生的
广泛而深远的影响,纷纷部署做好相应的准备工作。
三是智能金融应用深度进一步拓展。智能金融的应用规模稳步增
长,头部金融机构持续加大对智能金融的投入;应用质效不断提升,
智慧技术产业生态和金融行业的技术运用能力不断成熟,推动着各类
识别、预测和应答模型准确率持续上升;应用成效显著增强,数字运营
能力和数字风控能力加强。银行、保险、证券等行业在产品创新、客服
营销、运营管理、风控合规等方面的智能化程度进一步深化。
四是智能金融监管制度进一步完善。智能金融涉及到人工智能技
术的应用,各国立法机关和监管部门正在努力制定统一的法律法规,
以规范相关领域的运作。2022 年,我国《金融科技发展规划(2022-
2025 年)》《金融标准化“十四五”发展规划》等一批制度文件的出台,
积极鼓励智能金融应用,同时持续加强智能金融监管。
在人工智能技术蓬勃发展背景下,以大模型为代表的人工智能技
术对金融行业的影响以及挑战,正在成为当下的热门话题,同时衍生
出一些新的问题,值得我们深入思考。
一是人类与人工智能的关系。人工智能技术的发展引发了人们对
于其与人类之间关系的思考和担忧。面对人工智能技术的大潮袭来,
在处理人类与人工智能的关系时,需要重点关注两种思想:一是技术失
效。智能时代的社会正常运行,有赖于人类生活中叠加的技术作为保障,
一旦技术失效,社会运转也会失灵,将带来社会停摆等问题。二是技术
至上。随着技术不断的进化,人工智能技术有可能脱离人的
3
掌控,进而控制和主宰人类。在这个意义上,让人工智能与人类的价
值观保持一致,显得尤为重要。
二是人工智能重构金融体系。大模型技术的突破,未来在金融领
域很可能会带来体系化的重构,重构人机交互方式、管理体系,给金
融行业带来革命性的改变。传统金融服务和产品是各项“烟囱式”独立
业务系统架构,每一个部分都是一个小模型,都需要数据训练。未来
在大模型的赋能下金融服务会逐步统一起来,大模型成为智能金融应
用中的关键核心技术和新型金融基础设施。
三是给金融监管带来新挑战。当前大模型虽然很强大,但仍然存
在稳健性差、可解释性弱、推理能力缺失以及智能幻觉等问题,给其
在金融领域的应用带来了不少阻碍。我国相关监管部门高度重视这些问
题,出台了《生成式人工智能服务管理暂行办法》,但大模型在金融领
域应用,更需要确保严谨准确和可解释、可审计、可监管,保证其不
带有偏见或歧视性,防范风险外溢,这些都给金融监管部门带来了新
的挑战。
四是加快实现我国人工智能关键技术自立自强。当前,各国在人
工智能领域角逐日趋激烈,我国相关科技企业坚持创新和加大研发投
入,在部分领域展现出竞争优势。同时,也要清醒认识到,来自外部
的技术封锁,给技术升级和产品应用带来了挑战。在人工智能领域实
现高水平自立自强,需要构建自研的核心算法、算力关键设施,把技术、
市场和生态牢牢掌握在自己的手里。
本报告共分为五个部分。第一部分是技术篇,主要介绍了 2022
年以来学术界关于人工智能算法创新情况,以及人工智能技术应用的
4
新趋势。第二部分是应用篇,从银行、保险、证券等行业应用场景,
介绍中国智能金融应用新趋势、新亮点。第三部分是探索篇,从生成式
人工智能对金融行业的影响、元宇宙与金融等方面探讨智能金融未来发
展趋势。第四部分是监管篇,梳理了 2022 年以来国内外智能金融治理
的政策与监管行动。第五部分是政策篇,从智能金融发展和智能金融监
管两方面提出政策建议。
本报告是对《中国智能金融发展报告》(2019)(2020)(2021) 的
跟踪研究和延续,报告总体框架与之前基本保持一致,着重突出了2022
年以来中国智能金融发展的新进展、新变化、新趋势、新问题。报告力争
为读者提供更全面和更有针对性的内容,为金融机构、科技 公司、研究
学者等相关人员及时了解智能金融行业发展情况提供参考, 也为有关部
门研究制定政策措施提供参考。
由于智能金融正处于快速发展过程中,加上时间和能力有限,报
告难免存在不足之处,敬请读者予以批评指正。我们将持续开展深入
研究,努力取得新的进步。衷心感谢社会各界的关心与支持!
《明珠湾智能金融发展报告(2022)》课题组
二⚫二三年十二月于北京
5
6
一、人工智能技术和产业发展状况
当前,人工智能技术和产业正处于快速发展阶段,未来发展前景
广阔,具有政策和商业资本支持力度广、技术水平提升速度快、市场
需求量大的特点。从学术进展角度看,生成模型、机器学习、机器视
觉等领域是人工智能目前发展的重点方向。
(一)学术进展
1. NeurIPS 论文分析
NeurIPS 作为全球人工智能久负盛名的盛会之一,其接收的论文
带代表着当今神经科学和人工智能研究的最高水平。与传统上专注于
机器学习、计算机视觉和自然语言处理等主题不同,2022 年 NeurIPS
大会新增“创意人工智能赛道”,重点是如何利用人工智能来创造视觉
艺术、音乐、文学、表演艺术等新形式。这是对生成模型快速发展和其
在创造性追求中日益增长的需求的认可。人工智能将成为强大的创作
工具,使艺术家和创意人员可以探索新的艺术范式。
根 据 NeurIPS 官方数据,2022 年共收到投稿 447 份,其中 163 份
被录用,录取率 %。在被录用的 163 篇论文中,超过 50%的论文
被确定为引入了新的数据集,而另一半则提出了新的基准。计算机视
觉方向占 23%,自然语言处理方向占 8%,强化学习和模拟环境方向
占比 7%,多模态数据方向占比 6%,其余方向还包括语音处理、可解
释的 AI 和伦理等。其中,杰出论文奖项(Outstanding Papers)共12
篇,包括分布外检测、生成模型、语言模型、超越神经缩放定律等多个
方向,如下表所示。
7
表 2022 年杰出论文奖项统计
序号 论文名称 中文翻译 主要内容
1
Is Out-of-
distribution
Detection
Learnable?
分布外检测
是可学习的
吗?
本文提供了分布外(OOD)检测的理论研究,重点
关注此类模型可学习的条件。使用可能近似正确
(PAC)学习理论来表明 OOD 检测模型仅在数据分
布空间和预测模型空间的某些条件下是 PAC 可学习
的。它提供了 3 个具体的不可能定理,可以很容易
地应用于确定 OOD 检测在实际环境中的可行性,并
用于为现有的 OOD 检测方法提供理论基础。
2
Photorealistic
Text-to-Image
Diffusion
Models with
Deep Language
具有深刻语
言理解的逼
真的文本到
图像扩散模
型
基于扩散过程的高质量图像生成模型在机器学习内
外都产生了巨大的影响。本文代表了此类模型的最
新技术之一,但也在展示独立训练的大型语言模型
与大规模图像解码器的有效组合方面进行了创新。
这种固有的实用解耦可能是大规模文本到图像模型
的主导范式。
3
Elucidating the
Design Space of
Diffusion-
Based
Generative
Models
阐明基于扩
散的生成模
型的设计空
间
本文将先前的研究组织成一个连贯的共同框架,可
以提供见解,然后导致新的建模改进。在这种情况
下,本文的重点是图像的生成模型,这些模型与某
种形式的扩散过程不相协调,尽管训练此类模型存
在困难,但最近变得非常流行。本文可能对基于扩
散过程的模型的理解和实施的发展做出重要贡献。
4
ProcTHOR:
Large-Scale
Embodied AI
Using
Procedural
Generation
ProcTHOR:
使用程序生
成的大规模
具身智能
本文提供了用于在大量数据上训练具身 AI 代理的框
架,为这些代理创造从扩展中受益的潜力,就像语
言和图像生成模型一样。该框架的核心是一个引
擎,用于构建程序生成的、支持物理的环境,代理
可以与之交互。该引擎与提供的数字资产和环境控
制相结合,允许生成大量不同的环境。作者证明,
该框架可用于为多个具体 AI 任务训练 SoTA 模型。
5
Using natural
language and
program
abstractions to
instill human
使用自然语
言和程序抽
象向机器灌
输人类归纳
偏见
关于程序抽象和自然语言的共同培训可以将人类偏
见纳入学习。这是一种结合人为偏见的干净方法,
但也具有程序抽象的鲁棒性。
8
序号 论文名称 中文翻译 主要内容
inductive biases
in machines
6
A Neural
Corpus Indexer
for Document
Retrieval
用于文档检
索的神经语
料库索引器
本文提出了一种神经索引器,该索引器将查询作为
输入,并通过结合光束搜索的解码器输出与索引中
相关文档相对应的 ID 列表。它加入了一个小型但不
断增长的研究路线,偏离了占主导地位的高召回稀
疏检索范式。值得注意的是,这种新范式允许使用
标准深度学习算法和框架对目标应用程序的索引器
进行基于梯度的优化。所提出的方法引入了架构和
训练选择,与以前的工作相比,这些选择带来了显
着的改进,证明了神经索引器作为可行替代方案的
前景。
7
High-
dimensional
limit theorems
for SGD:
Effective
dynamics and
critical scaling
SGD 的高维
极限定理:
有效动力学
和临界缩放
本文研究了高维状态下步长恒定的 SGD 的缩放极
限。它显示了如果步长很大,SGD 会有多复杂。表
征 SDE 的性质,并在步长较小时将其与 ODE 进行
比较,可以深入了解非凸优化环境。
8
Gradient
Descent: The
Ultimate
Optimizer
梯度下降:
终极优化器
本文通过开发一种相对于超参数进行优化和递归优
化“超”参数的方法,降低了梯度下降中对超参数的
敏感性。
9
Riemannian
Score-Based
Generative
Modelling
基于黎曼分
数的生成建
模
本文通过确定有助于 SGM 成功的主要成分,将基于
分数的生成模型(SGM)从欧几里得空间推广到黎
曼流形。
10
Gradient
Estimation with
Discrete Stein
Operators
使用离散斯
坦算子的梯
度估计
本文考虑了分布离散时的梯度估计。最常见的梯度
估计器存在过度方差。为了提高梯度估计的质量,
他们引入了一种基于离散分布的斯坦因算子的方差
减少技术。尽管斯坦因算子是经典的,但这项工作
为梯度估计提供了很好的解释,并且在实验中也显
示出实际的改进。
9
序号 论文名称 中文翻译 主要内容
11
An empirical
analysis of
compute-
optimal large
language model
training
计算最优大
语言模型训
练的实证分
析
本文基于对给定固定的 FLOP 预算,权衡模型大小
和训练代币的数量模型进行预测,并训练与该预测
相对应的模型。由此产生的模型明显更小,但在明
显更多的代币上进行训练,其性能优于其对应模
型,同时由于其较小的尺寸,在下游使用也更实
用。
12
Beyond neural
scaling laws:
beating power
law scaling via
data pruning
超越神经缩
放定律:通
过数据修剪
击败幂律缩
放
高质量数据对于在机器学习中取得良好结果的重要
性是众所周知的。最近关于缩放定律的工作将数据
质量视为统一,并专注于计算和数据之间的关系。
这项工作再次关注选择高质量数据作为实现最佳扩
展的手段的重要性。它通过精心设计的分析调查来
实现这一点,该调查开发了一个数据质量影响的理
论模型,并与 ImageNet 上一系列数据过滤指标的
经验实例化相协调。
13
On-Demand
Sampling:
Learning
Optimally from
Multiple
Distributions
按需采样:
从多个分布
中优化学习
本文使用随机零和博弈的技术研究了多重分布学
习。
2. AAAI 论文分析
国际先进人工智能协会(Association for the Advancement of
Artificial Intelligence, 以下简称AAAI)是人工智能领域的主要国际学
术组织之一。根据其发布的 2022 年论文主题数据来看,机器学习、深
度学习、计算机视觉、NLP 是重点关注领域。其中,深度学习相关的论
文共计 72 篇,包括经典的深度神经网络、DeepFake 相关、深度表达等
方向;图结构数据相关的论文共计 125 篇,而经典的表示学习、监督学
习、Transformer 以及多智能体等仍然是主流范式。此外,隐私
10
保护相关的论文共计 24 篇,较上一年度增长了 140%;可解释性相关
的论文 29 篇;在机器学习的具体应用中,目标检测(Object detection)、
文本分类(Text Classification)等仍然是关注度较高的方向。
(二)主要技术发展情况
1. 人工智能相关技术发展情况
人工智能已经和传统产业深度融合,将带动人工智能技术的体系化、
集成化和专用化,并推动产业的数字化和智能化。到目前为止, 人工
智能已经发展为包括大数据和云计算、物联网、智能机器人、智能推荐、
5G、区块链、语音识别、虚拟/增强现实、智能芯片、计算机视觉、自
然语言处理、生物识别、空间技术、光电技术、自动驾驶、人机交互和
知识图谱 17 种技术在内的复杂技术体系。
(1) 机器学习算法
目前,国际上机器学习的研究重点主要集中在深度学习、强化学
习、自然语言处理等领域。随着云计算、大数据和计算机硬件技术不断
发展,机器学习开始在各行各业取得显著成效,成功的商业应用不断入
市。其中,最具有代表性的应用来自苹果的 Siri、微软的 Cortana 等语
音 助 手 , 各 大 支 付 应 用 推 出 的 人 脸 识 别 认 证 技 术 , 以 及 谷 歌
AlphaGo 战胜顶尖人类围棋高手的事实,标志着机器学习已经成为计
算机科学中的重要领域。
我国的机器学习技术发展迅速。机器学习与互联网、金融、IT 服
务行业融合度较高。高校方面,北京大学、清华大学等高水平研究机
构设立了机器学习实验室。企业方面,阿里巴巴、腾讯、百度等国内
11
科技巨头在机器学习领域也加力度,通过资金和人才投入推动机器学
习技术发展和应用创新。
(2) 自然语言识别与处理
目前,自然语言基本形成了一套相对完备的技术体系,包括词嵌入、
句子嵌入、编码-解码、注意力模型等,促进了自然语言处理在搜索、阅
读理解、机器翻译、文本分类、问答、对话、聊天、信息抽取等重要领
域应用,标志着自然语言处理进入大规模工业化实施时代。另一方面,
随着软硬件能力的提升,以及在模型、算法的突破,自然语言处理也开
始和深度学习结合应用。例如 ChatGPT 就是基于自然语言处理技术的
对话生成模型,通过学习海量的语言数据来模拟人类对话,从而实现内
容生成和回答问题的能力。
我国在自然语言识别与处理方面取得了长足的进步。一方面,面
向自然语言处理的深度学习技术已支持自动学习语义的分布式表示,
并在实际应用中得到充分验证,为进一步融入知识指导信息的方法研究
奠定了坚实基础。另一方面,知识表示与推理技术已经初步具备完整的
体系,充分利用结构化的知识赋予人工智能不同的能力,为提升模型的
可扩展性和鲁棒性提供了支撑。
(3) 人工智能芯片
随着人工智能对于计算能力的要求不断提升,突破 GPU 性能功
耗和减少工作限制成为主要研究方向。业界不断提升人工智能芯片的
研发投入,以通过更好的硬件和芯片架构,在计算效率、能耗比等性
能上得到进一步提升。
12
目前,人工智能芯片主要包括基于传统架构的 GPU、FPGA 及
ASIC 等。短期来看,基于传统架构 GPU 仍占据市场主导地位;长期来
看,FPGA 为代表的定制化硬件将成为市场增长点。FPGA 具有算力
强、可编程、灵活度高的特点,能够更好的满足不同算法、结构、终
端和消费者的需求,但面临的技术难度挑战也较大。总的来看,国外
的Xilinx、Altera、Lattice 和 Microchip 四家公司占据了 FPGA 大部分
市场,其中Xilinx 和 Altera 两大公司占据了近 90%的市场份额。
国内方面,我国的人工智能芯片领域发展保持着强劲的动力。根
据 Tractica 的预测,预计到 2025 年,中国人工智能芯片行业未来市场
规模将达到 726 亿美元,年复合增长率将达到 %。随着大数据
和计算能力的提升,中国人工智能行业市场成长空间巨大,2030 年市
场规模有望突破千亿元。
(4) 深度学习框架平台
目前,国外的企业和研究机构纷纷布局深度学习框架平台,伯克
利大学和蒙特利尔大学联合推出 Theano 和 Caffe 框架、谷歌开发的
TensorFlow、Facebook 开发的PyTorch 占有主要市场地位。伴随着与
实体产业的不断融合应用,深度学习在自动驾驶、个性化推荐、自然
语言理解和医疗保健等领域发挥了重要的成效。但不同于编程语言
JAVA/C++相对于互联网应用那样的成熟,深度学习的产业应用还有
很多有待提升和优化的方面。例如基于编译器的算子优化、统一的
API 标准和数据搬运等。
国内方面,国产深度学习框架平台变得越来越丰富。百度自研深
13
度学习框架 PaddlePaddle,旷视推出了 AI 生产力平台Brain++,并开
源 了 深 度 学 习 框 架 天 元 MegEngine , 华为推出了 AI 计 算 框 架
MindSpore 等深度学习框架平台和产品。随着国内应用场景的不断
开放,各行业领域对深度学习的需求持续增强,中国人工智能企业持
续加大研发投入力度,与国际上深度学习框架相关核心企业和科研机构
形成了齐头并进的发展格局。
2. 智能金融相关其他技术介绍
(1) 生物特征识别
生物特征识别技术包括语言、脸、指纹、个人习惯等行为相应进行
识别的技术。通过摄像头捕捉,特征提取,再对特征进行分类,完成匹
配。随着现代金融业务的在线化发展,越来越多的业务场景需要对客户
进行远程的身份核实和认证,生物识别技术也因此在金融领域广泛应用。
特别是在移动端,因为其便捷的人机交互体验和保密安全的特点,生物
特征识别技术已经成为移动智能终端的标准配置。目前, 在金融领域的
生物识别技术多用于客户身份验证、远程开户、刷脸支付等场合。
(2) 计算机视觉技术
计算机视觉技术是指运用设备捕捉观测对象产生的图像或者是
视频中产生的信息。通过以计算机能够理解的方式进行分析和处理,
从而使计算机能够识别目标的过程。计算机视觉包含图像分析、视频分
析,以及衍生的人体姿态识别、目标跟踪、SLAM(同步定位和地图构
建)、OCR(光学字符识别)等子技术。目前,当前的计算机视
14
觉技术达到商业化的水平。在金融领域的标准化使用场景中,人脸识别、
票据识别、场景识别等技术的应用代替了原有的人工重复作业, 升级成
为更高效、便捷的客户交互方式。
(3) 知识图谱
知识图谱是用来描述信息资源和资源载体之间的关系的技术,一
般包括挖掘、分析、构建和显示等。在金融应用场景中,通过知识图谱
技术构建的产业链图谱是赋能金融机构智能投研的重要工具。产业链图
谱可以有效提高金融机构获取行业信息和企业信息的便利性,提升研究
分析的效率。在金融业务中,通过对行业进行细分,对贷款信息、行业
信息建立关系挖掘模型,并通过机器学习进行模型的训练, 展示每个行
业及与其关联度最高的相关行业,若某一行业发生了行业风险事件,可
以及时预测未来有潜在风险的关联行业。
(4) 智能语音
智能语音技术实现了人机语言通信,创造了更智能的客户互动模
式,包括语音识别技术(ASR)和语音合成科技(TTS)。智能语音
技术目前已经成为中大型金融机构的标配之一,在问答、咨询、理财、
查询、身份识别、智能客服、智能理赔等多个场景中进入到生产环境。整
体来看,智能语音技术最具价值的应用在于与客户交互、服务相关的环
节中,起到降本增效的目的,满足银行等金融机构在业务方面的语音服
务需求。
(三)产业进展情况
目前,通过人工智能技术,各行各业的企业可以实现自动化流程、
15
增强能力,并做出更明智的决策。据麦肯锡全球 AI 状况年度调查显示,
组织中采用人工智能的比例从 2017 年的 20%翻倍至 2022 年的50%。
同时,2022 年的调查还表明,采用人工智能可能带来显著的财务效益:
25%的受访者将其公司5%或更多的净利润归功于人工智能。
1. 国外进展情况
全球人工智能产业规模快速增长。随着数据量的增长及相关复杂
性不断增加,传统软件无法处理、分析及提取其中有用的信息,产生
对人工智能技术需求。根据沙利文的报告,2025 年全球人工智能软件
市场规模预计将达到 1218 亿美元,占总支出比例的 %,2020-2025
年复合增速达到 %。
欧盟发布《2030 数字化指南:欧洲数字十年》《升级 2020 新工
业战略》等文件,计划全面重塑数字时代全球影响力,其中将推动人
工智能发展列为重要方向。同时,欧盟不断加大人工智能产业资金支持
力度,大力促进欧洲的数字变革。欧盟有史以来最大研发和创新项目
“地平线欧洲”总投资额达 955 亿欧元,明确将人工智能列入资金支持
范围。2021 年 4 月,欧盟以条例的形式通过“数字欧洲计划”,对包括
人工智能在内的项目进行投资,总额达 亿欧元。
美国陆续成立了国家人工智能倡议办公室、国家 AI 研究资源工
作组等机构,各部门密集出台了系列政策,将人工智能提到“未来产
业”和“未来技术”领域的高度,不断巩固和提升美国在人工智能领域
的全球竞争力。美国 2021 年人工智能非国防预算增加约 30%,总额
达到 15 亿美元。此外,在《美国创新与竞争法案》中,将人工智能、
16
量子计算等列为 2022 财年美国研发预算优先事项,将对包括人工智
能在内的多个领域共投入 1000 亿美金进行研发工作。2021 年 7 月,
美国国家科学基金会联合多个部门和知名企业等,成立 11 个国家人工
智能研究机构,涵盖了人机交互、人工智能优化、动态系统、增强学习
等方向,研究项目更是涵盖了建筑、医疗、生物、地质、电气、教育、
能源等多个领域。
日本继制定《科学技术创新综合战略 2020》之后,于 2021 年 6
月发布“AI 战略 2021”,致力于推动人工智能领域的创新创造计划, 全
面建设数字化政府。日本将基础设施建设和人工智能应用作为重点, 提
出加快建设相关基础设施,重点强调了跨行业的数据传输平台以及 人工
智能相关标准等,全面推动人工智能在医疗、农业、交通物流、智慧城
市、制造业等各个行业开展应用,并加大对中小企业的支援。
英国于 2021 年 9 月发布国家级人工智能新十年战略,这是继
2016 年后推出的又一重要战略,旨在重塑人工智能领域的影响力。英
国将投资和规划人工智能生态系统作为长期战略,启动国家人工智能研
究与创新计划,支持人工智能先进研究等,确保人工智能惠及所有行业
和地区,促进人工智能的广泛应用。据统计,2014 年到 2021 年之间
英国对人工智能的投资已经超过 23 亿英镑。
2. 我国进展情况
以 2015 年《中国制造 2025》出台为开端,人工智能被写入“十三
五”规划纲要及政府工作报告。2017 年国务院发布《新一代人工智能
发展规划》,将人工智能上升到了国家战略层面。随后多部门相继出
17
台若干核心政策和规划,为我国人工智能行业快速发展提供助力。《中
共中央关于制定国民经济和社会发展第十四个五年规划和 2035 远景
目标纲要的建议》指出,要瞄准人工智能等前沿领域,实施一批具有
前瞻性,战略性重大科技项目,推动数字经济健康发展。面向人工智能
领域创新需求的投资不断加大。我国十四五规划纲要明确大力发展人工
智能产业,打造人工智能产业集群以及深入赋能传统行业成为重点。
据工业和信息化部统计数据显示,截至 2022 年 6 月,我国人工
智能企业数量超过 3000 家,仅次于美国,排名第二,人工智能核心
产业规模超过 4000 亿元。我国人工智能企业在智能芯片、基础架构、操
作系统、工具链、基础网络、智能终端、深度学习平台、大模型和产业
应用领域的创新创业活动,为自主可控技术体系的构建和产业国际竞
争力的提升奠定了基础。平台企业、独角兽公司、中小企业、新创企业、
研究型大学、科研院所和投资者之间相互协作,共同构建富有活力的
产业创新生态,人工智能产业发展表现出日益明显的集群化趋势。
3. 挑战和应对
在大力推动人工智能发展的同时,我们也应该认识到人工智能带
来的诸多问题和挑战。首先,在国际技术摩擦逐步加大的背景下,国外
企业在芯片、硬件、算法和平台等方面占据了领先优势,严重压缩了我
国人工智能创新发展的空间,全球技术发展不均衡带来了新的“科技
霸凌”问题。其次,随着基于大语言模型的应用快速创新,其
18
输出的价值观可能与人类主流价值观存在矛盾,“AI 对齐”等问题为全
球科技治理和伦理带来了新的挑战。再次,人工智能可能带来“机器冰
冷”等挑战,高度智能化会对传统产业进行快速的降维打击,可能加剧
不平等、劳动力过剩、情感疏远和人性缺失等社会问题。最后, 大语言模
型的“可解释性”一直是各方关注的重点问题,黑盒的算法在逐步“进化”
的过程中,可能输出意想不到的结果,尤其用在军事、金融等特殊领域,
可能造成极大的损失。
因此,在推进人工智能产业创新发展的同时,需要避免或降低人工
智能带来负面影响。一是制定明确的发展原则、策略和技术路线, 从制
度、技术、金融和法律等方面建立完善的保障体系,降低技术发展的试
错成本。二是加强大模型关键技术研究,突破计算能力、算法可解释性、
数据质量等瓶颈问题,避免“卡脖子”问题对我国人工智能产业发展带来
的影响。三是推动建立人工智能商业生态,以技术平台为基础构建开发
者社区、公共服务平台等载体,在各领域培育“杀手级”应用,形成闭环
的商业生态。四是强化人工智能伦理治理,将治理规则融入到人工智能
技术生命周期过程中,提升人工智能的公平性、透明性和人性化等能力。
二、通用语言模型技术分析
(一)发展历程
通用语言模型的出现标志着人工智能的一个转折点。与以往的人工
智能不同,生成式 AI 可以根据从类似非结构化数据格式中学到的信息,
生成新的非结构化内容,如文本、音频、视频、图像、代码。
19
而且,其核心技术——基础模型,可以适应各种任务。通用语言模型
的出现、发展、变革和创新历程可以追溯到早期的机器翻译和自然语
言处理研究,并可划分出几个里程碑事件:
统计机器翻译(SMT)的出现:在统计机器翻译时代,研究人员
主要依赖于基于规则和统计模型的方法来处理语言翻译问题。这些模
型基于大量平行语料库进行训练,但结果仍然受限于规则和特征的限制。
神经机器翻译(NMT)的兴起:随着深度学习技术的发展,神经
机器翻译模型引入了基于神经网络的端到端翻译方法。NMT 模型使
用编码器-解码器架构,并通过大规模平行语料库进行训练。这种方法
取得了显著的改进,并成为现代机器翻译系统的主流。
语言建模与序列到序列学习的产生:语言建模是训练语言模型的重
要任务,它通过学习语言中的概率分布来预测下一个单词或字符。序列
到序列学习引入了编码器-解码器模型,并将其应用于机器翻译、文本
摘要、对话生成等任务。这种框架的出现使得语言模型的应用范围更加
广泛。
Transformer 模型的提出:Transformer 模型是一个基于自注意力
机制的神经网络模型,被广泛应用于自然语言处理任务。它的出现极
大地改善了长距离依赖建模和并行计算的能力,成为许多语言模型的基
础。
BERT 的出现:BERT(Bidirectional Encoder Representations from
Transformers)模型是一个基于 Transformer 的预训练语言模型,采用
20
了双向的语境信息来进行词汇表示学习。BERT 的出现引领了预训练
语言模型的新潮流,通过大规模的无标签数据预训练模型,在各种下
游任务上取得了显著的性能提升。
GPT 系列模型的问世:GPT(Generative Pre-trained Transformer)
模型是 OpenAI 提出的一系列基于 Transformer 的预训练语言模型。
GPT 是该系列的最新版本,是迄今为止最大的语言模型之一。
目前,通用国内外语言模型在过去几年中取得了巨大的进展和创
新。从传统的统计机器翻译到基于神经网络的模型,再到预训练语言
模型的崛起,语言模型不断演化和改进,为机器翻译、文本生成、对
话系统等自然语言处理任务带来了重大突破和提升。
(二)发展情况
国外方面,2023 年 3 月,OpenAI 发布大模型 ChatGPT-4,直接
升 级 ChatGPT 识图能力、回答专业性、准确性以及风格变化能力,文
字限制提升至 万字。在理解能力、结果准确性、识别非法与偏见
能力上均能取得更优效果。ChatGPT-4 不仅在日常对话、专业问题回
答、信息检索、内容续写、文学创作、音乐创作等方面展现出强大的能
力,还具有生成代码、调试代码、为代码生成注释的能力。
ChatGPT 的出现促进了 AIGC(AI-Generated Content)的发展。
与此前 、 时代的 UGC(用户生产内容)和 PGC(专业
生产内容)相比,代表人工智能构思内容的 AIGC,是新一轮内容生
产方式变革,而且 AIGC 内容在 时代也将出现指数级增长。
未来,与图形模态的 AIGC 相结合,有望打造从文字描述到图片生成
21
的 AI 创作辅助工具,对 AI 产业上下游产生重大影响。
国内方面,目前我国已出现大量通用语言模型,包括百度发布的
文心一言,阿里发布的通义千问,华为发布的盘古大模型、腾讯发布
的混元大模型、京东发布的 ChatJD 等。
1. 百度-文心一言
2023 年 3 月 16 日,百度发布了“文心一言”产品,其模型采用了百
度自然语言处理技术的 ERNIE 模型进行预训练。该模型具有很强的语
言理解和表达能力,在多个 NLP 任务上表现出色。文心一言主要应用
于文本分类、情感分析、命名实体识别、关键词提取、摘要生成、文本
相似度匹配、问答系统和机器翻译等多种任务。百度还推出了基于文心
一言的产品和服务,如“智能写作”、“智能客服”、“智能推荐”、“智能搜
索”等,这些产品和服务都能够为用户提供更加智能化、个性化的体验。
2. 阿里-通义千问
阿里云大模型“通义千问”拥有超过 1000 亿个参数,是目前国内最
大的中文预训练语言模型。阿里的通义千问模型采用了深度学习技术,
具有强大的自然语言处理能力。该模型可以用于多种 NLP 任务,包括
问答、文本分类、情感分析、命名实体识别和文本摘要等。通义千问
主要应用于阿里的智能客服系统中,可以帮助用户更快速地解决问题。
该模型还具有自学习能力,可以不断提高自己的准确性和效率。
3. 华为-盘古
22
华为的盘古大模型是一种基于深度学习技术的自然语言处理模
型。该模型可以应用于多种 NLP 任务,包括文本分类、情感分析、
命名实体识别和关键词提取等。盘古大模型采用了多层 Transformer
结构,可以生成高质量的自然语言文本。华为还推出了基于盘古大模
型的产品和服务,如智能客服、智能写作、智能推荐等,可以为用户提
供更加智能化、个性化的服务体验。该模型在设计上,强调了可拓展
性和高性能的特点。它不仅可以完成自然语言理解、问答、聊天等任务,
还可以进行智能翻译、语音识别、语音合成等多种功能。华为的盘古
大模型采用了类似于 GPT 的预训练和微调方法,在多个领域中进行
了深度的训练和优化。它还通过自主学习的方式,不断提高自己的准
确性和效率,并能够自适应不同的应用场景和行业需求。
4. 腾讯-混元
腾讯混元大模型是腾讯 AI Lab 开发的自然语言处理模型,是以腾
讯太极平台为基础,配合强大的底层算力与低成本的高速网络基础设施,
打造的首个可在工业界海量业务场景直接落地,并投入应用的万亿 NLP
大模型。该模型在预训练中使用了 Transformer 技术,具有较强的语言
理解和表达能力,可应用于文本分类、情感分析、命名实体识别、关键
词提取、文本相似度匹配和机器翻译等多种 NLP 任务。腾讯 AI Lab 语
言模型还推出了基于该模型的智能客服、智能问答和智能写作等产品
和服务,为用户提供更加智能化、个性化的服务体验。
5. 京东-ChatJD
京东的 ChatJD 模型是一种基于深度学习技术的自然语言处理模
23
型。该模型可以用于文本分类、情感分析、关键词提取、命名实体识
别和文本摘要等多种 NLP 任务。京东还推出了基于 ChatJD 的智能客
服系统和商品推荐系统,可以为用户提供更加智能化、个性化的服务
体验。ChatJD 模型的优势在于其在电商领域的应用,通过对用户的历
史购买记录和行为进行分析,可以为用户提供更加精准的商品推荐和购
物建议,进一步提高用户的购物体验。
从整体上看,国内外各家公司都在使用深度学习技术来构建产业
级的大型模型,这些模型具备强大的自然语言处理能力,可应用于多种
自然语言处理任务。举例来说,百度的文心一言模型在多个 NLP 任务上
表现出色,能够提供更智能化、个性化的体验给用户;阿里的通义千
问模型则具备自学习能力,能不断提高准确性和效率;华为的盘古大模
型则擅长生成高质量的自然语言文本;京东的 ChatJD 模型在电商领域
的应用也表现出色,能够为用户提供更精准的商品推荐和购物建议。
此外,腾讯 AI Lab 的语言模型适用于多种自然语言处理任务,并推
出了多种基于该模型的智能产品和服务,为用户提供更智能化、个性
化的服务体验。
(三)发展趋势
随着自然语言处理(NLP)技术的快速发展,通用语言模型技术
展现出长足进步和发展潜力。尤其是在大语言模型(LLMs)方面,
不同于以往的预训练语言模型(PLMs),当参数规模超过一定水平
时,展现出了显著的性能提升、上下文学习和指令遵循等小语言模型
不具备的能力。从 2013 年谷歌的 Word2Vec 模型到 2019 年的 T5 模
24
型,再到现象级的 OpenAI GPT 系列出现,大语言模型(LLMs)的技
术创新发展对整个人工智能领域都产生了深刻的影响,并将彻底改变
人们开发和使用人工智能算法的方式。总的来看,通用语言模型主要
呈现出以下几种发展趋势。
1. 趋势一:模型规模持续增长
2019 年发布的 GPT-2 模型最大版本只有 14 亿个参数,而 GPT-3
模型具有 1750 亿个参数,相比之下,最新的 GPT-4 模型则具有约 1
万亿个参数。更大规模的模型可以提供更准确、更丰富的语言表达能
力,有助于解决更复杂的自然语言处理(NLP)任务。
2. 趋势二:预训练和微调改进
预训练是通用语言模型成功的关键,预训练阶段的优化改进包括 更
好的预训练目标、更高效的训练算法和更有效的参数初始化等方面。此外,
微调阶段的优化也将是重要的研究方向,以进一步提高模型在 特定任务
上的适应能力。
3. 趋势三:多模态和多领域拓展
目前,通用语言模型的应用范围正在不断扩展,未来将更加注重
如文本、图像、语音等多模态信息的融合,以及如医疗、法律、金融
等多领域知识的整合。通过将多模态和多领域的信息结合起来,可以实
现更全面、更智能的自然语言处理能力。
4. 趋势四:提升个性化和可解释性
通用语言模型在工业制造、商业服务、文化旅游、医疗健康等应
用领域的不断拓展,用户对于通用语言模型的可解释性逐渐重视,对
25
人工智能产品的个性化需求逐步提升。随着通用语言模型技术发展,
人工智能产业将更加关注如何根据个体的特征和需求进行模型定制
化,并提升对模型决策的可解释性,增强用户对模型的信任和接受度。
5. 趋势五:数据安全和隐私保护
随着数据隐私的重要性不断凸显,联邦学习等隐私保护技术在通
用语言模型中的应用也将得到关注。联邦学习可以在保护数据隐私的
前提下进行模型训练和推理,使得多方共享的数据能够为模型提供更
多的信息,同时确保用户数据的隐私不被泄露。
6. 趋势六:跨语言和跨文化研究
随着应用场景的不断拓展,通用语言模型还被广泛应用于多种语
言之间的互译、跨文化的文本生成和情感表达等任务,因此,对于通
用语言模型的跨语言和跨文化研究也成为重要的研究方向,推动实现
更广泛、更精确的语言交流和理解。
总的来看,基于中国在算力、芯片、数据和应用场景等方面的优
势,我国应在通用语言模型领域进行前瞻性规划和布局。通过加大研
发投入、优化数据资源、加强政策支持和拓展产业应用,我国有望在
通用语言模型技术的发展中取得更大的突破,促进人工智能领域的创
新和产业升级。
(四)对金融业带来的影响
目前,通用语言模型已经为金融行业带来了显著的影响,能够提
高金融数据的处理效率和准确性,提供更好的客户服务和体验,改善
投资决策和风险管理能力,推动金融创新和发展。然而,随着技术的
26
不断发展和应用的扩大,也需要关注安全性和隐私保护等方面的问题,
确保通用语言模型在金融行业的应用能够得到可持续和健康的发展。
通用语言模型具体对银行金融业带来的影响可能包括以下几个方面:
一是智能客服机器人。通用语言模型可以用于构建智能客服和聊
天机器人系统,提供 24 小时全天候的客户服务。在金融行业,此类
应用可以有效地处理日常的客户查询、账户管理和产品推荐等任务,
提高客户满意度和响应效率。
二是投资分析和预测。通用语言模型可以用于分析和预测金融市
场趋势,帮助投资者做出更准确的决策。通过对大量的新闻、财报、
社交媒体和其他金融数据进行语义分析和情感挖掘,通用语言模型可 以
提供关键的市场洞察和预测,帮助投资者识别投资机会和降低风险。
三是智能风控和反欺诈。通用语言模型可以用于金融机构的风险
管理和反欺诈工作。通过分析客户的交流记录、信用评估报告和其他相
关数据,通用语言模型可以帮助金融机构自动识别风险因素、异常行
为和欺诈行为,提高风险控制和防范能力。
四是个性化推荐和财务规划。通用语言模型可以通过客户基本资
料、投资目标和风险承受能力,提供个性化的金融产品推荐和财务规划
建议。通过深入理解客户需求和偏好,通用语言模型可以帮助金融机
构提供更加精准和个性化的服务,增强客户黏性和满意度。
27
28
2021 年末,金融行业监管机构先后发布《证券期货业科技发展
‘十四五’规划》《金融科技发展规划(2022-2025 年)》《关于银行业
保险业数字化转型的指导意见》等顶层规划和指引,为立足科技 大力推
动数字化转型定下基调。金融机构以提高金融服务效率和质量, 满足人
民群众日益增长的金融服务需求为目标,纷纷加快数字化转型 的步伐,
持续夯实软硬件信息基础设施,加强大数据、机器学习、人 工智能等新
技术的研究和应用,积极推动金融科技与业务深度融合, 开启智慧金融
应用的新一轮发展。
在数字化转型战略的推动下,2022 年行业呈现数字智能技术在
场景化、平台化和规模化方面强劲的应用态势。金融单位秉承以人民为
中心的理念,内部协同跨部门、跨业务条线的敏捷柔性团队,发挥整体
优势,构建客户全景视图,为用户打造贯穿各场景的个性化体验; 外部层
面,加强与政务、电商、社交、医疗等领域的生态合作,推动多元化场
景金融的发展,增加流量入口,拓宽和丰富数据来源,完善数字化客户
洞察,不断提升产品和服务的质量。在监管机构、行业组织和产业联盟
的大力推动下,隐私计算平台的标准化和规范化取得长足的进展,平台
认证力度不断加强,有力地支持隐私计算技术的应用推广。技术平台的
高效驱动、场景推广的牵引和数据反馈形成企业在数据收集、分析和应
用的良性循环,有效激发数据飞轮效应,极大地提高技术运用的规模和
业务赋能水平。
在能力建设方面,金融机构持续提高技术平台的自动化效率,降
29
低平台使用门槛。大数据和人工智能领域 2022 年迎来 DataOps2和
MLOps3的能力成熟度标准的发布,受到金融行业的广泛关注和积极
参与。相关评测和认证结果表明,领先的金融机构在数据和模型的全生
命周期管理、开发和运营效率方面已经达到较高水平。零代码(No- Code)
或低代码(Low-Code)4开发平台越来越受欢迎,通过为非专业开发
者或业务人员提供可视化界面、拖拽组件和配置参数等方式, 使广泛
的用户群体能够快速构建大数据和人工智能应用,极大地降低开发成
本和缩短开发周期。
在技术应用方面,多模态技术整合文本、图像、语音、视频等多种
不同感知模态的数据,综合分析和利用不同模态数据之间的信息相关性
或者互补性来提高模型的准确率或者增强人机交互的友好度,在客服、
运营管理和风险防控的应用崭露头角。AR/VR5技术保持着可观的发展
势头和潜力,通过与金融场景的对接,推进虚实融合服务交互, 应用在
数字人、虚拟网点等多个场景,实现沉浸式服务。区块链技术
2 DataOps(Data Operations)数据操作:一种面向数据流程自动化方法,由数据和分析团队使用,旨在提
高数据分析的质量并缩短数据分析的周期。
3 MLOPs(Machine Learning Operations)机器学习运维:MLOPs 是 DevOps 开发运维一体化理念的扩展,倡
导机器学习生命周期管理的标准化与流水线化。
4 零代码(No-Code):利用可视化建模工具,通过少量的手工编码或完全无需编码的方式,快速构建应
用程序的开发模式。
低代码(Low-Code):一种可视化的应用开发方法,用较少的代码、以较快的速度交付应用程序,将程
序员不想开发的代码做到自动化。
5 AR(Augmented Reality)增强现实:通过运用多媒体、三维重建、实时跟踪及注册、智能交互、传感
器等多种技术手段,将虚拟信息与真实世界巧妙融合,从而实现对真实世界的“增强”。
VR(Virtual Reality)虚拟现实:综合使用计算机、电子信息、仿真技术,模拟产生虚拟空间给使用者沉
浸式的体验。
30
结合其他综合技术助力数字人民币持续在多地区、多场景进行试点应
用,探索更多的应用场景和创新模式。2022 年生成式人工智能技术的
发展成熟,文生图、文生视频、文本生成等大模型技术取得突破,成
为发展的里程碑节点,受到金融机构的高度关注,激发出新一轮人工智
能应用浪潮。
在场景赋能方面,金融机构紧密围绕党和国家的金融工作要求,
持续深化金融供给侧改革,推动新技术与业务场景深度融合,释放智能
技术应用的红利,为实体经济提供更具针对性的金融产品和服务。一是
在金融产品研发和销售方面,金融单位通过大数据和人工智能技术,从
区域、行业、供应链等维度全方位切入,深入挖掘实体经济的金融需求,
推出差异化的金融产品和定制化金融服务,满足不同类型和不同阶段的
企业发展所需。二是在运营流程方面,金融机构利用云计算、物联网、
人工智能等技术实现业务流程再造,优化金融服务的流程和效率,提升
服务响应速度,大幅降低企业的融资成本。三是在风险防控方面,金融
机构运用人工智能、大数据、区块链等技术,实现对企业信用风险的精
准评估和全流程监控,及时发现问题并采取措施,有效控制各类风险。
2022 年我国各大银行面向高新技术、制造业和普惠小微企业的贷款余
额同比增长均超过20%,其中制造业中长期贷款余额增长达 %;保
险业 2022 年科技保险和首台(套)重大技术装备风险保障金额同比增长
22%,有力地保障了科技创新和装备制造的安全运行;证券行业 2022 年
服务实体经济实现直接融资 万亿元,积极有效地引导了社会资金
向实体经济流动。
31
一、金融智能应用概述
我国金融机构体系中,智能应用水平存在较明显的分层情况:大
型机构的数字化转型和智能化应用发展较早,往往基于全技术栈面向全
业务场景打造企业级平台化能力,水平在同业中较为领先;中小机构受
制于资本、规模、人才等因素,其智能应用水平较大型机构总体上还有
一定的差距,适合根据自己的战略定位和特色业务领域,通过专项技术
产品引进和持续打磨的方式赋能业务。不过在整体上,2022 年金融智
能应用呈现规模稳步增长、质效不断提升、成效显著增强的态势。
(一)应用规模稳步增长
头部金融机构高度重视科技对数字化转型的引领作用,持续保持
和加大对科技的相关投入。在银行业,国有六大行的整体科技投入同比
增长 %,总额达到 亿元,增长速度较 2021 年的 % 有所
回落,呈现稳步增长的态势。不过其中部分头部银行如工行和建行
2022 年科技投入的增长率分别为 %和%,折射出新技术体系迈
入成熟期和注重投入效能提升的转变。保险业从业机构在科技投入上
整体不如银行业,然而科技型险企的投入近年来保持高速增长的势头,
如众安保险在 2022 年技术研发投入同比上升 %6。证券行业在
2022 年营收下滑的背景下,在信息技术的投入上实现同比 %
6 众安保险 2022 年年度报告,
attachments/1512617/
32
的高速增长,体现证券行业对于科技竞争力的高度重视
7
。
在对智能化技术的接受程度方面,相关调研报告
8
显示 2022 年 58%
的金融机构认为人工智能技术对其发展非常重要,与 2021 年同比上
升近20 个百分点;36%的金融机构反馈智能应用显著降低企业成本,
比 2021 年提高 8 个百分点,体现出智能化理念加速被行业吸纳,规
模化应用成效日益凸显。
在技术细分领域上,以深度学习为代表的新一代人工智能技术的
整体应用普及度开始大幅超越传统机器学习,其中自然语言处理技术最
为领先。智能对话技术从早期上下文场景相对单一的客服和催收领域起
步不断演进提升,2022 年开始越来越多地运用到营销领域以及机构内
部的员工服务方面。中国平安 2022 年9AI 坐席的服务量同比增长 26%,
覆盖 82%的客服总量;AI 坐席驱动产品销售规模同比增长28%,占
整体坐席销售规模的 %。工商银行业界率先推出数字员工运营管
理平台,创新推出工晓伴、工小智等数字员工为通用办公和各个业务
条线的员工提供智能化、自动化、高效化的服务。
(二)应用质效不断提升
经过多年的快速发展,智慧技术产业生态和金融行业的技术运用能
力不断成熟,推动着各类识别、预测和应答模型准确率持续上升,
7 国金证券,行业深度研究报告《金融科技板块小结:2022 年韧性较强,2023 年回暖明显国金证券》
8 nvidia 发布调研报告:2023 年金融业最关注的 4 大 AI 方向,
industry-ai-survery/
9 中国平安 2022 年年度报告,
33
同业务流程的耦合程度愈加紧密,系统化场景支撑能力越来越强。
1. 精准度不断提升
金融行业各类模型的准确率和有效性是智慧金融质量水平的重 要
标志,金融机构综合应用多种手段不断提高模型的识别和分析能力。一
是在数据和知识的运营方面,基于高质量场景数据的积累、持续的 数据
标注工作和领域知识库的构建,通过迭代训练推动模型能力的提 升。典
型的如风控场景下的卫星遥感影像识别,不论在农业还是工业 场景,遥
感模型的识别物体的种类越来越多,识别准确率持续提高; 在智能客服
领域,对话模型的意图识别能力不断提升,金融产品知识 不断丰富,一
次性解决客户问题的比例节节攀升。二是改进升级建模 方法以提高对信息
的挖掘和分析能力,代表性的有知识图谱建模在风 控场景下有效使用,图
像融合自然语言的多模态技术对于复杂单证和 文档中要素识别能力的强化。
三是通过开拓和整合多元数据要素来扩 大数据维度和规模,实现更加精准
的营销和风控。企业内部数据治理 和共享机制的深化、外部数据要素流
通体系的完善不断打破数据孤岛, 降低数据壁垒,为智能分析和决策水
平的持续提升提供可靠和充分的 数据基础。
2. 融合度不断深化
模型识别和预测的准确性的提升,为业务全流程的自动化打下坚
实的基础。金融机构深度融合智能技术和业务流程,2022 年进一步推
34
广 RPA+AI10应用,将更多的复杂和非结构化的智能数据处理和分析
任务融入业务流程中,达到端到端的自动化,在贷款、金融市场交易、投保、
理赔等业务场景中,实现人、机、数的深度融合和立体化优化, 有效提升
客户体验并节省人力成本。得益于大数据和计算基础设施的能力建设,
数据集成和算法分析的实时性能均有显著的提升,推动着决策智能技术
更加紧密的参与实时业务流程。例如在智能风控场景, 金融机构积极开
展从事后向事前、事中的风险控制管理的拓展,有效提升风险事前预警、
事中干预和事后核查的全链路能力。
3. 多样性不断延申
智慧金融的高质量发展,优质丰富的企业内外领域数据和体系化的
场景赋能规划越来越成为差异化竞争的发力点。同企业数字化转型的宏
观目标相结合,金融机构提出数字营销、数字风控、数字运营、数字资
管等理念,强调在智能技术的基础上,从应用板块视角全面提炼和整合
数据要素,贯通式的提供智能产品能力和解决方案,将智能应用水平提
升到新的高度。例如,数字营销以 360 度客户画像为核心, 力争通过内
部和外部生态的数据联动进行全面的客户洞察,再按照各个触客场景和
渠道的特点形成微观客户分群,定向形成产品和服务营销建议和策略,
充分实现客户价值。
(三)应用成效显著增强
10 RPA(Robotic Process Automation)机器人流程自动化:一种通过软件机器人模拟人与计算机的交互过
程,实现工作流程自动化执行的技术应用。
AI(Artifical Intelligence)人工智能:利用计算机或其他控制的设备,通过感知环境、获取知识、推导演
绎等方法,对人类智能的模拟、验收或拓展。
35
2022 年金融机构持续强化科技赋能,深化数字赋能运营服务,防
范化解金融科技风险,持续推动普惠金融可持续、高质量发展。
1. 数字运营能力提升
金融机构变革其传统商业模式,积极运用先进技术创新业务模式,
加强数字化和智能化赋能水平。一是在服务质效方面,加快大数据、
人工智能、物联网等技术运用,显著提升金融服务的质量和效率,节 省
金融服务的人力成本。如建设银行运用 RPA 等智能技术提升集约化工
作质效,全年节省 439 万个工时;工商银行在智能客服、智能营销等业
务场景,利用语音识别、合成等技术,加快“技术换人”场景 应用,全年
释放超过 万人年工作量。二是在客户体验方面,积极采用“智能+人
工”、“线上+线下”方式,构筑全场景、全渠道的客 户服务体系,全面提
升客户业务办理及服务的自主性和便捷性,实现 对客户行为和所需的毫
秒级响应。
2. 数字风控能力加强
当前,数字化转型已成为金融业竞争发展和未来角逐的关键之处。
为加快信用管理数字化转型、强化信用风险精准防控,金融机构积极 运
用金融科技,优化部署风险模型策略,提升风险识别、分析、预警 能力,
助力信贷业务高质量发展。例如平安银行聚焦智能审批、智能 放款、智
慧贷后、智能控制、智能预警、智能分析和智能监控七大智 能场景,充
分运用大数据、人工智能、区块链等前沿技术,打造智慧 风控平台,提
升贷后工作效率约 50%。网商银行借助人工智能、图像识别等技术,推
出“百灵”智能交互式风控系统。该系统依托多模态
36
识别技术和大规模预训练,可实现各类凭证的识别,试运行期间“百灵”
已帮助超 200 万小微商户获得信贷额度提升。
3. 普惠金融广度拓宽
随着数字时代的到来与金融科技的发展,“科技引领,数据驱动”的
数字技术与金融产业深度交织,推动科技在金融普惠发展方面取得积极
成效。一是助力乡村产业可持续发展,在农村金融领域,积极运用大数
据、卫星遥感、人工智能等数字技术,高效识别农作物种植情况、畜牧
养殖情况,有效破解农业授信、抵押等难题,有助于金融机构给予农
户精准的信贷支持。目前,金融机构已围绕乡村振兴,打造诸多普惠
金融产品,助推金融普惠发展进程,如工行“兴农通”、建行“裕农通”等。
二是打造便捷、安全的服务体验,针对老年客户等特殊群体,利用数
字化技术完成对智能机具、手机银行等产品的适老化及无障碍改造,
通过多层次的服务供给满足多样化的客户需求。
二、银行业智能应用
(一)产品创新
1. 招商银行创建招银智库,有效解决投资研究面临的外部数据
源繁杂、口径差异大、系统繁多等问题。
“招银智库”是关于宏观经济、区域经济、行业研究、资产及配置
研究的数智化平台,通过沉淀研究数据、逻辑和框架,形成全面实时
的数据服务和便捷有效的分析工具,提供包括宏观经济研究、区域特
色分析、产业链条穿透、行业龙头跟踪、大类资产配置等内容在内的一
站式服务。
37
技术创新层面,该平台通过统一数据规范、提供标准化数据服务接
口与丰富的领域数据库;同时利用各类机器学习模型和自然语言处理技
术(如实体链接、实体识别、情感分析和摘要抽取)等方法,提取文本
有效信息,聚合资讯观点;聚焦投研算法,应用因子模型、定价模型和
资产配置模型,为用户提供多维度、精准的投资分析和决策。
招银智库利用数字化及智能化手段扩大研究触达半径,提供一站
式专业投资研究服务和在线定制细分场景智能服务,日均新增研究报
告超千份,将“科”和“研”的支持注入“投”、“商”、“私”的业务场景,赋
能全行多条线业务,共享专业投研成果。2022 年底,招银智库(原名“天
仪 R+”)获得粤港澳大湾区金融创新成果优秀应用案例一等奖。
2. 网商银行“大雁”数字供应链金融系统,行业图谱驱动产业金
融创新。
大雁系统是网商银行基于核心品牌企业、上下游供应商、经销商、终
端门店之间的供应链生产关系,开发的一套数字供应链金融解决方 案。通
过合同贷、采购贷、网商贴、票据付、回款宝、分月付、加盟 商贷、发
薪贷及云资金等一系列数字金融产品,解决供应链上面的小 微企业在供
货回款、采购订货、铺货收款、加盟、发薪等生产经营全 链路的信贷需求,
以及综合资金管理需求。从 1+N 进化至 1+N²模式, 大雁系统依然重视品
牌企业在组织供应链运行中的核心价值,但不再 与品牌企业的信用强行
捆绑,而是把每家小微企业作为一个新的中心, 发掘这些小微企业背后
链接着的更多小微,继续服务于他的上下游,
38
把数字金融服务带给 N²量级的小微。
该系统基于大规模图计算及数据处理技术识别企业关系,生成作
为企业信贷数据大底盘。通过图计算及数据处理技术,根据品牌及小微
企业授权提供的转账、发票、银行流水等交易证明,分析小微企业的资
金往来网络,还原出供应链贸易关系网络,构建行业的知识图谱。基于此
贸易关系,预测信用风险,从而给用户做增信、提额、定向支付以及反
欺诈、反套现等风险防控策略。这套系统呈现出动态时序异构的特征,
可以根据客户贸易关系的变化情况,动态实时地更新。在实践中过程中,
也证实与核心企业相关联的小微确实都是信用更为优质的群体。
大雁系统提升贷款可得率和解决资金管理难问题取得了显著成
效。借助“大雁”系统,下载支付宝或网商银行 APP,经销商不需要去线
下网点开新户,解决了异地贷款麻烦的难题。在“大雁”系统的助力下,
核心企业上下游的小微商家贷款可得率从 30% 提升至了80%,尤其
便利了金融服务相对薄弱的三四五线城市、中西部地区的小微企业。
通过“大雁”系统,公司为品牌企业提供“收、管、付” 全面的行业数字化
金融方案,企业资金管理人效大幅提升。原来 1 个
人只能处理 10 家加盟商的资金往来,现在 1 个人能同时处理 1,000
家,实现资金归集智能化。
3. 工商银行依托智能虚拟仿真平台应用,新建虚实融合交互服
务群组,建立企业级虚实融合交互平台能力。
工商银行建立企业级虚实融合交互平台,为总分行各类应用系统,
39
12
13
业务需求提供虚实融合场景研发框架,运行时平台支撑。该平台包含
运行引擎与支撑服务、数字人引擎、内容生成、研发工具、场景模板、运
营分析能力、跨端支持七项功能,可在各场景应用实践,如虚拟网点、
行内办公等。基于企业级虚实融合交互平台,工商银行软件开发中心联
合河北、上海、安徽、山东等分行,成功落地试点元宇宙网点、元宇宙展
厅、元宇宙政务大厅等多个案例,在这些案例程序版本基础上,其他
分行可根据自己特色需求,通过适配改造,即可快速上线元宇宙场景。
工商银行基于三维重建、LayaAir11引擎等新一代前沿技术,推出
同业首家元宇宙网点。该元宇宙网点参照雄安容城支行旗舰网点一比
一打造,集成NFT 数字藏品寻宝、大屏播放视频或广告功能,用户
通过 H5 轻量级入口(微信扫码)进入,进行身份认证后即可参与
NFT 数字藏品寻宝,也可游览网点、观看视频,用户线上寻宝集齐 3
个 NFT 数字藏品后可一键分享到朋友圈,同时可去线下网点进行兑
换礼品。
4. 农业银行使用计算机视觉深度学习 AI 技术赋能乡村振兴。
农业银行以乡村振兴领军银行的担当,通过为乡村振兴科技赋能。
在智慧畜牧场景方面,基于深度神经网络架构的算法构建牛只计数模
11 LayaAir 是 Laybox 2016 年发布的全平台 3D 引擎产品,拥有全工作流高效开发环境,支持 2D、3D、
VR 与 AR 产品的开发。
12 NFT(Non-fungible token)非同质化代币:区块链网络里具有唯一性特点的可信数字权益凭证,是一
种可在区块链上记录和处理多维、复杂属性的数据对象。
13 H5:HTML5,是构建 Web 内容的一种语言描述方式。
40
型以及牛脸识别模型,并结合边缘设备,通过“云+边+端”解决方案, 实现
对牛只数量实时动态监测,模型识别的准确率超过 95%,在不增加识别成
本的前提下,成功将牲畜测算识别耗时从“天”降低到“秒”。同时应用模型迁
移学习技术,将 AI 牛只计数模型进行微调,应用于其他如猪、羊、梅
花鹿、鸡等农畜家禽的识别。目前 AI 计数模型已经在河北、长春、大
连等 10 家牧场落地,极大提升了对于畜牧的盘点效率。同时,为降低
资产被调换或者二次抵押的风险,团队通过深度学习算法提取牛只特征,
将牛只变成信息标签化的“数字牛”,建立牛只数字化“终身档案”,确保抵
押牛只唯一性。通过智能化手段, 解决农产品活禽活畜押品管理困难的挑
战,降低畜牧抵押业务风险, 助力农行服务乡村振兴创新金融产品提质
增效。
(二)客服营销
1. 招商银行秉持大财富战略,建立 AI 小招智能助理,助力普惠
金融,着眼于满足实体经济不断升级的融资需求和居民财富持续高涨的
配置需求。
AI 小招智能助理项目以“大财富管理”为工作主线,建立以客户为中
心的资产配置能力,依托手机银行 APP 进行交互,着力解决单纯销
售导向、产品结构不合理、服务触达能力不足等问题。AI 小招以专业
财富能力作为大脑,串联投资、社区、现金流等各个财富管理相关的
业务主题,融入社区、投教、资讯等动态知识。
技术创新层面,基于语音识别、意图识别、金融知识图谱、智能
交互、智能投研等技术,打造拥有流动性预测、风险偏好分析、投资
41
决策、智能推荐、智能会话交流等多个智能引擎的 7*24 小时在线理
财智能顾问服务,加快“人+数字化”经营体系建设,强化网点、网络
经营服务中心与手机银行 APP 等各渠道间的有机协同,提升断点经
营能力,狠抓服务质量和体验,织就一张从陪伴到专业投顾的全天候
服务之网,2022 年 AI 小招累计服务用户超千万。
2. 工商银行打造数智交易体系,探索资金交易智能化转型。
随着数字时代到来,工商银行积极探索包括机器学习、自然语言处
理以及量化模型在资金业务的场景化应用,打造全链路数智交易体系,
为提升交易效率、降低交易风险、推动银行间市场智能化转型:
一是市场研判方面,基于机器学习算法构建汇率、利率行情趋势预测
模型,结合量、价以及舆情等因子为交易员提供分钟级预判,提升对
市场整体趋势的把控能力;二是在交易处理环节,利用量化模型开展
持续做市交易,为市场提供优质流动性,并基于自然语言处理实现智
能对话询价交易,大幅度提升对同业客户需求的响应速度和服务能力;
三是在数字化业务运营方面,尝试基于市场情绪、趋势以及头寸持仓 综
合判断进行价差调整,实现更加智能化的交易风格切换,快速响应 市场变
化;四是在风险合规方面,利用时序数据库技术,实现对行情、 订单、成
交等业务数据的实时监测和分析,帮助交易员及时发现和处
理可疑交易,守护交易安全。
目前数智交易体系已经覆盖包括汇率、利率、商品等业务品种,
场景化应用超过 100 个,在外汇交易中心等主要银行间渠道开展业务。
截止 2022 年,各业务品种数智交易规模占比已达到 30%~70%,
42
14
部分交易模式占比接近 100%,平均交易响应速度提升一倍以上,已
经形成工商银行在数字时代保持同业竞争力的强有力引擎。
(三)运营管理
1. 工商银行卡专业条线利用金融大数据架构的企业级数据驱动
能力,实现数据驱动重塑数字化运营全流程。
为深入贯彻落实建设“数字工行”战略部署,工商银行卡部依托金融
大数据架构中“数据中台+即时 BI ”等引擎,打造“银行卡智能数字分
析管理平台”,打通总分行、部门间报表数据壁垒,以交互式报表形式,
支持业务动态观测客户多维运营指标,实现对重点客群目标清单进行可
视化跟踪,帮助业务获得信用卡全生命周期的业务洞察。
平台紧密围绕业务经营战略,形成战略解码、任务分解,指标跟 踪、
横向可比,业务洞察、逐层钻取,商机挖掘、清单打通,锁包跟 踪、动
态监测,预警提醒、直达一线的体系化闭环思路和赋能业务发展的标准路
径,帮助管理人员和业务一线高效掌握核心指标“怎么样”,洞悉业务“为什
么”会这样,以及围绕重点任务要“怎么干”,执行 后“干得怎样”,进而助
推业绩提升。
2022 年自助上线 180+张看板、报表及清单,赋能业务发展标准
路径,提升工行卡条线数字化经营决策水平。
2. 建设银行构建货币市场交易机器人,智能分析交易对手方需
14 BI(Business Intelligence)商业智能:用来帮助企业更好地利用数据提高决策质量的技术集合,是从大
量的数据中钻取信息与知识的过程。
43
求,自动执行交易询报价流程,显著提升交易磋商效率。
“货币市场交易机器人”是建设银行助力金融市场交易业务数字化转
型的有效探索。借助自然语言处理技术,建设银行构建“货币市场交易
机器人”,支持模型自动识别交易对手的交易意图,抽取产品、金额、期
限等交易要素,并实时查询预先设定的交易策略,检验可交易品种、资
金量、交易价格等信息,智能磋商并生成交易意向确认单, 由交易员人
工审核后完成交易。
通过机器人智能磋商形成交易意向单,再结合少量人工审核操作
的模式,可显著提升业务规模,减少人为差错,目前已实现金融市场
交易 95%的渠道由机器人促成交易意向,缩短交易时长约 90%;磋商响
应时间降至秒级,显著提升交易高峰并发时段业务处理能力,节省交
易双方磋商时间,实现无人值守智能处理,将原本繁琐的交易询报价
操作极致简化,极大提升交易磋商效率。
3. 建设银行构建金融影像识别产品,实现配置化、高精度、多样
式的金融影像识别能力,提升票据识别质效。
当前,银行内部票据识别需求呈现出数量众多、同质化严重的趋 势,
跨部门、跨单位的需求也在不断增加,面临需求支持周期长、支 持场景
覆盖度较低的挑战。为进一步提高服务交付敏捷度和服务质量, 建设银
行提出由人工智能工程化向产品化演进的目标。通用采用智能 影像技术,
建设银行构建金融影像识别产品,将通用影像识别流程进 行拆解,并内
置多种识别模型和识别模板。支持业务人员在产品界面 以所见即所得的方
式快速体验,实现配置式、零代码的敏捷交付能力,
44
支持高精度、多形态的复杂图像识别场景。
金融影像识别产品的应用,是建设银行人工智能能力从工程化迈向
产品化的有效实践。通过产品内置模板和模型,已实现 87 类票据的高
精度识别,能直接支持超 80%的行内新增影像识别需求;将原需求实现
周期从 4 至 6 个月降低至一周左右,将原多部门协同的项目支持方式转
变为以业务部门主导的需求验证和配置方式。同时,通过简化需求侧的
工程化支持难度,让算法工程师能聚焦打磨模型能力,实现现有票据整
体识别准确率达 95%。此外,金融影像识别产品联动建行人工智能平台
的数据回流和自学习流水线技术,实现产品影像识别准确率的持续自迭
代提升。目前,金融影像识别产品已在建行财务、柜面、信贷、国际结
算等业务领域取得显著成效。
4. 交通银行多模态融合应用于计算机视觉。
为实现提质降本增效,交通银行在单证录入及核对业务中广泛采
用OCR技术。然而由于部分单证版面各异,传统OCR技术在此类场景
的自动识别存在较大困难。以托管对账单为例,交通银行的资产托管
估值业务在日终后基金经理会与各基金管理人根据各家基金公司的
对账单进行录入核对,这些对账单的版式存在较大差异。
为此,交通银行引入了多模态等人工智能技术应用于计算机视觉
领域,该技术融合视觉、语义、布局排版等多模态信息,打造了丰富的
视觉物料库、高效的视觉融合能力、精准的特征提取能力、复杂业务
场景适应能力,以支持低样本量训练、版面各异的单据识别、复杂文档
还原、智能结构化等多种功能,并实现图文跨模态理解与生成能
45
力,催生孵化数字新业态、新模式,切实提质降本增效。一是极大提
升了业务场景的识别率,融合不同模态的信息增强模型的鲁棒性,相
比传统OCR技术识别率上升15%。二是增强了模型的泛化能力,针对
新样本的识别率为87%。三是提高了工作效率,减少了人工操作和干
预、降低了66%的识别耗时,提供更加便捷的服务,从而提升了用户
体验感。
5. 招商银行创建智能录审平台,以实现智能替代和自动作业,提
高票据审核效率。
银行票据审核业务繁杂,涉及票据种类繁多,审核规则差异性大, 须
花费大量人力和时间进行不同场景的单据审核。智能录审平台集成规则
引擎和专家知识图谱管理,底层基础算法依托于人工智能实验室的 AI 能
力,包括 OCR、NLP、ASR15、知识图谱、知识库等技术,构建智能审
录相关模型,将科技、数据、流程及制度进行高效整合,打造智能分类、
智能录入、智能提示、智能审核等多个组件,支持用户根据不同业务场
景完成专家知识维护,并实现机器辅助和替代人工审核,完成各类场景
快速上线。
2022 年智能录审服务 40 多个场景,提炼审核规则 4000 多条。通
过智能替代和自动化作业,实现全行各类复杂业务的智能审核,提升
集约作业柔性和弹性,逐步迈向智慧化集约运营。
(四)风控合规
15 ASR(Automatic Speech Recognition)自动语音识别:旨在将人类的语音中的词汇内容转换为计算机可
读的输入,如:按键、二进制编码或字符序列。
46
1. 工商银行基于多技术协同融合,开展信贷档案智能识别监测,
提升信贷监测质效。
为打造信贷档案智能识别监测新模式,帮助信贷风控人员降本增
效,工商银行积极发挥数据、技术双要素价值,应用 OCR+NLP 组合技
术开展信贷审批书、账户监管协议、合同比对等多场景智能识别处理,
改变以往需要人工查阅文档、识别风险监测关键要素的做法,极大减
轻人工工作量。同时也有效拓展信贷风控的业务覆盖率。该场景作为工
行在信贷风控新技术创新领域的典型应用之一,被认证为“科创中
国”2022 年度金融数字化转型优秀案例。
基 于 OCR 和 NLP 技术,工商银行构建全新的信贷档案智能识别
监测模式:一是对信贷档案关键要素进行识别、抽取,缓解作业监督人
员人工查阅信贷档案人力投入多、人工判断经验差异大、效率较低等问
题;二是在信贷档案关键要素识别提取的基础上,关联其它已积累的结
构化数据,构建信贷项目资金流监测等模型,帮助业务人员聚焦疑似
风险项目,进一步提升贷后风控效率。
对信贷审批书中的相关业务关注要素进行自动识别,准确率达90%
以上,其中试点分行在维持现有人力的情况下,业务覆盖率提升约
80%。同时该模式还在对账户监管协议、发票等信贷档案的识别应用中
成效显著。
2. 建设银行构建“舆情神投手”,全时段实时分析互联网舆情信
息,提升风险管控效率。
传统舆情分析需耗费总分行相关岗位人员大量时间与精力,每条
47
风险舆情都要下发至所有一级行、二级行、经办行,最终由经办行客
户经理完成分析,判断风险舆情是否影响到管辖客户以及涉及业务余额。
建设银行依托深度学习神经网络和机器学习技术,构建“舆情神投手”应
用,支持对供应商推送的公共信息的实时自动处理,通过主题识别、情
感分析、风险事件分类,筛选出需要关注的含经营、管理层、财务、
行政处罚、司法、资本市场、信用等 7 大类 59 小类的风险舆情,再根
据客户归属关系、关联关系图谱、风险敞口情况,将风险舆情推送给
客户管户权经理、业务权经理、经营主责任人,并根据风险敞口级别,
逐级上升报送至各级,实现 7*24 小时不间断自动分析。
“舆情神投手”改变了传统的自上而下的人工排查的方式,通过 人工
智能技术实现舆情风险的全时空监控和预警,实现高效消息触达, 显著
提升舆情风险管控效率。
3. 招商银行构建融合对公和零售的联邦式知识图谱,依托复杂
关联关系,全面丰富零售对公客户画像,高效赋能营销和风控领域建设。
招商银行构建融合对公和零售的联邦式知识图谱,对行内外数据
进行整合,并融入行内精品资产数据,依托复杂关联关系,全面丰富
零售对公客户画像,高效赋能招商银行的营销和风控领域建设。招行智
网涵盖 亿个实体(包含对公企业、零售客户等)、 亿条边,
这些实体间的关系分为对公关系、零售关系和事件关系三大类(18 个小
类),全面刻画公司对公司、公司对个人和个人对个人之间的关
48
联关系。在对公营销场景中,打造交易链知识图谱,立足招商银行总
分行战略客户与价值户,基于千万条交易关系,从优质客户的上下游
着手,盘活存量客户并拓展新客,深入挖掘潜在对公营销商机。在零
售营销场景中,以客户转账、业务申请和协议数据为基础,旨在聚焦
客户关系,深入挖掘其背后的业务价值。招行智网共上线私钻、小微、双
金和零售信贷黑名单四类查询接口,通过客户关联关系挖掘,持续寻求
营销商机,月均调用 100 余万次,在一线业务应用上取得切实效
果。在风控场景中,招行智网主要应用于反欺诈场景,通过聚合与核
心客户相关的各类关联关系,建立客户风险特征信息库,融入风控模
型,持续提升整体风控效果。
4. 网商银行“百灵”小微个性化智能交互式风控,探索人机互动
信贷技术,服务百万用户。
基于对银行信贷风控的深刻理解和小微经营者的了解,网商银行
推出百灵智能交互式风控系统,,它如同一位数字化的客户经理,7
×24 小时在线,可以与客户自动交互,接收客户自主上传的经营流水、
账单等相对结构化的资料,还能处理合同文本、店铺照片、卡车照片等
非结构化的信息,多模态综合分析,根据客户真实的经营需要, 给予精
准的额度,极大的提升了客户满足度与适配性。
通过在风控全链路中大规模应用人工智能,实现通过人机对话、
图像识别、语义理解,了解并识别用户的信贷诉求、经营状况,智能化
判断风险水平,为其自动精准匹配贷款产品、额度及信用成长路径。
有别于传统的人工审核,全域智能交互式风控可以理解针对单个
49
客户的个性化资产和诉求,将计算机视觉、动态企业图谱、人机互动等
技术应用于小微信贷领域,通过多模态信息抽取和自我监督学习, 识别
和解析小微用户非结构化资产,对小微个体的经营要素和经营关系进行
认知增强,深度还原经营要素,提供全面的评估视角,全程零人工参与。
在面对复杂的小微金融场景时,使得网商银行能够更全面、精准还原小微
的真实资产和经营状况,让很多原先不联网,风控系统看不见的资产,
能够被理解和看见,在帮助小微资产实现数字化的同时,也使得我们能
依据这些数据为其提供更高的额度,能让用户获得超越传统信贷员的,
个性化、千人千面的信贷体验,就像在手机里拥有一位 7*24 小时的 AI
信贷员,用户自行提交材料,AI 信贷员进行识别、审核,完成提额。
目前百灵突破数字信贷“他证”模式,用户有选择性地提交材料,掌握对
自身信息的主动权,支持超过 70 种自
证任务,上线以来,已服务超过 600 万小微经营者。
5. 农业银行搭建隐私计算金融网,助力金融领域数据价值安全
释放。
农业银行通过构建面向境外分行的隐私计算金融网,解决集团境
内外机构联合统计难题。基于多方安全技术搭建面向境外分行数据的多
方隐私计算基础计算底座,相较于“多方安全求交求和”会丢失部分非共
同客户数据的情况,创新性提出基于哈希的“多方安全求并求和”解决方
案,既满足全量结果统计的需求,又满足“境外分行原始数据不出域”的
要求。以“境外分行多方安全监管报送”场景为试点, 实现全球 10 余家境
外分行跨境数据的安全汇总,有效解决跨境数据
50
的“保密性”与“共享性”的问题,依托该境外分行隐私计算网,为今后跨
境数据安全共享作出示范。
农业银行通过构建面向分行跨机构的隐私计算网,助力跨机构电 信
反欺诈精准识别。融合区块链与隐私计算技术搭建安全可信、隐私 强化
的数据流通基础设施,有效支撑多家银行与机构之间的数据共享, 实现
黑灰名单核查、精准阻诈等实时/批量统计功能。基于 30 余家商业银行
多方安全统计账户风险,联合运营商进行横向、纵向的联邦学 习联合建
模,进一步提升风险账户识别精准度,提高基于高频大数据 精准动态监
测的预警水平,增强风险多渠道态势感知、综合性分析评 估和差异化处
置能力。此项目所构建的多方数据分析联合实验室平台 覆盖多家银行和
机构,是至今国内运用“区块链+隐私计算”技术规 模较大的生产级应用案
例,在国内具有首创性与先进性。
三、保险业智能应用
(一)产品创新
1. 平安产险首创融合“地球科学、人工智能与保险大数据”多维框
架,打造鹰眼系统 。
为应对气候变化风险和挑战,支持“十四五”国家应急体系建设, 打造
鹰眼系统 自然灾害风险管理平台,助力社会风险减量。该平台
聚焦于“防灾、减灾、救灾”全流程,构建系统全面的自然灾害风险管理
体系。该平台已完成建设并投入使用,目前仍在持续升级优化中。在自
然灾害方面,构建地震、台风、洪水、暴雨、冰雹等多种灾害的识别和
预警能力,为业务提供全方位的地质与气象灾害保障
51
服务;同时利用数值模式识别短期天气和长期气候风险,助力保险行
业应对气候变化挑战。在数据方面,建立标准化的自然灾害风险数据体
系,以安全高效的时空数据计算平台为基础,支持多源异构空间数据的
快速处理及响应,将不同地区所对应的气象数据与静态数据插值到不
同地区的经纬度中,通过调用标准天气气候预报系统计算,从而得到对
应地区的预测结果。基于人工智能技术,精准识别卫星雷达等遥感影像,
服务智能调度、远程查勘、精准定损和快速理赔等多项场景。项目上
线后在历次灾害事件中均发挥重要的作用,截至 2022 年底,平安产险
为财产险、农险、车险等多险种客户减损数亿元,有效提升行业“保财
抗灾”的能力。该项目凭借自主可控的自然灾害风险管理体系和良好的
业务应用效果荣获中国人民银行金融科技发展奖二等奖。
2. 太平洋保险基于人工智能技术,打造“5A”数字员工,构建
智慧业务模式,为企业数智化转型提供范式。
太平洋保险“5A”数字员工,即自主性 Autonomous、适应性
Adaptive、全能性 All-around、专业性 Adept、责任性 Accountable,是
基于人工智能技术,以自主孵化的业务操作大模型“AssistGPT”为技术
底座,面向企业人员提供的人机协作终端。数字员工能根据用户指令,
解析得到任务意图,自主进行任务规划并完成任务执行,为用户提供多
样化的服务。数字员工实现对专业工种的建模,赋予数字员工思维能力、
行动能力以及职业能力,并做到与真实业务人员对齐,可作为私人助理,
提供日常办公、软件技能、知识问答、数据处理、专
52
16
业场景任务执行等服务。
数字员工可覆盖审计、财务、客服、营销、承保、理赔等多个保
险领域专业场景,解决实际场景任务的同时,有效填补人力空缺,提
升业务处理效率,优化公司整体运营和决策效率,助力太平洋保险数字
化转型,每年可节约人力 70%以上,提升作业效率 30%以上。
3. 泰康保险融合人工智能、物联网、机器人等技术,打造超级体
验式经营保险支持系统。
泰康保险融合国际领先的人工智能、5G 物联网、机器人、大数
据、数字孪生等前沿技术,构建智能传感器最多、科技业务融合最深、覆
盖场景最广的超级体验式经营保险支持体系,旨在通过线下实际场景
的产品体验连接前端保险产品和后端服务。
系统前端——依托沉浸式养康科技体验设备及主动式、智能化实
体机器人,实现用户产品体验、购买意向等超体经营数据和信息的自
动采集,并推送系统后台;
系统后台——通过 IoT 平台存储并分析多源异构的数据,实时
将客户体验、用户画像等信息提供销售端决策,实现产品精准推介、
营销话术推荐等销售闭环。
通过融合人工智能、物联网、机器人、大数据及 5G 等前沿技术, 该
系统为业务经营在产品沉浸体验与销售、上下游保险场景嵌入、保险产
品营销决策、保险培训与推广等业务场景提供服务,实现规范化、
16 IoT(Internet of Things)物联网:通过将各种信息传感设备与网络结合起来而形成的一个巨大网络,
实现任何时间、任何地点,人、机、物的互联互通。
53
智能化、数字化的沉浸式体验数据分析和智能化保险专业顾问的经营
决策支持。
(二)客服营销
1. 平安人寿积极推进数字化转型,以“智能拜访助手”重塑客户体
验。
“智能拜访助手”为保险行业首创线上智能会客应用,聚焦保险 业务
场景提供一整套音视频通话解决方案,支持代理人进行线上训练、通过音
视频方式与客户远程展业互动、讲解产品服务,线下智能面访 等服务,
将传统依赖线下面访的业务模式,扩展为“线上+线下”双 重联动,极大满
足多元化场景下的保险业务需求,成为寿险行业线上 保险服务的标杆性
平台。2022 年通过引入 AIGC 技术的应用,实现内 容的自动化生产,满
足代理人对客户的个性化与全面化的服务需求。在技术应用层面,打造
生成式的保险预训练大模型 insuranceGPT,并增加全新的应用场景。在
“2022 年 Efma-埃森哲保险创新大赛”中,
平安人寿作为 2022 年唯一获奖的中国企业,以“智能拜访助手 • AI
会客厅”斩获重塑客户体验全球铜奖。该项目不仅支持代理人线上会客
展业,还支持举办线上大型产说会和创说会,可容纳 300 人同时在线互
动,已广泛应用于 AI 面谈、智能陪练、数字营销等业务场景, 全面
支持代理人队伍开展增员、培训和营销管理。其中,在线互动过程,
基于不同代理人与客户之间的会话主题,形成不同会话主题对应的迁
移图,以建立最佳迁移路径。截止 2022 年底,平台月均使用人
次超 100 万+次,月人均经营客户次数近 20 次,线上次均拜访时长超
54
18 分钟,同比增长超 50%。
2. 太平洋保险自主研发海豚精灵智能客服,打造全渠道一体化、
智能化的客户服务平台。
海豚精灵智能客服,涵盖智能呼入语音客服、外呼机器人、智能在
线客服等多形态的智能交互应用。其中太保集团重点应用场景—
95500 智能语音客服,已通过智能接待、智能导航、场景机器人三大模
块实现全流程自动化服务,目前可支持报案、保单查询、惠民保等81 个
意图的导航服务,并个性化分流 VIP、亚运会、60 岁老人等特殊客群
需求,同时结合产险、寿险、健康险的高频服务场景建设 31 个场景机器
人,实现从快速受理到 7*24 小时自助处理。为持续加强智能化客户服
务赋能的广度和深度,海豚精灵智能客服已在寿险客服、产险营运的
智能外呼回访及通知场景中广泛应用,包括查勘回访、已决赔案回访、
临期保单通知等,有效缓解人工作业压力,提升回访覆盖率和问卷回收
率。
海豚精灵智能客服已推广覆盖承保、两核、营运、中后台等业务
环节中,2022 年调用次数达 亿次,问题解决率达 84%,实现部分
或完全替代客服、代理人、电销坐席等劳动密集型工作,达到人人提
效、人机降本,同时提升客户满意度、服务质量和运营效率。
3. 太平洋产险与太平洋科技合作研发智循电销名单分类产品,
建设自动化分类、精细化管理和智能化决策的经营平台。
智循电销名单分类结合静态的客户信息和动态的交互数据,运用
长文本预处理、关键词捕获及标签问题修复等 NLP 技术,实现客户
55
洞见及 61 类客户标签的半自动挖掘。通过对电销名单在智能外呼实
时分析和人工外呼离线语音分析两个环节的正向循环筛选,精准分级
客户的服务接受意向度,高效识别高潜客户,辅助业务团队实行有的放
矢的营销策略,使有限的电销坐席优先服务高意向客户,降低对低意
向客户的服务频率,在实现人效提升的同时保证客户体验。
该产品解决传统电销模式下,名单分类难度高、转化率提升受阻、客
户体验差等痛点,辅助管理和分配电销资源,提升电销名单转化率和人
均产能。相比传统的无差别电销外呼模式,智循电销名单分类可助力提
升 16%的名单转化率。
4. 泰康保险面向销售场景打造体验式销售支持智能服务机器人。
泰康保险以健康财富体验中心为核心场景,聚焦销售一线分公司需
求,打造实体销售支持服务机器人产品。该产品定制开发导览讲解、场馆
服务、养康介绍和交互娱乐四大类功能,收集 6 大类运营数据; 在多
个健康财富中心试点应用,提升场馆科技体验,助力超体经营。产品
主要价值:一是助力代理人营销:根据营销意图打磨导览话术, 遥控
器控制导览讲解节奏,培训版话术帮助新伙伴熟悉泰康企业文化和产品;
二是提升客户参观体验:更好的科技互动体验,主动语音交流,带领参
观场馆、回答社区业务问题,提供跳舞拍照等娱乐功能; 三是弥补大健
康体验中心无常驻员工的短板:负责迎宾欢迎,定时巡场宣传场馆活动,
收集业务数据,助力营销和场馆迭代。
(三)运营管理
1. 平安人寿基于人工智能技术打造“AI 跟拍”短视频经营工具,
56
形塑代理人团队 IP。
在全民短视频、流量为王的时代背景下,代理人正赴“短视频时代”
风口,尝试通过经营个人抖音号、视频号等打造专业保险代理人人设,
进行社交化、即时化的客户经营,扩大个人品牌影响力。然而, 专业短视
频制作面临拍摄门槛高、制作成本高、线上经营难等需求痛点,且存在
内容合规风险、代理人制作时间有限等问题,亟需官方有力高效的支持。
平安人寿打造短视频经营工具“AI 跟拍”,通过打造辅助代理人短视频线
上经营获客的平台,提供线上 3000+官方、合规、专业的内容模板,覆盖
保险通识、理财科普、健康养生等广泛内容; 通过虚拟真人、自动剪辑、
一键成片、自动字幕图文等 AI 创新应用降低短视频制作门槛,实现 1
分钟制作一条短视频;一键打通微信小程序、抖音、快手等平台辅助线
上经营,进一步作私域流量客户培育和公域流量获客。工具上线以来,
累计辅助超 37 万名代理人,完成
超 110 万条短视频的制作,赋能业务高质量发展。
2. 泰康保险基于平台化、智能化的设计理念,率先打造保险行业
两核业务智能化统一服务平台。
保险行业两核业务智能化统一服务平台覆盖保险全流程环节影
像识别、公司运营合规风控、业务线数字化采集等应用需求,是保险
行业首个两核智能化综合解决方案。平台主要提供医疗影像分类、医
疗影像质检、医疗病历深度结构化、客户健康评估 4 大核心功能:
(1) 医疗影像分类:实现包括医疗发票、门诊病历、费用清单
等在内的 210 余种医疗票据的毫秒级分类识别,重点支持核保、理赔
57
两大业务场景落地实施;
(2) 影像质检:对客户上传的影像进行识别判断,毫秒级甄别
图像模糊、褶皱、畸变、曝光、残缺、遮挡及 PS 伪造等问题影像;
(3) 医疗影像的结构化识别:通过采用国际领先的目标检测、
文本检测、文本识别、版式分析、基于图网络的多模态语义分析以及医
学知识理解等技术,实现客户医疗影像内容的数字化及结构化;
(4)模型预测能力:根据用户的体检报告数据和病历数据进行
用户核保结果及潜在疾病风险的预测。
截止目前,该平台已覆盖全国 36 家分公司核保及理赔业务,赋
能理赔、核保相关作业人员,极大提升核保、理赔时效。其次,审核
时效得以显著提升,数据采集的时效提升 420%,有效实现降本增效。
另外,其沉淀的海量结构化数据,也为保险业探索数据智能新应用提供
宝贵的财富,业务数据的结构化、标签化处理,将驱动用户画像管理、
个性化大健康方案等领域的深入探索和研究。
(四)风控合规
泰康基于 AI+关系图谱建设虚假理赔识别平台和理赔风险智能
侦查平台,全面赋能保险风险合规经营。泰康健康险虚假理赔识别能
力平台利用先进的虚假理赔智能甄别技术,融合集成图像识别、图分
析、自然语言处理等技术手段,形成完整的虚假理赔甄别服务,率先
应用于健康险理赔环节。智能图像识别技术可以自动识别理赔材料中的
图像信息是否存在伪造、篡改等情况,准确率达到 85%;自然语言处理
技术结合医学知识实现对理赔材料中的文字信息进行处理和分
58
析,识别出其中的不实就医内容和虚假病历信息;图分析技术则可以 对
理赔人员关系网络进行分析和建模,实现快速定位风险人群和团伙, 打
击黑产势力,完善保险反欺诈建设,切实保障用户合法权益。截止2023
年 5 月,平台累计输出健康险欺诈团伙累计涉案金额超过 2000 万元,
沉淀黑名单 2000 余个,输出欺诈线索阳性率达 97%。
泰康在线理赔风险智能侦查平台基于公司各主要险类理赔相关
数据,构建各险类社群图谱,建设理赔风险智能侦查系统。借助知识
图谱、影像OCR、信息抽取、机器学习、影像 PS 识别等技术,结合
业务专家经验,建设理赔反欺诈模型标签体系,实现可持续、自动化、智
能化理赔欺诈风险监控|预警|报告,实现事前、事中、事后反欺诈。
2022 年全年,识别各险种(包含车险及非车)高风险社群 700 余个,
高风险个人 3000 余人,涉及赔款 4000 余万元。
四、证券基金业智能应用
(一)产品创新
上海证券交易所通过打造“上证金融数据服务”和“星企航企业数字
化服务”等服务品牌,推进行业数字生态建设,提升服务实体经济质效。
为深入贯彻新发展理念、加快构建新发展格局,上交所秉持服务理念、
持续问需市场,不断整合数据资源、完善基础设施,通过
“上证金融数据服务”和“星企航企业数字化服务”等品牌向投资者、企业和
监管机构提供金融数据和应用服务,促进行业数字化转型、推进中国
特色现代资本市场建设、赋能实体经济发展。
“上证金融数据服务”通过自然语言分析、聚类算法等多种人工
59
智能技术,高效实现公告数据提取、信息披露同源发布、信息智能检
索和数据智能分析。例如借助热词发现及聚类算法,上交所与基金公司
得以快速挖掘海量文本中的关键词,基于上市公司定期报告成功构建
“双碳行业关注度”量化分析模型,用于判断上市公司所在行业的“双碳”
背景、自动构建行业双碳产业链节点,为助力“双碳”战略投资和行业
绿色低碳发展分析提供数据支持,取得良好效果。
“星企航”利用复杂网络重要节点排序算法、知识图谱模型等数
据挖掘与分析技术,打造数据查询和智能分析工具,构建拟上市企业、
上市公司、上交所、政府、服务机构等多方交互的数字生态体系。例如,
在企业根据自身情况自主填报数据后,后台通过大数据分析技术实现企
业与同行业上市公司、各板块上市标准对标对表,输出企业对接资本市
场的评价报告和针对性提升指引供企业参考。同时,星企航与上海市一
网通办、北京企业上市综合服务平台等多家政企平台实现对接,助力地
方政府培育地方企业、服务实体经济发展。截止 2022 年
底,星企航已与科技部火炬中心、工信部中小企业局及地方政府共 20
余家开展合作,对 5 万余家企业展开评价,获得各方好评。
(二)客服营销
1. 华泰证券基于客服机器人打造全新的 AI 投顾形象,为客户提
供千人千面式的专属投顾全旅程服务。
为满足用户在投资咨询、业务办理、选诊股、交易辅助、复盘、
账户诊断、配置建议及投后陪伴等投资全旅程需求,华泰证券依托自主
研发的涨乐财富通平台,构建全新的 AI 投顾服务模式,在统一的
60
对话式交互场景下,融入 AI 客服、财报小助手、AI 账户三大类特色
服务,为海量用户提供千人千面式的专属投资全旅程服务。
以平台科技一体化整合多业务链资源,打造了“人+数字化平台” 的
AI 客服,为客户提供投资咨询、业务办理一站式服务。其主要具备
两大特色:一是打破服务孤岛,串联智能机器人-人工客服-专业投
顾多层级服务能力,面对客户的个性化诉求,匹配不同的服务类型,
以 AI 机器人满足用户便捷化、个性化需求,以人工客服提供有信任感、
有温度的服务,以人工投顾覆盖客户复杂性、个性化金融需求, 为客
户提供“人+数字化平台”沉浸式的服务体验。二是融合咨询、业务办
理、金融产品查询多类功能,为用户提供一站式服务。通过 AI 识别用户
意图后,在统一的服务场景中为用户提供对话式的权限开通业务办理、
金融产品查询、资产分析与配置能力,有效解决用户的业务咨询和办理
诉求,提升用户体验。
财报小助手以 AI 为载体,依托华泰研究所专业能力的积累而打
造,可为客户提供投资研究领域的深度服务。其主要具有以下特色:
一是聚焦于财报场景进行问题分类梳理,如公司经营管理能力分析类、
公司指标分析类、财务数据类等,并针对不同类型的问题进行意图识 别
设计和多轮会话策略制定,以此向用户提供场景适配化的服务。二 是针
对客户的财报问题,通过智能对话和可视化图表的形式呈现,为 投资者
快速提供上市公司财务数据和分析观点,提供研究领域专业能 力的输出,
为客户提供可读、易懂的服务。
AI 账户通过对话的方式为用户提供四大核心功能,为客户提供
61
17
千人千面的账户类查询和投资建议服务,用 AI 提供更有温度的个性
化服务。四大核心功能包含:一是盈亏分析,提供了账户盈亏、单产
品盈亏以及业务类型盈亏的统计和总结;二是交易复盘,为客户提供
当日交易盈亏统计和市场复盘;三是资金查询与资产对账,包括资金
字段查询、资金状态检测以及资金与交易流水查询;四是账户诊断与配
置功能,提供了模型诊断、行为诊断以及闲置资金配置。
2. 国泰君安打造敏捷业务组装的全场景智能化超级证券 APP—
—君弘一站式投资理财智能客户服务 APP 平台。
君弘 APP 创新构建模块化大前端、组件式移动中台及端到端智能
服务,具备跨场景、灵活、动态的业务交付能力,全面应用移动互联网、
大数据、人工智能、信创等多种金融科技,以客户为中心,提供一站式、
个性化、差异化、智能化的投资理财体验,满足客户多层次、多品种的
投资理财需求,不断提升客户服务覆盖面及服务品质, 实现股票、期货、
期权、外汇、理财、两融、资讯、投顾等全业务、全场景的千万级用
户承载和个性化服务,为客户提供智能行情、智能搜索、企业图谱等
各类智能化工具产品。
2022 年君弘 APP 成为行业首家发布 T+0 交易专区的 APP,涵盖
模拟、行情、指标、交易、策略、日内做 T 收益统计、社交、投教等
一系列围绕T+0 交易相关服务,大幅提升客户数字化投资体验;首批
拿到养老金业务牌照,支持近 30 家银行卡通过资金账户行开立个
17 T+0:当天买入的股票在当天即可卖出。
62
18
19
20
人养老金资金账户,供客户选择的合作银行数列券商首位。
君 弘 APP 客户数三年内从 500 万跃升至近 4000 万,平台注册用
户量和活跃率排名券商第二,平台成果获得第七届证券期货科学技术奖
二等奖。
3. 国泰君安落地行业首家全栈信创网点,实现业务办理流程全
信创化。
国泰君安根据证券行业的业务特点,在网点打造能够提供客户进
行自助业务办理的智能柜员机。设备集成活体检测、人脸识别、语音
识别、红外感应、签字压感等智能化技术,并通过基于自建 CA 技术实
现服务流程无纸化,无需人工柜员就能进行业务受理。通过部署
VTM 设备,在传统的线上营业厅和人工柜台之间增加线下自助业务
办理渠道,支持客户在 VTM 设备上办理适当性双录、开户、交易权
限设置、业务办理、业务查询、销户类业务等近百项业务功能。国泰君
安运用 5G+SDWAN +云桌面技术,完成业内首家可组装式智慧网
点环境部署,实现在 1 天内完成智慧网点的网络部署和现场设备调
试,具备布点快捷、门槛低、随建随撤等优势,为公司财富管理转型、快
速部署轻型网点及数字型财富小店提供技术可能。
2022 年,国泰君安完成网点业务办理流程全信创解决方案。通过
18 CA(Certificate Authority)电子认证服务机构:构建一个证书认证体系,旨在保证数据的完整性和操
作的不可否认性,弥补无法手签所带来的法律风险。
19 VTM(Video Teller Machine)远程视频柜员机:一种通过远程视频方式来办理一些柜台业务的机电一
体化设备。
20 SDWAN(Software Defined Wide Area Network)软件定义的广域网:将企业分支、总部和多云之间互
联起来,应用在不同混合链路之间选择最优的进行传输,提供优质的上云体验。
63
21
22
对软硬件一系列改造,实现信创设备全替换、应用系统全适配、服务
渠道全覆盖,达到业务办理流程全信创化的目标,并且成功在营业部
落地。截止 2022 年,客户通过 VTM 办理适当性双录业务占比达到
99%;除适当性双录,个人客户通过 VTM 办理线下业务占比 40%,
VTM 已成为重要线下客户服务渠道,效率和成本优势明显。平台获
得 2022 年第三届长三角金融科技创新与应用全球大赛金融机构最佳
创新奖。
4. 国泰君安自主打造场景化、伴随式的智能在线客户服务平台
“君弘灵犀”,为海量客户提供全投资生命周期的智能线上服务。国
泰君安践行“AI in All”策略,基于深度学习、神经网络、知
识图谱等人工智能技术,自主研发推出场景化、伴随式在线客户服务
新模式,建设“人、货、场”深度融合的 2B2C 的智能在线服务平台“君
弘灵犀”,为海量客户提供更极致的互动体验,更自然的服务触达,更
智能的伴随式在线服务。
君弘灵犀是券商行业首家基于知识图谱的KBQA 投顾问答系统,
实现基于 A 股数据的智能化问答,有效提升智能客服机器人的问答能
力,服务于灵犀问答、在线视频直播,数字人等场景。君弘灵犀运 用 AI
技术,提供 20 多种服务场景,精准赋能服务个性化投顾式服务体系及企
微社群服务,落地投顾专业辅助机器人,围绕日常服务、客
21 2B(To Business):面向企业客户;2C(To Customer):面向普通用户。
22 KBQA(Konwledge-based QA)知识图谱问答:一种基于结构化知识库(即知识图谱)的智能问答方
法。即给定自然语言问题,该类方法基于知识图对问题进行理解,并根据问题理解的结果从知识图谱中查
找或推理问题对应的答案。
64
23
户资产、智慧办公等场景落地智能托管、智能提醒、语音快转等 10 多
项辅助工具,成功为响应人团队拦截 60 的客户咨询,提高企微曝光
量,助力推广员工企业微信。
2022 年君弘灵犀投顾问题解答率达 ,实现线上客户问题人
工服务替代率超 94 。平台荣获 2022 年度深交所创新研究课题二等
奖和上交所创新研究课题三等奖。
(三)运营管理
国泰君安首创数字化业务运营体系,助力客户服务的精准性和经
营管理的前瞻性。国泰君安借助大数据和 AI 技术,构建涵盖渠道、
产品、用户、活动的数据驱动的智能化业务运营体系,促进数据驱动
的业务流程自动化、决策智能化,助力客户服务的精准性和经营管理
的前瞻性。在行业内首创 3A3R 指标体系,实现互联网业务全数字化运
营,有效指导短名单精准营销,提升交易客户转化率,保障营销活 动效
果的同时减少营销资源浪费。通过构建企业级财富管理数据中台, 打造
全域数据集市体系、全域数据标准体系、4K 标签体系、线上运营策略
体系、客群经营报表体系、数字化风控体系,实现集团数据共 建共享,
有效提升数据服务能级,深度融合数字化运营场景,促进数 据驱动的业
务流程自动化、决策智能化,提升客群经营数字化洞察, 有力赋能中证
1000ETF、818 理财节、REITs 等重点项目。
23 3A3R:证券行业数字化财富管理指标体系,其涵盖用户生命周期的六个阶段,即感知
(Awareness)、获客(Acquisition)、活跃(Activation)、留存(Retention)、收入(Revenue)和传输
(Refer)。
65
国泰君安首家获评企业数智化能力成熟度体系(EDMM)-企业
数字营销能力优秀级(3 级),数字营销能力达到国内最高评级水平。
(四)风控合规
国泰君安打造集团穿透式一体化智能风控平台,推动风险控制向
数据驱动的主动式、事前、事中、自适应转变。国泰君安运用大数据、
区块链、机器学习、知识图谱、自然语言处理等先进金融科技,建立
服务于业务操作、专业风控、管理决策多层次的集团全面风险管理,
覆盖流动性风险、市场风险、信用风险、操作风险、声誉风险等全部专
业风险防控领域。在智能风控基础上建立风险预警计量引擎,全面提升
重大风险主动预判预警能力,推动风险预警关口前移,切实防范重大金
融风险隐患。风险预警计量引擎以模型为核心,依托公司大数据底座提
供的海量数据,通过全信创环境自研量化容器提供充足算力保障。量化
容器具有模型服务实时发布、计算资源弹性伸缩的特点, 打通指标采集、
模型代码编写、模型一键发布、配置预警策略、按时调度与预警信号生
成,能够有效满足业务对模型计算的算力要求,提高业务对风险预警的
处置速度。搭配数据管理与可视化报表,为风控人员进行风险计量模型、
估值模型、压力测试模型、风险监测预警指标等复杂指标与模型构建提
供灵活解决方案,有效简化业务人员的使用门槛,通过使用高、中、低
等各种频率数据,提供复杂指标的主动挖掘与监控、预警规则与压力测
试模型的配置管理与数据支持等多方面功能。当前风险预警计量引擎已
经构筑宏观、行业、利率、区域经济,产业链等多种类指标预警体系,
构建重点行业重大事件的风险穿
66
透画像,并提供多个不同金融产品多种市场模拟的压力测试模型,有
效提升预警预判工作质效,全面赋能风险管理高质量发展。
智能风控平台通过采用现代的风险预警计量技术以及智能化手
段,将风险管理能力和机制嵌入到财富、信用、机构与交易、投行等业
务流程的各个环节,实现风险监测、识别、预警和处置全流程一体化,
构建起集团多层次、全覆盖、穿透式的风险管理联防联控能力, 确保公
司合规风控水平和监管评级长期排名行业第一梯队。
五、总结和展望
基于银行、保险、证券行业的典型智能应用案例,可以提炼总结出
以下的应用方法论:一是以客户需求为导向,深入了解客户的特点和偏
好,设计更加个性化、差异化、智能化的金融产品和服务,提高客户满
意度和忠诚度。二是以场景化为特征,利用互联网、物联网、区块链等
技术,打造多元化的金融服务平台,实现金融产品和服务的在线化、移
动化、智能化,拓展金融服务的覆盖面和渗透率。三是以数据驱动为核
心,利用大数据、人工智能、机器学习等技术,对金融和非金融的广泛
数据进行收集、分析、挖掘和应用,提高金融决策的准确性和效率,优
化金融运营的流程和效果。四是以创新为动力,利用人工智能、区块链、
云计算等技术,创造新的业务和工作模式,如智能审贷、智能核保和理
赔、智慧创作等,提升金融服务的创新性和竞争力。五是以协同为目标,
利用人工智能、区块链、云计算等技术, 构建金融生态系统,实现 G 端
(政务)、B 端(产业)、C 端(消费) 三端的金融服务协同效应。
67
展望未来,金融科技正在迎来新一波的技术发展浪潮。2022 年 11 月,
OpenAI 推出的基于千亿级语言大模型的 ChatGPT 服务展现出色 的通用
任务解决能力,树立起人工智能技术发展的新里程碑。国内厂 商和科研
单位也在持续打造和不断推出对标产品,大模型研发和应用 呈现百花齐
放的态势。人工智能大模型技术将极大地加速金融业数字 化转型,有效
提升金融机构的市场竞争能力。一是在人机交互形态方 面,AI 大模型技
术解锁图、文、音的多模态综合交互能力,可以通过多轮次的高拟人化的
沟通,基于上下文不断深入理解用户的任务诉求, 为用户提供个人助理
式的信息和任务处理范式,将极大的提升用户体 验和服务效率。二是大
模型一专多能的通用能力,助力低成本地适配 具体场景的任务,极大的
提高人工智能技术的规模化应用能力。三是 大模型技术的生成式能力已
成为数字内容创作的新引擎,在信息的处 理以及内容的加工制作方面进
一步释放生产力,为数字经济发展注入 全新动能。
在带来机遇的同时,人工智能大模型技术的升级也对金融机构的
经营形成如下挑战:一是头部互联网公司和终端设备厂商将抓住交互体
验方式上变革的机遇,依托其技术实力和用户触点的优势展开新一轮产
品和生态建设上的竞争,可以预见在线产品和服务的用户体验水平将
迎来更高的标准,用户入口可能会出现集中化的趋势,这对金融机构
的自有渠道和自身的在线产品和服务水平会形成一定的压力。二是大
模型技术的研发是技术和资金密集型产业,金融机构在基础设施和人
才团队支撑方面也需要进行统筹规划。一般来说,大型金融机构
68
由于拥有海量的金融数据,应用场景丰富,宜引入业界领先的基础大
模型,自建金融行业、企业大模型,以及可采用微调形成专业领域的任
务大模型,快速赋能业务。对于将核心业务系统托管在大型金融机构或
可信第三方的中小金融机构,其业务应用场景较少,且数据、算力、
算法资源相对不足,可在监管许可的前提下,利用托管方训练资源开展
企业大模型训练;或按需直接引入基础大模型或行业大模型私有化部署
满足业务需求。三是新技术应用方面的风险,大模型生成式能力还存在
可控性差等问题,可能生成大量看起来合乎逻辑,但内容并非真实甚
至是捏造的事实,需要在推广使用过程中采取管理和技术相结合的方式,
不断提升科技治理水平,有效防范技术风险。
69
70
一、生成式 AI(AIGC)对金融行业的影响
(一)决策式 AI 与生成式 AI
决策式 AI 是指系统通过分析大量的数据和其背后的概率模型,
来理解数据中的模式和关联,并基于这些模式和关联,判断样本属于
指定目标的概率,最后做出决策。决策式 AI 于 2016 年开始大规模应用,
主要应用于推荐系统、计算机视觉以及自然语言处理等。
推荐系统中,决策式 AI 可以根据用户的历史行为、偏好和其他相
关数据,分析他们的概率分布,并预测用户可能喜欢的产品或内容。这种
分析和预测可以帮助推荐系统提供个性化的推荐,提高用户体验和满
意度。
在计算机视觉领域,决策式 AI 可以通过学习和分析图像数据中
的模式和特征,实现对象检测、图像分类等任务的智能化解决方案。
常见的人脸识别就是这方面应用的典型,终端设备根据所捕获的人脸
图像进行特征信息匹配,比对人脸特征库判断当前人脸信息是否符合
条件。
在自然语言处理中,决策式 AI 通过学习和理解大量文本数据的
语义和语法规律,让计算机理解、解释自然语言,在该类应用中最广
泛使用的为机器翻译,将文本从一种语言翻译成另一种语言,实现跨
语言沟通和信息传递的智能化解决方案。
除此之外,决策式 AI 在各个特定领域也有广泛应用,例如在金
融领域,决策式 AI 可以用于风险评估、投资决策和欺诈检测等方面。
通过学习历史数据和市场趋势,帮助金融机构预测风险,优化投资组
71
合,并识别潜在的欺诈行为。
生成式 AI 则是学习数据中的联合概率分布,并非简单分析已有
的数据,而是对所用训练数据进行演绎、创造、模仿形成全新的内容。生
成式 AI 通常基于生成对抗网络(GAN)等模型,主要包含生成器和
判别器。生成器用于生成与训练数据相似的内容,而判别器则试图区
分生成器生成的内容和真实数据。通过迭代训练,生成器和判别器
相互博弈,逐渐提高生成器生成内容的质量和拟真度。生成式 AI 主
要应用于文本类、图像类、音频类以及视频类等多媒体数据的快速生成,
人们只需输入问题需求,就可立刻获得基于庞大数据库推理所生成的
结果,大大节省时间、人力和资源消耗。
生成式 AI 与决策式 AI 的差异:简单来说,后者是基于某些数
据集中学习已有的知识,获得在某些数据集中进行优化的能力,仅有
数据处理的能力。而前者是生成一系列新的判断能力并且在新的数据集
当中进行应用,生成新的内容,是对数据的在生产,以达到创造的效
果。
(二)AIGC 的技术特征、要素与发展
1. AIGC 的概念
AIGC (AI Generated Content) ,顾名思义即由 AI 生成的内容, 是
一种新型互联网内容生产方式,随着技术不断进步,互联网生产方 式从
早期的专业生产内容 PGC (Professional Generated Content),由专 业人员
生产互联网内容,其特点是专业且内容质量高但面向客群单一; 再发展
到用户生产内容 UGC (User Generated Content),生产内容面向
72
互联网用户开放,用户可以自由实现内容生产,极大增加了内容的丰富
程度,但内容质量稂莠不齐;随着自然语言生成技术 NLP 与 AI 模型的
逐渐成熟,如今可由 AI 代替人工来进行内容生产工作,实现互联网
内容自动化产出。
与所有人工智能技术一样,AIGC 的能力由机器学习模型提供,
这些模型是基于大量数据进行预训练的大模型,如今以基础模型为驱动
的 AIGC 应用迭代速度呈现指数级发展,从由 Stable Diffusion 文生图
模型驱动的 AI 作画应用,再到以大语言模型(LLM)驱动的智能对话
机器人,深度学习模型不断完善、开源预训练基础模型的推动以及大模
型探索商业化的可能,都在成为这场人工智能颠覆性革命的主要驱动力。
2. AIGC 的产业链
AIGC 产业链是一个从上游到下游相互连接的生态系统,主要由
基础技术层、资源平台层、应用层三大层构成。
上游基础层侧重于基础支撑平台的搭建,主要由数据供应商、算
法机构和硬件开发机构组成。数据供应商利用网络爬虫技术从新闻网站、
博客和社交媒体中收集大量数据信息。然后,通过数据清洗、数据分
析及数据转换等技术处理这些野生数据,再通过 NLP 技术进行自动
标记或处理,数据质量越高,生成内容越精准。算法机构通常由具备
深厚的理论背景和实践经验人员组成,主要涵盖算法模型、基础框架、
通用技术等研究,优化算法模型以提高模型准确性,强化基础框架提升
模型的效率,深化通用技术以满足更多内容生成模式,实现
73
对实际业务的支撑与覆盖。硬件开发机构专注于开发专用芯片、处理
器、加速器卡和其他硬件设备,以加快人工智能算法的计算速度和响
应能力。
中游资源平台层主要为集成上游数据、硬件和算法的大型科技公司。
这些公司通过将这些资源集中部署,在云计算中设置计算资源并配置相
应的参数,如虚拟机、容器、数据库和存储,通过合理配置, 确保算法
的最佳性能和效率。接着采用独有优化算法进行封装,以对外提供服务
接口的方式运营。它们是连接上下游的桥梁,将数据供应商和算法机构
与内容创作平台应用和最终用户连接起来。此外,中游公司在推进
AIGC 技术方面也发挥着关键作用。他们将运营获取的资金投资于研发,
不断提高其性能和效率,实现 AIGC 产业的良性循环。此外他们还向上
游数据供应商和算法机构提供训练数据和用户行为反馈。
下游应用层主要由各种内容创作应用组成,其主要目的是降低用
户 对 AIGC 的使用门槛,将文本、图片、视频等生成算法进行封装部
署到资源平台层中,用户仅需要将自身需求提供给应用即可获取对应的
内容。例如,电商可以使用图片生成工具快速生成宣发海报,新闻媒体
可以使用文本生成工具快速生成报告。由于他们是这些技术产生的价值
的主要接受者,下游用户在促进人工智能技术的采用和商业化方面至关
重要。通过利用人工智能工具及其服务,下游用户可以提高生产力,增
强决策能力,并为各自行业的增长和创新创造新的发展模式。
74
3. AIGC 的技术特征与成熟度
AIGC 技术特征主要有自然语言处理、模型预训练、模型微调、
内容快速生成及多模态处理输出等五类。
自然语言处理(NLP):自然语言处理是实现人与计算机之间通
过自然语言进行交互的技术。该技术融合了语言学、计算机学、数学, 使
得计算机可以理解自然语言,提取信息并自动翻译、分析和处理。在此之
前人类只能通过一些固定模式的指令,如计算机汇编语言来与计算机进
行沟通。借助该技术,计算机能够识别和提取语言中的意图来实现对于
自然语言的理解。
模型预训练:模型预训练(Model Pretraining)是一种机器学习的
方法,用于在大规模的未标记数据上对模型进行预先训练。在预训练
阶段,模型通过学习数据的统计模式和语言结构来获取通用的语义和表
示能力,而无需特定任务的标记数据。经过预训练后,模型将具有较强
的语言理解和表示能力。预训练模型可以用作各种下游自然语言处理
(NLP)任务的基础,如文本分类、命名实体识别、情感分析等。模型
微调:模型微调的目标是通过在特定任务上进行有监督的训
练,使模型能够更好地适应该任务的特征和要求,在微调过程中,预 训
练的模型作为初始参数,并使用特定任务的标记数据进行训练,通 常由
人类专家进行特定标注的。通过微调,模型可以根据任务的标记 数据进
行参数更新,进一步优化模型的权重和偏置,以最大程度地提 高模型在
任务上的性能。微调允许在有限的标记数据情况下,利用预 训练模型的
泛化能力和学习到的语言知识,快速有效地进行任务定制。
75
内容快速生成:借助自然语言处理(NLP)和机器学习技术,快
速生成各种类型的内容,如文本对话、图像、视频、音频等。这些内
容生成系统可以在较短的时间内实现大量自动生成,提供高效的创作
和生产工具,节省时间和人力成本。
多模态处理输出:多模态处理输出支持不同类型内容的处理与转
化,如文生图、图片生成文本描述等。多模态处理旨在融合不同模态
的信息,从而提供更全面、丰富和多样化的输出结果,以满足多模态
数据处理任务的需求。
AIGC 作为一个新兴的领域,相关的技术和实践仍在发展中,目
前已有 3 个较为稳定的商业化方向:
第一个方向是通过 AI 实现文字生成,比如对话机器人,支持用户
仅输入简短的词句就能实现对话式交互,生成满足用户需求的文字性内
容。该方向的典型成功案例就是 ChatGPT,其由 OpenAI 打造, 使用
目前最成熟的自然语言生成技术,于 2023 年年初在全球范围内造成现
象级的影响;
第二个方向是利用 AI 作图,主要技术是结合多模态神经语言模
型 CLIP 和图像去噪扩散模型 Diffusion,仅仅提供一些关键词描述就
可以自动生成图片,该方向成功商业案例是 Midjourney,该绘画工具
可以生成不同风格的精美图像,以付费订阅的方式为公司赚取了每年
上亿美元的营收;
第三个方向是 AIGC 的底层技术模型开发,该方向上的龙头主要
为 OpenAI、谷歌、微软等科技公司,目前多数 AI 生成文字类项目都
76
使用OpenAI 的 GPT 系列模型。
但同时AIGC 也面临着许多挑战,主要有模型透明度和可解释性、
用户隐私和数据保护、模型的自主可控性、符合伦理与法律等。
当前各国、组织和学术界都在积极探索 AIGC 的方法和机制,并
努力提高其成熟度,以确保人工智能的发展和应用符合发展需要,并
对社会产生积极影响。
4. 实现 AIGC 的三要素
实现AIGC 更加智能化、实用化的三大要素是:数据、算法、算
力。
数据:数据为 AIGC 提供原料。模型训练需要大量数据支撑,数
据是保证训练算法准确性的关键之一,数据集越大,质量越高,模型性
能就越好。在 AIGC 领域,通常训练任务需要数十亿到数千亿个文件,
对于这种量级数据集的存储和管理至关重要,一般需要专业人员整理与
收集,然后进行标注、预处理和清洗。例如,在图像生成方面, 需要准备
一个包含成千上万张图片的数据集,对其中的每一张图片进行标注,如
分类、描述和提取特征等,对数据集处理的细粒度越高, 生成的图片越
准确。
随着人工智能模型迭代发展,高质量数据集的需求进一步增长。
以 GPT 系列模型为例,GPT-1 使用BookCorpus 数据集,主要包含从
互联网抓取的约 7000 本未出版书籍的文本,涵盖大量浪漫小说、科幻
小说、奇幻小说等多种题材的连续文本;GPT-2 使用 WebText 数据集,
该数据集通过抓取网页创建,包含 4500 万个链接的文本子集,
77
拥有超过 800 万个文档,总共 40 GB 文本。该数据集重点关注文档质
量,对数据集进行了处理,移除了所有的 Wikipedia 文档,因为它是
很多下游任务的数据源,这是为了避免数据集重叠而影响评估;GPT- 3
则使用Common Crawl 数据集的过滤版本,在原始数据集上进行了
3 步过滤操作,增加了一些高质量数据集,最终采用混合数据集输入,
该数据集大小达到了 5000 亿个 tokens,几乎包含了整个互联网的数
据。可见AIGC 领域数据集大小不仅量大且呈指数级增长的特点。
由于不同数据集训练出来的模型质量不同,对数据集的选型和处
理尤为重要,主要关注存储形式(集中式数据库、分布式数据库、云
原生数据库、向量数据库)、数据来源(用户数据、公开域数据、私
有域数据)、数据形态(结构化数据、非结构化数据)、处理方式(筛
选、标注、处理、增强…),在经过基础数据处理服务之后,数据才
能为算法模型提供基础支撑价值。
算法:算法为 AIGC 提供稳定器。在 AIGC 领域中常用的算法主
要为 AI 深度学习算法,包括生成对抗网络(GAN)、变分自编码器
(VAE)和循环神经网络(RNN)等。每种算法都有其独特的优势和
适用范围。例如,GAN 算法可以生成逼真的图片,VAE 算法可以生
成多样性的图片,RNN 算法可以生成连贯的文本。通过这些算法结
合基础数据集,可以生成大规模预训练模型实现高质量的内容生成。
大型预训练模型是使用大量数据进行预训练的人工智能模型,一些著
名的模型包括OpenAI 的 ChatGPT、Facebook 的 OPT、谷歌的 LaMDA
和 BERT、微软的 Turing-NLG、DeepMind 的 Gopher、 的
78
Stable Diffusion 和百度的 ERNIE 等。这些模型已应用于各种任务,
面向不同场景应用,例如文本生成、聊天机器人、图像生成、艺术、
设计、摘要、翻译、问答和视频生成。
表 著名的预训练模型
预训练模型 应用 参数量 领域
BERT 语言理解与生成 4810 亿 NLP
LaMDA 对话系统 - NLP
PaLM 语言理解与生成、推理、代码生成 5400 亿 NLP
Imagen 语言理解与图像生成 110 亿 多模态
谷歌
Parti 语言理解与图像生成 200 亿 多模态
Florence 视觉识别 亿 CV
微软
Turing-NLG 语言理解、生成 170 亿 NLP
OPT-175B 语言模型 1750 亿 NLP
Facebook
M2M-100 100 种语言互译 150 亿 NLP
Gato 多面手的智能体 12 亿 多模态
Gopher 语言理解与生成 2800 亿 NLPDeep Mind
AlphaCode 代码生成 414 亿 NLP
GPT3 语言理解与生成、推理等 1750 亿 NLP
CLIP&DALL-E 图像生成、跨模态检索 120 亿 多模态
Codex 代码生成 120 亿 NLP
Open AI
ChatGPT 语言理解与生成、推理等 - NLP
Nvidia
Megatron-Turing
NLG
语言理解与生成、推理等 5300 亿 NLP
Stability AI Stable Diffusion 语言理解与图像生成版本 - 多模态
为了能更好贴合用户内容生成需求,处理更为复杂的任务,模型
算法应该不断地自我改进和优化,有助于不断提高生成内容的质量和
准确性。
算力:算力为 AIGC 提供动力。大型模型依托海量数据集,在实
现上很大程度依赖于庞大的计算能力,其主要需求体现在硬件消耗上,
79
包括半导体(CPU、GPU 等)、服务器、大模型算力集群、基于 IaaS
搭建分布式训练环境、自建数据中心部署等。以 ChatGPT 为例,
ChatGPT 可以分为许多人工智能模型,这些模型需要特定的人工智能
芯片来处理复杂的计算任务。ChatGPT 运营着 30000 多个Nvidia A100
GPU,在 2023 年 1 月每天接待 1300 万独立访客。现如今 AIGC 模型的
参数量已到达千亿甚至万亿水平,面对如此庞大的模型参数及训练数
据集,需要巨大的数据处理能力,没有硬件给予的算力支撑,无法满足
AIGC 模型对性能上的需求。目前全球 GPU 市场中英伟达和AMD
占有主要份额,约为 96%,受益于长期积累的技术优势,其在高性能
计算与人工智能领域具有丰富的产品线以及完善的生态。与此同时,
国内 GPU 研发企业也在奋起直追,如华为、海光信息、寒武纪等。
5. AIGC 的技术发展路径
结合人工智能的演进历程,AIGC 的发展大致可以分为三个阶段
即:早期萌芽阶段(20 世纪 50 年代至 90 年代中期)、沉淀积累阶段(20
世纪 90 年代中期至 21 世纪 10 年代中期),以及快速发展阶段(21 世
纪 10 年代中期至今)
而 AIGC 技术的发展可以追溯到上世纪 50 年代,当时计算机科
学家就开始尝试使用计算机生成语言模型。随着人工智能技术和算法
的发展和进步,使得 AIGC 技术得以逐渐成熟和广泛应用。
在 AIGC 的发展历程中,技术的进步主要经历了如下的路径:
(1) 语音识别---隐马尔科夫链模型
80
AIGC 最早可追溯至 1957 年依托随机模型创作的首支电脑创作
的音乐作品,弦乐四重奏《依利亚克组曲(Illiac Suite)》。1966 年,
约瑟夫 · 魏岑鲍姆 (JosephWeizenbaum) 和肯尼斯 · 科尔比 (Kenneth
Colby) 共同开发了世界第一款可人机对话的机器人“伊莉莎 ( Eliza)”,
其通过关键字扫描和重组完成交互任务。而后连续语音识别迅速发展,
统计模型逐步取代模板匹配,隐形马尔科夫链模型( Hidden Markov
Model,HMM)成为语音识别系统的基础模型。
(2) 神经网络
20 世纪 90 年代中期至 21 世纪 10 年代中期,神经网络重回人们的
视野,开启了深度学习在学术界和工业界的浪潮。随着互联网不断兴起,
图形处理器 GPU、张量处理器 TPU 等算力设备性能不断提升, 数据规
模快速膨胀为各类人工智能算法提供了海量训练数据,AIGC 发展得
到了显著进步。出现了,2007 年纽约大学人工智能研究员罗斯·古德
温装配的人工智能系统撰写出小说《1 The Road》;2012 年, 微软公
开展示全自动同传系统,该系统基于深层神经网络 ( Deep Neural
Network,DNN)可以自动将英文演讲者的内容通过语音识别、语言翻
译、语音合成等技术生成中文语音。
虽然AIGC 技术有一定发展,但依然受限于算法瓶颈,无法较好
完成创作任务,应用局限性较大,效果亟待提升。
(3) 深度学习,GAN 模型的提出
这一阶段,深度学习算法不断迭代,人工智能生成内容百花齐放,
效果逐渐满足需求。2014 年 Ian 提出了深度学习算法
81
“生成式对抗网络”(Generative Adversarial Network, GAN)推出并迭
代更新,令 AIGC 产业逐渐回暖,GAN 被广泛应用于广告、游戏、
娱乐、媒体、制药等行业,可以用来创造虚构的人物、场景,模拟人
脸老化,图像风格变换,以及产生化学分子式等等。
(4) Google 提出Transformer
2017 年 Google 团队首次提出了 Transformer 架构并应用于机器
翻译中,该架构之后为深度学习算法突破发展,迸发出大模型起到重
要作用。
OpenAI 推出了 GPT-3,拥有超过 1750 亿个训练参数,为文本生
成迎来重大突破,其庞大的运行规模使得它能答题,生成论文以及代
码生成等,被誉为“万能生成器”。
(5) Open AI 推出 DALL-E
2021 年 Open AI 推出 DALL-E 并更新迭代版本 DALL-E-2,主要
用于文本、图像的交互生成内容,同年将跨模态深度学习模型 CLIP
开源。
(6) ChatGPT 问世
2022 年年底 OpenAI 推出应用ChatGPT,因其强大的知识回答和
对话交互能力而迅速火遍全球,成为史上增速最快的消费级应用,令
AIGC 技术再次成为全球的焦点。
在此之后AIGC 目前呈现内容类型不断丰富、内容质量不断提升、
技术的通用性和工业化水平越来越强等趋势,不断涌现出 AIGC 新技术,
新应用。
82
(三)AIGC 的成功应用 -------ChatGPT
1. ChatGPT 的概念
ChatGPT 是一款对话机器人程序,由美国 OpenAI 于 2022 年 11 月
30 日发布。它是基于人工智能技术的自然语言处理工具,能够进行对
话、理解人类语言,并根据上下文进行互动,实现与人类类似的聊天交
流。此外,ChatGPT 还可以完成撰写邮件、视频脚本、文案、翻译、
代码编写和论文撰写等任务。它采用了 Transformer 神经网络架构,即
架构,该架构用于处理序列数据,具备语言理解和文本生成的
能力。ChatGPT 通过连接大量真实世界的对话语料库进行训练,拥有
广泛的知识和上下文交互能力,能够与人类进行几乎无异的聊天。除了
作为聊天机器人外,ChatGPT 还能执行撰写邮件、视频脚本、文案、翻
译和代码编写等任务。官方将 ChatGPT 描述为优化对话的语言模型,并
将其作为 架构的主力模型。ChatGPT 在 之上用基于
人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入,
使机器更理解人类语言,让 GPT 获得更逼真的结果。ChatGPT 在逻辑推
理、上下文理解等方面的能力,是模型规模达到量级后“涌现”出的。
ChatGPT 具备对话能力,能够在同一个会话期间回答与上下文相关
的问题。此外,在网友们晒出的截图中, ChatGPT 展现出流畅对
话的能力,并且可以写诗、撰写文章和编码。ChatGPT 还采用了注重
道德水平的训练方式,根据预先设计的道德准则,对恶意的提问和请求
予以拒绝。如果用户的文字提示包含暴力、歧视、犯罪等恶意意图,
ChatGPT 将不提供有效答案。ChatGPT 在
83
2022 年 11 月底发布后,迅速在社交媒体上走红,仅短短 5 天内注册
用户数就超过了 100 万。
截至 2023 年 1 月底,ChatGPT 的月活跃用户已经突破 1 亿,成
为历史上增长最快的消费者应用。
2. ChatGPT 的能力与原理
(1) ChatGPT 的能力
作为目前最火爆的生成式语言模型,ChatGPT 具备多种强大的能
力。
语言理解
即理解用户输入的句子含义的能力,并对其进行适当的回应。
ChatGPT 的语言理解基于其对大量文本数据的训练和深度学习模型的
运算能力。通过学习大量的语言结构和语义规则,ChatGPT 能够推断出
输入句子的意思,包括其上下文、词义和语法。ChatGPT 不仅可以处理
简单的问题和指令,还可以应对更复杂的语境和多义词的情况。它能够识
别句子中的关键信息,并将其纳入整体理解的框架中。
此外,ChatGPT 还具备一定的常识知识。它可以利用广泛的世界
知识和常识来帮助理解用户的意图。这使得 ChatGPT 能够回答更加
综合性和复杂性的问题,而不仅仅局限于对输入句子的字面理解。尽
管 ChatGPT 在语言理解方面表现出色,但仍然可能会面临理解模糊
或语义模棱两可的情况。在这种情况下,ChatGPT 可能会提出澄清问
题或寻求进一步的上下文以更好地理解用户的意图。总体而言,
ChatGPT 的语言理解能力使其能够有效地理解和解释用户的输入,从
84
而为提供准确和合适的回应奠定了基础。
语言生成
当涉及到语言生成时,ChatGPT 展现了强大而灵活的能力。它可
以根据给定的提示词(prompt)或上下文生成连贯、有逻辑性的句子。
ChatGPT 的语言生成基于其对大量文本数据的学习和深度学习模型的
能力。它可以通过学习语言的结构、语法规则和语义关联,自动生成与
输入上下文相匹配的回答或补全。无论是回答问题、提供解释, 还是进
行创造性的句子生成,ChatGPT 都可以根据上下文和提示词的指导生
成相应的句子。它可以理解提示词的含义和作用,并以一种适应上下文
的方式生成回应。
ChatGPT 的语言生成不仅限于短句回答,还可以生成更长的段落
或文章。它可以结合多个句子,形成连贯的表达,并在其中保持一致的
风格和语言特征。
ChatGPT 的语言生成能力可以广泛应用于对话系统、智能助手、
内容创作等领域。它能够根据用户的需求和上下文生成多样化的、富有
表达力的语言内容,从而提供有用和个性化的回应。
上下文学习
ChatGPT 具备强大的上下文学习能力,这使得它能够根据给定的
任务和示例,为新的测试用例生成解决方案。
上下文学习是指通过给定一系列示例或上下文,让 ChatGPT 从中
学习并理解某个任务的模式和要求。这样,当面对新的测试用例时,
ChatGPT 可以利用之前学习到的知识和上下文来生成相应的回答或
85
解决方案。通过对大量的示例进行学习,ChatGPT 能够捕捉到示例之
间的共同模式和规律。这使得它能够推理出问题的本质和解决方案的逻
辑,并在给定新的情况时进行灵活的应用。
上下文学习使得 ChatGPT 具备适应性和灵活性,可以处理各种
类型的任务和问题。它可以从示例中提取关键信息,并将其应用于新
的上下文中,从而生成准确和合适的回答。
ChatGPT 的上下文学习能力使得它能够通过示例学习和推理,为新
的测试用例提供合理的解决方案。这使得 ChatGPT 成为一个灵活而适
应性强的语言模型,可以在各种任务和问题上展现出优秀的性能。
思维链
思维链是一种离散式提示学习的技术,通过引入一系列连贯的提
示来激发 ChatGPT 的思维过程。这些提示构成了一个思维链,每个
提示都建立在前一个提示的基础上,逐步引导 ChatGPT 进行推理和
生成回答。
通过思维链,ChatGPT 能够利用之前的信息和上下文来推断新的
信息和解决方案。它可以沿着思维链不断深入思考,将前一个提示的
结果作为下一个提示的基础,从而生成更加连贯和准确的回答。思维
链的引入提供了一种更加结构化和有序的学习方式,使得 ChatGPT 能
够更好地捕捉问题的逻辑和复杂性。它能够在连续的提示中展示推理
的能力,以一种更贴近人类思考的方式生成回应。
ChatGPT 的思维链能力使其能够在大型模型下增加连贯的思考
过程,逐步推理并生成更加准确和合理的回答。这使得 ChatGPT 在
86
处理复杂问题和推理任务时表现出更高的能力和灵活性。
代码理解和代码生成
ChatGPT 可以解读和生成代码,为编程问题提供帮助和解决方案。
ChatGPT 可以阅读和理解各种编程语言的代码,并识别代码的结构、语
法规则和功能。ChatGPT 能够识别变量、函数、条件语句、循环结构等
常见的编程构造,并理解它们的作用和相互关系。根据给定的代 码示例
和上下文,ChatGPT 为编程问题提供解决方案。可以根据问题的要求和
提示,生成相应的代码片段或算法。ChatGPT 能够考虑语法正确性、代
码逻辑和最佳实践,以生成合理和可运行的代码。
ChatGPT 的代码生成能力还可以解释代码的功能和执行流程,为
初学者提供可理解的示例和解释。ChatGPT 还可以生成代码注释、代
码重构建议等,以改进代码质量和可读性。
(2) ChatGPT 的技术原理
ChatGPT 是 一 种 基 于 Transformer 的 自 然 语 言 模 型 。
T r a n s f o r m e r 本质上是一种“编码-解码”的框架结构,用于处
理序列数据的深度学习模型,由于 Transformer 使用了注意力机制
(能够自动挑选、学习输入数据中的重要信息,忽略不重要的信
息),并且具有了并行计算的优势使得其在 NLP 领域取得了出色
的结果。
Transformer 的具体算法原理简要介绍就是,Transformer 模
型会将输入的文本信息进行编码,将其转换为数字向量;然后使
用注意力机制来挑选并学习出文本信息中的关键词,并通过多层
87
神经网络来训练模型,最后将学习到的信息解码成相对应的自然
语言文本答案,从而实现对自然语言文本的建模和理解。
那么基于transformer 的 ChatGPT 工作原理融入了“人类反馈
强化学习”训练方法,具体分为三个步骤:
⚫ 有监督的训练:先给定一些输入的语句问题,用人工来给出语
句问题的答案,利用这些有答案的数据进行 ChatGPT 有监督
的训练;
⚫ 奖励模型:同样利用上述数据,将语句问题输入 ChatGPT,
让其生成输出若干个答案,然后人工对这些生成的答案进行
好坏的排序,利用这些有排序的数据训练反馈奖励模型;
⚫ 优化:依据奖励模型使用强化学习算法对上述模型进行优化;
图 ChatGPT 的原理图
3. 国内外发展现状(大模型)
ChatGPT 展现出强大的智能涌现能力,国内外各家公司紧跟时势,
开展新一轮 AI 模型竞赛。国内各家大模型发展如下:
88
表 国内大模型发展概况
模型 描述
百度文心大
模型
涵盖了 NLP、CV、跨模态、行业等多个 AI 应用场景。其中,百度的 NLP 核心是 ERNIE 模
型,通过 ERNIE 模型系列实现了语言理解和生成任务。文心一言是基于文心 NLP 大模型
的对话式产品,能够与用户进行对话互动,回答问题,协助创作。此外,百度还开放了大
模型 API 接口,如 ERNIE 、ERNIE-ViLG 和 PLATO,赋能开发者和企业在文本理 解、
AI 作画和开放域对话等方面。百度文心大模型的应用领域涵盖了语言、图像、对话等多个
领域,并通过强大的模型能力和开放的 API 接口,推动了人工智能技术在搜索、创作
和交互等方面的发展。
阿里巴巴通
义大模型
由通义-M6 模型组成,融合了语言模型和视觉模型。通义大模型包括统一底座"M6-OFA"
和多个通用模型,例如通义-M6、通义-AliceMind 和通义-视觉大模型。阿里巴巴的通义大
模型已经在硬件终端和软件领域实现了落地。在硬件终端方面,天猫精灵基于通义大模型
推出了拟声助手“鸟鸟分鸟”。这个对话机器人具备多轮对话能力,并能利用搜索引擎等工
具,个性化特点也让它的表达方式更具定制化。在软件方面,通义千问已经开始内测,提
供了多个小应用,包括效率类(写提纲、商品描述生成)、生活类(会放飞的菜谱、小学
生作文、然后呢)、娱乐类(彩虹屁专家、写情书、为你写诗)等。未来预计阿里巴巴大
模型还将在电商和办公等场景中广泛应用,带来更好的用户体验和效率提升。
腾讯混元大
模型
由腾讯的 TEG 数据平台部和机器学习平台部联合主导开发。该模型涵盖了计算机视觉、
自然语言处理、多模态内容理解、文案生成、文生视频等多个领域。腾讯的混元大模型在
广告和游戏等多个场景落地,极大地提高了效率并降低了成本。在广告业务方面,腾讯应
用 AI 模型助力广告主提升广告创作效率和推荐系统的内容理解能力,提高广告效率和转
化效果。腾讯的广告智能创作助手 Effidit 利用混元大模型,帮助创作者开阔思路、提升创
作质量。在游戏业务方面,腾讯提出了自研的 3D 虚拟场景自动生成解决方案,利用大模
型帮助游戏开发者以更低的成本创建风格多样、贴近现实的虚拟城市,大幅提升了 3D 虚
拟场景的生产效率
华为盘古大
模型
基于华为云的 ModelArts 平台研发设计的一系列模型。该模型包括计算机视觉大模型、科
学计算大模型和自然语言处理大模型。华为盘古大模型借助 ModelArts 平台,具备持续构
建大模型训练及推理加速能力、分布式训练能力等,并提供全流程的 AI 应用开发技术能
力。华为的盘古大模型已经在物流、药物研发、气象预测等多个领域实现了落地,极大地
提高了行业的效率。在物流方面,华为为浦发银行构建了普慧云仓,通过盘古大模型实现
了物流仓库的智能监控,提高了业务流程的线上化和性能表现。在药物研发领域,盘古药
物分子大模型帮助医药公司进行 AI 辅助研发,大大缩短了先导药研发的周期,提高了研
89
发效率。在气象预测方面,盘古气象大模型利用 3D Earth-Specific Transformer 技术处理复
杂的气象数据,提高了气象预测的精度和速度,达到甚至超过传统方法的水平。
轩辕大模型 在 1760 亿参数的 Bloom 大模型基础上训练而来。为了提升轩辕大模型对金融领域问题的
理解能力,度小满将自身业务中积累的金融领域的千亿 tokens 的中文预训练数据集用来训
练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度
小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与 ChatGPT 达到持平成为
可能,且显著提升了模型在金融垂直领域的性能,在金融名词理解、金融市场评论、金融
数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融
领域优势。
国外企业利用大模型技术研发的相关 AI 产品也相继面世。以
ChatGPT 为例,微软 Bing 聊天机器人已经全面开放给所有用户,可
以输入文字或语音,或者上传图片或视频,让 Bing 聊天机器人提供
答案或服务。
微软结合了 GPT-4,发布了支持 AI 功能 Copilot,支持 Word 等
Office 软件。微软称,Copilot 比简单地将 ChatGPT 嵌入到 Microsoft
365 中更强大,它可以写 Word 文档初稿、电邮草稿、做幻灯片、根据
数据进行 SWOT 分析,称它不会始终正确,但只要用户意识到可能和
事实不符,就可以手动纠正,节省工作时间。微软表示将在
Windows 系统中全面接入 AI 助手 Windows Copilot。这也意味着,
Windows Copilot 将成为全新的 PC 助手:它可以帮助用户处理文档,
进行内容的解释、总结;它也可以帮助用户调整 PC 设置,比如让它把
电脑调成夜间模式;用户可以用它生成图片,发给相关工作群组; 此
外它也可以直接帮助用户打开音乐App,推荐和播放相应的歌单等等。
谷歌近期发布了 PaLM 2,这是一种训练有逻辑和推理能力的语
90
言模型,超过 100 多种语言进行了训练,并在某些任务上超越了竞争
对手。此外,谷歌的办公全家桶产品 Workspace 进行了升级,引入了
Duet AI,为用户提供了更多的 AI 辅助功能,如文档写作辅助、图片
生成等。谷歌的聊天机器人 Bard 也得到了增强,具备实时搜索网页
和多语言支持等新功能,并将 Bard 接入谷歌系办公软件及搜索引擎
应用中。此外,谷歌还推出了由 PaLM 2 驱动的全新搜索引擎,提供
了更丰富的问题回答摘要和可靠的相关链接。他们还展示了 Magic
Editor 这一照片处理工具,利用生成性 AI 进行图像编辑。这些进展
显示出谷歌在人工智能领域的竞争力和创新能力。
除了直接的商业用途外,学术界也公开了各类大规模语言模型,
供各类学者进行研究。
MetaAI 开源了其类GPT 大模型 LLAMA,包括从 70 亿个参数到
650 亿个参数。Meta 表示,其 LLaMA-13B 模型优于OpenAI 的 GPT-
3 模型,该模型已在 1750 亿个参数上进行了训练。许多开发人员正
在使用LLaMA 进行微调并创建一些最好的开源模型,如斯坦福大学
基于 LLaMA-7B 微调而来的 LLM 大模型 ALPACA。LLaMA 65B 模
型在大多数用例中都显示出了惊人的能力。它在 Open LLM 排行榜上
名列前十。Meta 表示,它没有进行任何专有训练。相反,该公司使用
了来自CommonCrawl、C4、GitHub、ArXiv、维基百科、StackExchange
等网站的公开数据。简单地说,在 Meta 发布 LLaMA 模型后,开源
社区看到了快速的创新,并提出了用新的技术来创造更小、更高效的
模型。2023 年 5 月,MetaAI 官宣发布了基于 1750 亿参数的超大模型
91
OPT-175B,还对所有社区免费开放。12 月 22 日,该模型的更新版本
OPT-IML(Open Pre-trained Transformer)正式上线,Meta 称其「对
2000 个语言任务进行了微调,包含 1750 亿个参数」,还将为非商业
研究用途免费开放。
法国国家科学研究中心采用超级计算机,花费 117 天时间开发了一
种名为 BLOOM 的新大型语言模型(LLM,Large Language Model)
BLOOM 是 由 1000 多 名 志 愿 研 究 人 员 在 一 个 名 为 “ 大 科 学
B i g S c i e n c e ” 的项目中创建的,该项目由人工智能初创公司
Hugging Face 利用法国政府的资金运作的。BLOOM 的英文全名代表
着大科学、大型、开放科学、开源的多语言语言模型。BLOOM 模型的
最大优势是它的易获取性。它现在已经公开发布了,任何人都可
以在Hugging Face 网站上免费下载。用户有多个语种可选,然后将需求
输入到 BLOOM 中,任务类型包括撰写食谱或诗歌、翻译或总结文本,
甚至还有代码编程。人工智能开发人员可以在该模型的基础上构建他们
自己的应用程序。
ChatGPT 的涌现能力的实现以及应用成功,使得 AI 产业发展进
入新阶段。国内外各大龙头企业都在针对大语言模型进行研究,开展
了新一轮的 AI 军备竞赛。
4. ChatGPT 的商业模式
ChatGPT 的商业化路径主要包含如下模式,可供金融机构参考。
(1) ChatGPT 的主要商业模式
订阅访问计划
92
OpenAI 可能提供不同层次的订阅计划,以满足不同用户的需求。
这些计划可以根据使用量、访问频率、功能访问级别或支持级别来定价。
用户可以根据其需求选择适当的订阅计划,并支付相应的费用来访问
ChatGPT 的功能。如最新的 GPT-4,已被纳入 ChatGPT Plus 的付费服
务。以其更快的相应速度和更多模型参数带来的高度准确性和自然度,
吸引用户付费使用。
定制化解决方案
ChatGPT 可以与企业合作,根据其特定的需求提供定制化的
ChatGPT 解决方案。这可能涉及到定制模型的训练、特定行业或领域
的知识库构建、API 集成或部署支持等。这些定制化解决方案可以通
过一次性费用或长期合作协议进行付费。
增值功能和服务
除了基本的 ChatGPT API 访问,OpenAI 可能提供一些额外的增
值功能和服务。这可以包括语音识别、情感分析、内容过滤、多语言
支持或基于 ChatGPT 的机器学习模型训练等。这些附加功能和服务
可能以不同的定价模型提供,例如按使用量、功能级别或定制需求进
行计费。
与合作伙伴的合作
OpenAI 可以与其他公司、平台或开发者合作,共同开发具有
ChatGPT 功能的产品或服务。这可以涉及与聊天应用、社交媒体平台、
虚拟助手、智能设备或机器人等合作,以整合 ChatGPT 技术,并共享收
益或收取授权费用。如目前和微软的深度合作。
93
(2) 不同商业模式下的相关领域
文本创作领域
ChatGPT 为商业模式提供了多种机会。这包括提供内容创作服务,
如生成 SEO 文章、社交媒体内容和广告创意,以提高创作效率和质量。
另外,AI 技术可以嵌入到平台中,为用户提供自动生成文本的功能,例
如内容管理系统和电商平台。还可以提供教育和咨询服务,针 对文本生
成和创作提供定制培训和咨询。AI 技术的应用还可以定制化到特定领
域,如法律文件、建筑规范和教育教材的生成。AI 技术还可以用于内容
审核和编辑,帮助提高文本质量和准确性。随着技术的 不断发展,商业
模式也会随之演进和调整,以适应用户需求和技术进 步。
Chatbot 对话机器人方向
Chatbot 的发展可以分为几个方向。如下表所示:
表 Chatbot 发展方向
类别 描述
客服类 虽然技术上发生了重大变革,但商业上的影响有限。目前市场上仍存在竞争
者,包括旧有的系统,而迁移成本和渠道关系使得已经购买产品的用户不太可
能立即切换。此外,依赖大厂部署 GPT 技术也会引发一些疑问。算力成本和
时延也是客服类 Chatbot 面临的挑战。
娱乐类
Chatbot
需要结合情感场景设计。纯聊天机器人很难持续吸引用户,因此技术突破是取
得成功的关键。然而,在商业上需要考虑成本、持续价值和复购动力等因素。
工具类
Chatbot
如语音音箱、手机语音助手等。实时性是工具类 Chatbot 面临的挑战,但技术
进步能够提升用户体验。虽然工具类 Chatbot 属于存量市场,但它们更愿意拥
抱新技术。
专业类
Chatbot
如法律咨询机器人、投顾机器人、心理咨询机器人等。这些机器人面临一些特
殊的挑战,包括专业数据和低频场景。尽管 GPT 等新技术对专业类 Chatbot
94
Chatbot 的发展在不同方向上面临着不同的挑战和机遇。技术突
破对于用户体验和市场发展至关重要,而商业成功则需要综合考虑用
户需求和合适的商业模式。
游戏领域
在游戏领域,目前还没有太多优秀的 Chatbot 应用案例。然而,
新技术对游戏的影响正在逐渐显现。首先是 NPC 流水线,新技术可以
覆盖NPC 制作的多个方面,包括生成 NPC 的背景故事、实现自由对话、
生成头像和 3D 建模(尽管 3D 建模仍存在挑战)、构建 NPC 好感度机
制等。自由对话模块已有案例,比如《骑马与砍杀 2》中的实验性演示。
在任务流水线中,新技术可以在任务文本生成和任务选项等方面提供帮
助。虽然在任务制作方面的影响相对较小,但仍有剧情式游戏等相关案
例可供参考。关于交互模式,传统游戏交互方式主要是界面、体感和声
音触控。新技术让自然语言交互成为可能,延伸出的文本交互和语音交
互将变得更加成熟。然而,并不是说新的交互方式就一定更好,需要根
据实际需求选择合适的组合方式。
虽然游戏领域是一个旧市场,新技术可能会给这个领域带来颠覆性
的变化。MUD(多用户地下城)类型游戏可能会重新引起关注,因为它
可以降低音乐、界面和建模等方面的成本,最先受益于技术升级。对于新
技术的应用才刚刚开始,还有许多其他领域可以探索,如 NPC 决策逻辑、
世界背景构建和新语言创造等。
95
的影响有限,但技术的进步仍有助于提升用户体验。专业类 Chatbot 可能需要
先作为专业人员的辅助工具,积累数据优化后再向大众开放。这个方向有一定
的增量市场潜力,但需要结合技术演进和专业落地进行具体评估。
(四)AIGC 对金融行业的影响
1. AIGC 对金融行业的影响
以 ChatGPT 为代表的 AIGC 的出现无疑对金融业具有深远的影响,
可以通过提供快速准确的信息和自动化的任务处理来影响金融行业,以
科技的力量推动金融业降本增效,最终实现高质量发展。此外
ChatGPT“让机器理解”的能力进一步推动了金融行业的数智化转型,
大规模预训练模型拓宽了金融行业 AI 应用的边界。具体来讲,
ChatGPT 为代表的大模型主要在如下方面为金融行业带来了应用价值:
(1) 降本增效
在各项业务中,如数据分析,投研、编程研发及流程管理方面,
借助 ChatGPT 的能力提高效率,减少了基础人员的投入。以金融机构
营销服务为例,利用 ChatGPT 实现营销策略的自动生成与迭代, 结
合金融机构特有的语料进行训练,可以提升营销内容和用户转化效率的
提升,从而实现降本增效;以银行业自动化交易为例,ChatGPT 通过训
练替代人工交易员,自动执行许多后台任务,从而能够提高效率和降低
成本。
(2) 提升生产力,提升用户体验
ChatGPT 改变了人机交互方式与体验,可以实现多轮对话,提升
了对话和服务体验,并且与机器学习、知识图谱等技术结合能够进一步
提升模型的智能性,可以更加精准的为客户提供定制化、个性化的服
务,使金融服务更加有温度。
96
(3) 产品服务创新
以 ChatGPT 为通用基础能力底座,引入金融领域专有内容、高
级认知能力,整合多样化需求,从而能够形成产品服务的创新。
2. 典型的金融应用场景
ChatGPT 作为一种感知智能,在金融生成文本类工作中具有应用
价值。
(1) 经营部门
应用在金融机构经营部门。由于 ChatGPT 是一款交互形式的聊天
机器人,其最直接的应用是金融机构的电子客服。通过在 ChatGPT 中输
入金融机构电子客服页面的问题并比较二者的答复,可以发现
ChatGPT 拥有非常强的信息整合功能的优势,比如用户问“手机 App
某些功能无法运行的原因是什么”,ChatGPT 提供了多种情况的解答,
但金融机构电子客服回复只有一种情况和解决方案,对于金融机构客服
来讲,ChatGPT 的服务是更加智能化和人性化的。
(2) 管理部门
应用在金融机构管理部门。ChatGPT 集成了数据自动化、智能化的
流程功能,使其在财务管理、运营管理、授信管理、咨询建议、战 略规
划等领域都具应用价值。例如,在 ChatGPT 中输入“生成各省金 融机构
存款余额表”,会自动生成各省的金融机构存款数据;输入“为 什么散户
投资者赚钱困难”,能够得到“散户投资者往往喜欢追涨杀跌, 缺少有效
的投资工具”的回答。随着功能的增加,ChatGPT 可以应用到金融机构
的各管理部门工作中去。
97
(3) 支持部门
应用在金融机构支持部门。ChatGPT 最吸引人的功能是辅助开发,
在编写和测试代码上有突出表现,上述工作在人力密集型部门和岗位 非
常普遍和需要,可以帮助没有编程经验或外语能力薄弱的员工快速 提升能
力。把 ChatGPT 当作工具,解决日常的大部分重复性、机械性的工作,
把员工从繁琐事务中释放出来,投入到更具挑战的创新工作, 提升工作效
率,改进工作方法。
案例:
⚫ 智能客服
与传统的智能客服与智能机器人相比,ChatGPT 具有强大的自然
语言处理能力,可以解决更为复杂的问题,提高客户服务效率。同时, 根
据历史对话数据不断提高自身的回答能力,提升服务水平。此外,
ChatGPT 模型可以通过训练新数据进行扩展,更好地适用于金融机构的
业务需求。
ChatGPT 通过训练可以降低人工客服成本,提升用户体验,可以
与对话机器人、数字人相结合,对金融机构某具体业务进行加强训练, 进
一步提升回答问题的准确性和建议性。目前,中信银行正在内部开发测
试类ChatGPT 在智能客服与数字人结合的应用。
⚫ 数据分析/投研
ChatGPT 可以帮助金融机构分析大量数据,把传统机器学习,个
性化推荐、知识图谱、决策引擎等技术和 ChatGPT 融合,进一步优化
模型的智能性,从而改进风险管理和投资决策。ChatGPT 强大的数据
98
提炼和处理能力,可以对投资标的信息进行精准的筛选和整理,完成
对各类投研数据的综合分析以及时间序列的预测,提升投研价值。此
外,ChatGPT 可以提供完整的分析报告,报告存在很多新的思路和角
度,帮助高级分析师完善报告、提升能力。
⚫ 智能营销
在不同的营销活动中创建独特有吸引力的广告文案是一项具有
挑战性的任务。当前,金融领域尚处于自动化营销+数据驱动的营销
迭代过程中,营销内容主要以专家规则,内容模板建设和积累实现。
而利用 ChatGPT 的能力可以从应用可从丰富的营销物料方面为智能营
销提供极大的支持,通过营销领域专业知识的引入,依托客户画像描述
和金融行业特有的 KYC 能力,帮助金融机构输出更加精准的营销话术,
实现个性化,精准化的营销,真正做到千人千面,提升金融机构营销价
值。
⚫ 智能程序员
ChatGPT 目前的版本已经可以写代码,未来将会承担很多复杂的软
件开发项目和复杂系统设计,可以将 ChatGPT 用于协助制定符合金融
领域标准的产品研发、代码编写、测试等,它会根据工作目标, 给出
合理的解决方案和结果。
⚫ 智能风控
随着 ChatGPT 的引入,提升数据提炼和处理能力,在贷中贷后
交互过程中可以不断挖掘客户新特征、发现新规则,辅助风控专家高
效落地全流程风控,辅助金融机构实现风控策略的动态调整,有效降
99
低资金风险,且 ChatGPT 可用来对大量的数据进行标签化的工作,
大大节省了人力的投入,提高了效率。
⚫ 其他
自动化交易:ChatGPT 通过训练可以做自动交易,替代人工交易
员。可以自动执行许多后台任务,从而提高效率和降低成本。
智能调研:ChatGPT 通过训练可以开展某项调研,节省人力成本,
可以把文字、图片、音乐等不同载体整合到一起,设计成文件、海报、PPT、
视频、音频、三维动画等。
3. 国内外 AIGC 在金融行业的实践
金融是数据密度和智能化非常高的行业,国内外主要金融机构和
金融科技公司均已在 AIGC 上有所布局,从共性上看,金融机构开展
AIGC 应用主要涵盖了银行、财富管理、保险理赔、债券问答、政策
预测、投资分析和提升业务效率等各个方面。
(1) 彭博发布金融版 ChatGPT 改进现有金融 NLP 任务
3 月底,全球知名的财经、金融资讯和数据公司彭博(Bloomberg)
发布了专为金融界打造的大型语言模型(LLM)——BloombergGPT,
这是一款基于其几十年来收集数据的 AI 系统。
根据彭博发布的报告显示,其构建了迄今为止最大的特定领域数
据集,并训练了专门用于金融领域的 LLM,开发了拥有 500 亿参数的
语言模型 BloombergGPT。报告显示,该模型依托彭博的大量金融数
据源,构建了一个 3630 亿个标签的数据集,支持金融行业内的各类
任务。该模型在金融任务上的表现远超过现有模型,且在通用场景
100
上的表现与现有模型也能一较高下。BloombergGPT 的训练数据库名
为 FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网
络爬取的金融文件以及提取到的社交媒体消息。
彭博称,BloombergGPT 将协助彭博改进现有的金融 NLP 任务,
如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT将
为整合彭博终端上的大量数据提供新机会,以更好地帮助公司的客户,
同时将 AI 的全部潜力带入金融领域。
(2) 摩根士丹利用GPT-4 服务财富管理部门
3 月 14 日,OpenAI 在发布GPT-4 时公布了 6 个使用案例,其中
就包括了摩根士丹利财富管理部门(MSWM)运用 GPT-4 来组织调
动其面向客户的知识库。摩根士丹利财富管理部门将使用 GPT-4“获
取、处理和合成内容,以洞察公司、行业、资产类别、资本市场和世
界各地地区的方式,吸收其资管自身广泛的智力资本”。
作为财富管理领域的领导者,摩根士丹利维护着一个内容库,其
中包含数十万页涵盖投资策略、市场研究和评论以及分析师见解的知识
和洞见。这些大量的信息分布在许多内部网站上,主要以 PDF 形式呈
现,需要顾问们浏览大量信息才能找到特定问题的答案。从去年开始,
摩根士丹利开始探索如何利用 GPT 的嵌入和检索功能来利用其智库
——首先是 GPT-3,现在是 GPT-4。该模型将驱动一个面向内部的聊
天机器人,在财富管理内容中执行全面搜索,并有效地释放MSWM
积累的知识。
摩根士丹利主导该项目的分析、数据与创新主管 McMillan 表示,
101
目前已经使用 GPT-4 技术将所有智库内容转化为更易于使用和操作
格式,该行此前一直在用 300 名顾问测试这款工具,并计划在未来几
个月广泛推广。
(3) 摩根大通利用 AI 预测货币政策,并计划推出 IndexGPT 选
股服务
据华尔街见闻 5 月 26 日的报道,摩根大通正在开发一款类似
ChatGPT 的软件服务。并为一款名为“IndexGPT”的产品申请了商标注
册。IndexGPT 将利用“使用人工智能的云计算软件”来“分析和选择适
合客户需求的证券”。
文件明确指出,IndexGPT 使用了以 ChatGPT 为代表的人工智能
技术,该行计划使用由 GPT 模型驱动的人工智能。据报道,摩根大
通全球技术主管 Lori Beer 表示,该行已经雇佣了 1500 名数据科学家
和机器学习工程师,正在测试 GPT 技术的“多个使用案例”。
此前,摩根大通发布报告称,已开始使用一套 AI 大语言模型,
从美联储 17 位官员的公开讲话中揣摩情绪变化,汇总编成一套货币
政策的“鹰鸽指数”。据报告显示,摩根大通最早使用的是谷歌的 Bert
模型,后来换成 Open AI 的 GPT 模型,使用效果获得大幅提升。摩
根大通通过 AI 驱动的大语言模型,学习解读央行官员讲话中透露的
信号,来预测利率政策出现变化的可能时间点。AI 程序根据学习结
果编制了一套“鹰鸽指数”。这套指数从 0-100 分打分,0 分代表央行
的态度最为鸽派(即可能采取降息等宽松政策),100 分代表央行的
态度最为鹰派(即可能采取加息等紧缩政策)。
102
目前摩根大通将这套“鹰鸽指数”用在了美联储、欧洲央行和英国
央行身上,预计未来几个月会把适用范围扩大到全球 30 多家央行。
(4) Two Sigma 利用 ChatGPT 进行投资分析
Two Sigma 是一家总部位于美国的量化对冲基金公司,拥有超过
2000 名员工,管理超过 500 亿美元的资产。Two Sigma 利用 ChatGPT
分析财务报表和新闻内容,以识别潜在的投资机会和风险,通过利用
ChatGPT 的自然语言处理能力和大规模语料库,Two Sigma 可以自动
化的分析大量的数据,并从中提取有用的信息,以更好的了解公司业
绩和市场趋势,并作出更明智的投资决策。
(5) 苏黎世保险使用 ChatGPT 进行理赔和数据挖掘
据英国《金融时报》3 月份的报道,苏黎世保险集团(Insurer Zurich)
正在测试如何在索赔和建模等领域使用 ChatGPT 技术,旨在应对初创
企业和更大竞争对手带来的挑战。
苏黎世保险正在研究该技术的应用,从理赔说明和其他文件中提
取数据。目前,该公司提供了最近六年的理赔数据,试图找出整个理
赔部分的具体损失原因,从而改善承保。在首席信息和数字官的领导下,
这家保险公司还创建了一个新的专利计划来保护其知识产权,重点关
注自动风险检查和处理账单的 AI 系统等领域。
(6) Broadridge 推出 BondGPT,服务债券市场
6 月 7 日,全球领先的金融科技公司布罗德里奇(Broadridge)子
公司 LTX 宣布,通过 GPT-4 打造了BondGPT,主要用于帮助客户回
答各种与债券相关的问题,增强 万亿美元的美国公司债券市场
103
的流动和价格发现。目前,BondGPT 已经投入使用。
Broadridge 创立于 2007 年,专为银行、券商、资产管理公司等金
融机构提供技术解决方案。Broadridge 总部位于美国纽约,在中国香
港、伦敦、东京、新加坡、多伦多等 21 个国家/地区开展业务,员工
数量超过 万人,年收入超过 50 亿美元,市值达 180 亿美元。为
了增强 ChatGPT 的输出准确性和满足金融业务场景需求,LTX 将
Liquidity Cloud 中的实时债券数据,输入到 GPT-4 大语言模型中,帮
助金融机构、对冲基金等简化债券投资流程以及提供投资组合建议。
(7) 中信银行开展 AIGC 探索,构造 AIGC 平台提升金融服务
质量
中信银行开展了 AIGC 平台的打造,涵盖底层算力集群、框架层,
模型层,应用层。共包括四大服务模块:算力云服务、大模型研发服务、
大模型部署及管理服务、应用平台服务。作为创新基础支撑,旨在为银
行业打造金融领域相关生成式业务的一体化解决方案服务能力。目前
开展的场景探索主要包括智能客服、智能操作助手、代码生成,知识库
管理等。
4. AIGC 在金融业的发展机遇与挑战
(1) 机遇
在数智融合的环境下,深度把握数据要素的全周期、全流程、全方
位活动,是激活数字内容潜能的基础支撑,也是内容市场实现增量发展
的重要内驱力。金融行业作为信息密集型行业,数据资源丰富、信息化
程度高,亟需借助人工智能的感知能力和智能化水平的支持,
104
因此AIGC 在金融业迎来重要发展机遇。
⚫ 内容共生
金融业是一个信息密集型的行业,需要大量的数据和信息来支撑
业务的开展。人工智能生成内容可以通过自然语言处理、机器学习等
技术,对金融数据进行分析和处理,生成高质量的金融内容,提高金
融业务的效率和准确性。例如,人工智能可以自动生成金融新闻、研究
报告、投资建议等内容,为金融从业者提供更加全面和及时的信息支持。
这些内容可以帮助金融从业者更好地了解市场动态和趋势,提高决策
的准确性和效率。同时,人工智能生成内容还可以通过智能化的风险管
理和监控,帮助金融机构更好地识别和管理风险,提高金融业的稳定性
和安全性。
此外,人工智能生成内容可以通过自然语言处理、机器学习等技
术,对金融数据进行分析和处理,生成高质量的金融内容,提高金融
业务的效率和准确性。例如,人工智能可以自动生成金融报表、财务分
析报告等内容,帮助金融从业者更好地了解企业的财务状况和业务情况,
提高决策的准确性和效率。同时,人工智能生成内容还可以通过智能化
的客户服务和营销,提高金融机构的客户满意度和市场竞争力。通过这
些能力的提升,人工智能生成内容可以帮助金融机构更好地适应市场
变化和客户需求,实现业务的可持续发展。
人工智能生成内容通过与金融机构的合作,共同开发智能化的金
融产品和服务,能提高金融机构的创新能力和市场竞争力。例如,人
工智能可以自动生成智能化的投资策略、风险评估报告等内容,帮助
105
金融机构更好地理解市场趋势和风险,提高投资决策的准确性和效率。
同时,人工智能还可以通过与监管机构合作,共同制定智能化的监管 政
策和标准,提高金融业的规范化和透明度,促进金融业的可持续发 展。
⚫ 能力升维
金融业需要高度专业化的知识和技能,而 AIGC 拥有如下能力:
智能内容“解构—复现”能力,能够全方位地把握内容的解构深度
和复现程度,提升了数字化内容的关联性、完整性和有效性。
智能内容编排-合成能力,也即内容理解能力、属性调控能力、多
模态融合能力、跨模态生成能力,极大程度地扩展了 AIGC 在金融业的
泛化能力和应用场景。
⚫ 价值共创
AIGC 可以代替人类完成素材收集、大体量学习、归纳分类等基
础阶段的重复性劳动,在新技术的尝试、渗透和应用的基础上开拓新的
业务内容,借助 AI 技术的强大动能和 AIGC 的创新能力来提高整体
内容的生成质量,压缩内容创新的时间和成本,解决具体业务场景下
存在的痛点、断点和难点。
(2) 挑战
AIGC 在金融领域有着较大的应用潜力,然而但目前这项技术尚
处于起步阶段,其大规模应用还面临可信度、业务、成本投入等多方
面的挑战,还存在着一定的风险,需要谨慎探讨。
⚫ 技术风险问题
106
AIGC 技术的进步带来红利的同时,也面临着新技术所带来的风
险性,新的欺诈手段如换脸技术的应用。攻击者可能使用 AIGC 技术
伪造身份,从而更难以识别真实的借款人,增加了身份验证和欺诈检
测的难度;黑灰产攻击,包括了各种网络攻击、数据泄露等。这可能导
致个人信息泄露,增加身份盗窃和欺诈的风险。
⚫ 不同规模金融机构间差距问题
此外,AIGC 的投入巨大,大模型的应用和建设需要大量的数据
和算力支持。大型金融机构由于拥有海量的金融数据和丰富的应用场
景,因此更有可能引入业界领先的基础大模型,自建金融行业、企业
大模型。而对于将核心业务系统托管在大型金融机构或可信第三方的中
小金融机构,其业务应用场景较少,且数据、算力、算法资源相对不足,
可在监管许可的前提下,利用托管方训练资源开展企业大模型训练;
或按需直接引入基础大模型或行业大模型私有化部署满足业务需求。
其次,大模型的应用和建设需要专业的知识和技能。大型金融机
构通常有更强的技术实力和更多的专业人才,因此在大模型的应用和
建设上可能有更大的优势。而中小金融机构可能在这方面存在一定的挑
战。
⚫ 成本问题
金融机构对数据非常敏感,往往选择私有化部署,但目前大模型
对于资源的压力极大,难以实现私有化部署。且训练一次的成本介于
200 万美元至 1200 万美元之间,要用本领域的私有、专有数据对它
107
进行增强样本的训练,补足通用模型在领域的短板,这可能会牵涉到
大量的人力物力,目前在适配具体业务上比较困难。
⚫ 可信度问题
通用大模型,仅靠其自身的问题求解能力无法解决做专业问题。
不能直接应用于垂直型领域,需要借助于垂直领域的信息等助力,让大
模型充分理解金融专业领域的相关知识,比如金融领域已有的专业数据
库、专业知识图谱和其他的资源,跟大模型对接。
此外对于金融应用来说,金融行业的客户对上线模型的精度要求很
高,而通用大模型不足够满足金融的高专业化需求。
⚫ 错误信息
由于技术问题,大模型目前还没有解决实时性和准确性的问题,
所用的语料库依然较为有限,因此会出现一些偏差,产生无意义的相应。
如果利用 ChatGPT 大模型推荐某银行理财给客户,没有考虑客户的实
际需求,造成真实需求与推荐产品的不一致,扰乱市场秩序。如果推
荐股票等金融资产,有操纵市场的嫌疑,这些目前无法避免。
加之,大模型的回答会影响人的判断和行为,如果给出一个错误方
案给银行客户使用,会把风险转嫁给银行,给银行带来信誉风险。
⚫ 安全与合规性问题
数据泄露和信息杀熟等问题会出现,金融行业涉及到消费者的重大
利益,对于金融交易的公平性、可解释性、合规性都很重要,利用大模
型很可能无法保证决策的安全、准确、公平性,加之涉及到的网络安全
问题,数据的隐私保护,合规性问题都是亟需考虑到的风险。
108
⚫ 知识产权、伦理与监管问题
目前现有的大模型还是不断接近人类的回答,但是短期还没办法
超越人类思维,只是一个智能的百科全书,缺少创造性思维,即没有创
造出人类不了解的新知识,新内容。因此,在实际应用场景中,大模型
生成的内容可能不具有原创性,会导致存在剽窃方面的风险。而使用
大模型带来不良后果的责任该由谁来承担,相关的法律问题,以及如
何应对大模型广泛应用后可能存在的无序商业行为、对算法和数据进
行监管,消除潜在的隐患,助力技术的良好发展也亟待研究。
(五)AIGC 发展的建议与举措
1. 法律法规
当前,国内的监管主要通过多部法律法规的衔接来实现,形成了
一套完备的人工智能监管体系。但通过制定针对不同业态的法规,对
生成式人工智能进行监管。
《生成式人工智能服务管理办法(征求意见稿)》是国内重要的
监管文件之一。该办法明确了监管对象的范围,包括向中华人民共和
国境内公众提供服务的主体和利用生成式人工智能产品提供服务的
主体。这意味着涉及生成式人工智能在境内使用的各类主体都应受到
监管。
该办法还对模型监管和内容监管提出了相应要求。模型监管主要关
注训练数据、算法设计和模型生成与优化。监管机构要关注模型是否存
在人工智能歧视、风险、知识产权侵权以及训练数据的真实性、准确性、
客观性和多样性等问题。内容监管则侧重于内容的真实准确
109
性、国家安全、歧视、知识产权侵权、虚假信息传播、商业秘密以及个
人隐私泄露等方面。
对于违法行为,如果涉及到《网络安全法》、《数据安全法》和
《个人信息保护法》等已有的法律法规规定,相关条款将予以规制。
对于未涉及到现有法律法规的情况,根据《生成式人工智能服务管理办
法(征求意见稿)》的规定,监管机构将采取警告、批评、责令限期改
正等措施进行惩罚,严重情况下可能会暂停或终止服务,并处以罚款。
此外,监管机构还鼓励企业关注地方性政策举措,如北京市发布
的《北京市促进通用人工智能创新发展的若干措施(征求意见稿)》。
这些地方性政策可能具有更灵活、包容审慎的监管态度,通过创新机制
和流程,加强行业的自律自制,避免一刀切或过度监管的方式。
为了应对生成式人工智能的快速发展和广泛应用,未来的相关法规
在以下方面也可以有更充分的约束:首先,加强数据隐私保护,确保用
户个人信息安全和隐私不受侵犯;其次,提高透明度和可解释性, 要求生
成式人工智能算法的开发者和提供者提供更多的信息,使用户能够理解
算法运作方式;第三,加强伦理和道德约束,制定伦理准则和行业标准,
防止生成式人工智能被滥用或用于不当用途;第四,强化风险评估和监
测,建立全面的风险评估机制,及时发现并应对潜在的风险和问题;第
五,促进国际合作和标准化,加强国际间的合作, 共同制定生成式人工
智能的国际标准和规范;最后,加强公众参与和教育,鼓励公众参与法
规制定过程,加强对公众和从业人员的教育和
110
培训,提高对生成式人工智能技术和应用的理解和意识。通过这些改
进,未来的生成式人工智能法规将更好地适应技术发展,并保障社会
的整体利益和发展。
2. 人 才
当代人工智能行业中,生成式人工智能领域面临着严重的人才供需
失衡问题,是制约 AI 大模型发展的重要因素。根据报道和数据, 算法
方向是最具挑战的招聘岗位之一,其中视觉算法工程师的供需比仅为
,意味着竞争激烈,平均有 家企业争夺 1 个人才。此外,生
成式人工智能领域的人才需求持续增长,而供给却严重不足, 导致行
业内人才紧缺现象日益突出。
人工智能领域对人才的需求量大且复杂,这要求求职者具备较高
的学术背景和专业技能。数据显示,近九成的算法工程师拥有硕士或博
士学历,硕士以上学历要求的岗位占比为 %,博士以上学历要求
的岗位占比为 %。这表明在人工智能领域,专业知识和技能的深
度和广度对于求职者的要求极高,这也是导致供给不足的一个重要原
因。
因此,未来需要加强人才培养和引进,建立完善的人才培养体系, 提
高人才的技术水平和创新能力。人工智能行业在解决人才供需失衡问题
方面可以采取多种策略。首先,加强人工智能领域的教育和培养。这包括
增加相关学术课程和专业培训,为学生提供系统化的人才培养方案,以
满足行业对高素质人才的需求。此外,支持高校设立人工智能相关专业,
并提供资源和资金支持,培养更多的人才。
111
产学研结合是解决人才供需失衡的重要途径。通过与企业合作开
展实践项目,将人工智能技术与实际应用相结合,为人才提供实际工
作经验和培训机会,以加速人才的培养和成长。这种方式可以提高学生
的实践能力,同时满足企业对人才的需求,促进人工智能行业的发展。
加强国际合作和人才引进也是缓解人才供需失衡问题的关键策
略之一。通过与国际合作伙伴合作,引进海外优秀人才,分享知识和
经验,可以提升整个人工智能领域的水平。同时,可以借鉴其他国家
或地区在人工智能人才培养方面的经验,以加速人才培养和引进的进
程。
企业需要打造良好的口碑和差异化优势,以吸引和留住人工智能
人才。提供良好的职业发展机会、晋升通道和福利待遇,创造具有吸
引力的工作环境,将有助于吸引和留住优秀的人才。同时,拓宽人才
招聘渠道,除了传统的校园招聘,还可以通过猎头服务、职业社交平
台等多元化的渠道来吸引人才,扩大招聘范围。
给予人工智能人才合理的薪酬待遇也是吸引和留住人才的重要
因素。鉴于人工智能领域的人才紧缺,提供具有竞争力的薪酬和福利, 将
有助于吸引优秀的人才并提高其留任率。
当前生成式人工智能领域面临着严重的人才供需失衡问题。通过
加强教育和培养、产学研结合、国际合作和人才引进、塑造良好的企
业口碑和差异化优势、拓宽招聘渠道以及提供合理的薪酬待遇,可以
逐步缓解人才紧缺问题,并推动人工智能领域的发展和创新。这些努
112
力将有助于满足人工智能行业对高素质人才的需求,推动行业的可持
续发展。
3. 生 态
为了构建更完善的生成式人工智能生态,有几个关键方面值得深
入考虑。
(1) 开放数据和数据共享是推动生成式人工智能生态系统发展
的基石。
通过建立标准化的数据集和共享平台,鼓励数据提供者贡献数据集,
可以增加可用的训练数据量。此外,确保数据使用的合规性和隐私保护
也是至关重要的。这将促进更广泛的数据集使用和互操作性, 从而为生
成式人工智能技术的研究和应用提供更强大的基础。
资源和工具的共享是构建强大生成式人工智能生态系统的关键
因素之一。通过开源算法、模型和工具的共享,可以降低技术门槛,
促进创新和协作。共享代码库、工作流程和开发者资源,有助于加速生
成式人工智能技术的发展,同时也为开发者提供了丰富的参考和支持。
(2) 支持开放研究合作是构建生成式人工智能生态的重要方面。
学术界、研究机构和企业之间的合作与交流能够推动生成式人工
智能技术的共同研究和开发。通过共享研究成果、论文和实验数据,
加强开放科学精神,可以促进领域内知识的积累和共享,进一步推动生
成式人工智能技术的创新和应用。
建立伦理和法律框架至关重要。生成式人工智能技术的发展应与
113
伦理原则和法律法规相协调。制定适当的法律和政策框架,确保生成
式人工智能的应用和使用符合社会和法律准则,保护个人隐私和数据
安全。同时,伦理准则和道德规范的制定可以确保生成式人工智能技
术的公正、透明和可信度,避免潜在的滥用和偏见。
用户参与和反馈机制也是生成式人工智能生态系统的关键组成
部分。用户的反馈和需求应被重视,并纳入系统改进和优化的过程中。建
立用户参与的机制,例如用户调查、用户测试和用户反馈渠道,有助于
生成式人工智能技术与用户需求更好地契合,从而提升用户体验和技术
的实用性。
教育和意识提升对于构建更好的生成式人工智能生态系统至关
重要。通过开展相关的教育和宣传活动,可以提高公众对生成式人工智
能技术的认知和理解。公众的科学素养的提升将有助于更广泛的参与和
理性的讨论,同时引起对与生成式人工智能相关的伦理、社会和政策问
题的关注。这将为生成式人工智能的应用和发展提供更加全面和平衡的
视角。
通过在上述方面进行积极努力,可以建立一个更加开放、协作和
健康的生成式人工智能生态系统,为技术的创新和应用提供更广阔的
空间,并确保其符合伦理、社会和法律的准则。
二、元宇宙与金融
(一)金融元宇宙的内涵
2022 年是元宇宙热度高点,但步入 2023 年,元宇宙热度日益减
弱,甚至遭遇市场唱衰,日益退潮。究其原因,元宇宙的概念依赖于
114
先进的技术,如虚拟现实和增强现实。然而,目前的技术水平还无法完
全实现元宇宙的愿景。元宇宙的商业模式尚未完全确立,许多公司和投
资者可能对如何盈利感到困惑。人工智能热度的兴起引起了市场和媒体
的短期关注点的变化。但这些并不代表元宇宙的重要性或价值发生了改
变,它的发展将对未来社会、经济和技术都将产生深远影响。
尽管元宇宙的退潮可能受到这些因素的影响,但是大模型的发展
和人工智能技术的进步可能为元宇宙的再次兴起提供机会。大模型和
人工智能技术可以帮助解决元宇宙面临的一些技术挑战,例如提高虚
拟现实的逼真度和交互性。此外,人工智能技术还可以促进元宇宙的
商业模式创新,例如通过智能合约和去中心化的金融技术实现更高效的
交易和支付。因此,随着人工智能技术的不断发展和应用,元宇宙有
望再次兴起并实现更广泛的应用。
1. 金融元宇宙与元宇宙金融
元宇宙集成技术与金融行业的如何更好的融合,我们先从两个相
互关联但又有各自侧重点的概念引入:元宇宙金融和金融元宇宙。
元宇宙金融主要关注在元宇宙环境中提供的金融服务,这些服务
包括但不限于土地和房地产交易、贸易融资、数字货币交易等。元宇宙
金融是建立在元宇宙发展的基础之上的,因为元宇宙本身是一个虚拟的
现实映射,其中涉及到许多交易和服务,需要金融服务作为支撑。因此,
元宇宙金融的发展与元宇宙本身的发展密切相关,可以说是元宇宙发展
的一个重要组成部分。
而金融元宇宙则更加侧重于将现实世界的金融体系和金融服务
115
带入到元宇宙中,将现实世界的金融服务与元宇宙环境进行更加紧密的
结合,以提供更加贴合元宇宙需求的金融服务。金融元宇宙可以包括虚
拟银行、虚拟保险、虚拟证券交易等各种金融服务的提供。这些服务在
现实世界中都有对应的金融服务,但在元宇宙中,这些服务可以通过数
字技术进行更加高效、便捷的提供。因此,金融元宇宙更加关注的是如
何将现实世界的金融服务与元宇宙的环境和需求相结合, 提供更加适应
元宇宙的金融服务。
无论从元宇宙金融也好,还是从金融元宇宙来讲,都需要定义清
晰的边界和共享的广度。因为从宇宙角度来讲,宇宙里面所有内容都需
要一个统一的认定共识,才能建立以标识为基础的价值体系。比如说,
美国和中国各建立一个互不相联的元宇宙系统,那从宏观面上来讲,
两个都是宇宙孤岛。从金融元宇宙来说,同样需要一个统一标识体系才
能建立经济系统,标识体系一定会伴有既定的转化或桥接规则才能完成
在不同元宇宙子系统之间的穿梭。进一步说,金融元宇宙想要实现虚实
共生、虚实融生,需要解决物理世界与虚拟世界的映射问题,这同样
需要标识体系的建立。
2. 金融元宇宙的主要特征
金融元宇宙是基于元宇宙概念,使用扩展现实、数字孪生、区块链、
人工智能、算力网络、5G/6G 通讯、高速光纤通信、物联网和电子游戏
等技术建立的虚拟数字银行。它与实体银行相互映射和交互, 可以为
客户提供与传统银行类似的服务,同时还能提供虚拟世界中的各种服务。
金融元宇宙具有以下主要特征:
116
多元化特征:金融元宇宙是一个建立在虚拟数字世界与现实世界
之间的新型银行,它以多维的虚拟银行服务和现实银行服务相互切换
为主要特色。一方面,金融元宇宙通过虚拟世界数字人为现实世界的自
然人提供银行服务,包括对公、对私等传统银行服务,同时还可以构
建各类虚拟生态场景,提供休闲娱乐、衣食起居场景等服务,满足客户
的多样化需求。另一方面,金融元宇宙还能提供虚拟世界数字人之间的
银行服务,让客户在虚拟世界中进行金融交易和互动。金融元宇宙的优
势在于它不仅可以提供传统银行的服务,还可以通过构建虚拟生态场
景和数字人之间的互动,为客户提供全新的服务和体验,这是实体银
行无法做到的。
沉浸式体验:金融元宇宙借助虚拟交互技术,实现银行客服人员
的数字化分身与客户进行沉浸式的互动陪伴,让客户在享受银行服务
的同时,感受到强烈的沉浸感和体验感。在金融元宇宙中,银行客服
人员的数字化分身可以融入客户的虚拟旅程中,与客户进行游乐式的交
互,包括解答客户的疑惑、与客户交流需求、协助客户办理业务等。这种
交互方式不仅让客户感受到银行的贴心服务,同时也增加了客户与银
行的互动和信任。此外,金融元宇宙还借助可穿戴设备为客户提供极具
沉浸感的体验氛围。这些可穿戴设备通过强大的视觉效果和多感知信息
的呈现方式,让客户感受到身临其境的银行服务体验,增强了客户与银
行的情感连接和忠诚度。
无感化互动:金融元宇宙采用声控、虹膜识别等技术,以及嵌入
VR 等穿戴设备的硬件安全芯片,实现了客户身份的快速识别和验证。
117
客户的身份和账户信息被存储在硬件安全芯片和金融元宇宙的应用
系统中,确保了客户信息的安全性和隐私性。当客户进入金融元宇宙
时,无需输入大量的信息,只需通过声控或虹膜识别等方式进行身份验
证。然后,客户只需以游乐的方式回答少许问题,即可完成与银行的
无感互动,快速办理各项银行业务。这种无感化的互动方式,不仅提高
了业务办理的效率和客户体验,同时也降低了银行的运营成本和客户的
时间成本。总之,金融元宇宙通过采用先进的技术和设备,实现了客户
身份验证的无感化和业务办理的高效化,为客户提供更加便捷、个性
化的金融服务。
定制化服务:金融元宇宙基于图像处理、声控、自然语言处理等多
项技术,实现了客户旅程中不同场景和不同生态活动的无缝切换, 以满
足客户极度个性化的需求。在金融元宇宙中,人工智能技术被广泛应用,
能够智能化感知客户旅程的变化,并根据客户的偏好和需求, 动态调整产
品和服务配置,为客户提供极致个性化的服务。银行员工通过使用模块
化、拖拽式的产品和服务组合方式,能够快速响应客户需求,创造出丰
富多样的服务体验。同时,金融元宇宙业务系统也具备智能化的处理能
力,能够快速响应用户的请求,提供高效便捷的服务。通过这种方式,
金融元宇宙不仅能够满足客户的传统银行服务需求,还能够在不同场景
和生态活动中提供个性化的服务体验,从而吸引更多的客户并提高客户
满意度。总之,金融元宇宙通过采用先进的技术和智能化处理能力,实
现了客户旅程的无缝切换和个性化服务定制,为客户提供更加便捷、个
性化的金融服务。
118
主导性服务渠道:金融元宇宙借助扩展现实和数字孪生技术,通 过
客户佩戴嵌入硬件芯片的穿戴设备,实现虚拟世界与现实世界的交 互。
客户可以通过穿戴设备自由进入金融元宇宙,无需受限于时空的 限制。
在金融元宇宙中,客户可以自行办理各项银行业务,并获得银 行提供的
各种服务,包括对公、对私等传统银行服务,以及在虚拟生 态场景中提
供的休闲娱乐、衣食起居等个性化服务。金融元宇宙还具 备实时处理客
户交易信息的能力,确保客户信息安全和交易的准确性。随着技术的发展
和客户需求的不断变化,金融元宇宙将成为银行主导 性的服务渠道,而
实体网点和现有的网上银行、移动银行等将逐步被 替代或大部分被替代。
这种新型的金融服务模式将为客户提供更加便 捷、个性化的体验,同时
也推动了银行服务模式的创新和发展。
然而,尽管元宇宙在银行业的应用已有些许尝试,但目前尚未有
一家银行能够完全具备以上提到的五个特点,构建出一个真正的金融
元宇宙。这仍然是一个有待探索和开发的领域。
(二)国内外金融业的元宇宙应用
目前,元宇宙在国内外金融业的应用和服务主要包括以下方面:
1)构建元宇宙分行或营业厅:这种分行或营业厅通常以业务咨询、
信息查询、广告宣传为主,但服务内容相对较少。2)推出虚拟数字
员工:这些虚拟员工主要承担为银行宣传营销、为客户答疑解惑、对银
行员工及客户进行金融知识教育培训等职能。3)发行数字藏品: 这种
做法为银行引流、获客、活客,塑造品牌价值。
1. 虚拟营业厅
119
自今年以来,多家银行在元宇宙领域持续深耕,取得了在虚拟营
业场景等方面的突破。业内人士认为,打造元宇宙业务对于银行来说
具有重要意义,因为它能帮助银行打破金融服务同质化,赢得新一代年
轻客群。然而,与此同时,银行也需要注意元宇宙的不确定性和复杂性
可能对现有风险管理体系带来的冲击。
同时,元宇宙为银行打破金融服务同质化提供了新的路径。在服务
和营销场景建设方面,中信银行、工商银行、百信银行、南京银行等都
推出了虚拟服务场景,让客户可以在 3D 沉浸式空间中自由行走、参与
游戏、领取奖品,并从客服人员处了解银行金融业务。这种模式打破了
时间与空间的限制,使客户仿佛置身于虚幻场景中,产生沉浸式新奇体
验。
在业务场景探索中,虽然目前商业银行对元宇宙的应用还都是基
于单一场景的简单业务,仅起到补充作用,但元宇宙银行生态系统的目
标模式已经开始模糊形成。虽然业务模式和盈利模式还有待进一步开
发,但元宇宙在银行业的应用已经展现出巨大的潜力。
随着元宇宙技术的不断发展,银行将能够提供更加丰富多样的服
务,从而满足客户的多元化需求。例如,客户可以在虚拟营业厅中通过
虚拟现实技术进行投资咨询、贷款申请等业务操作,这将大大提高客
户服务的便利性和效率。
表 国内银行虚拟营业厅概况
银行 发行年份 虚拟营业厅主要功能
国外银行
120
摩根大通(JP
Morgan)
2020 年 在提供数字货币交易服务,虚拟投资咨询,虚拟投资组合管
理等服务,同时还提供了虚拟投资顾问服务,帮助客户做出
更明智的投资决策。此外,该虚拟营业厅还提供了虚拟培训
课程,帮助客户更好地了解投资知识和市场趋势。
星展银行(DBS
Bank)
2021 年 在 sandbox 中购入虚拟土地结合沉浸式元素开发,创建新加
坡宇宙
国内银行
中国工商银行 2020 年
中国农业银行 2021 年
中国建设银行 2021 年
提供虚拟投资咨询,虚拟投资组合管理,虚拟贷款申请等服
务,同时还可以通过虚拟现实技术为客户提供虚拟的贷款申
请体验。此外,该虚拟营业厅还提供了虚拟投资组合分析工
具,帮助客户更好地了解自己的投资组合情况和风险分布。
中国邮政储蓄银
行
2022 年 提供基金、存金通等业务办理、更有专家在线解读等服务;
用户可以在微信银行、个人网银、手机银行 APP“邮储食堂”
进行查看、购买和赎回等操作。同时提供基金经理在线答
疑、定投计划定制、基金知识普及等特色服务。
招商银行 2022 年 提供虚拟投资咨询,虚拟投资组合管理,虚拟贷款申请等服
务,同时还可以通过虚拟现实技术为客户提供虚拟的贷款申
请体验。此外,该虚拟营业厅还提供了智能化的风险评估工
具和个性化的投资建议服务,帮助客户更好地了解自己的风
险承受能力和投资目标。
民生银行 2022 年 民生银行在“非凡财富”品牌下打造“元宇宙财富”专区,并推
出“民生云·代”全新服务模式。客户可以通过 VR 或 3D 方式体
验金融服务和线上“云理财”服务;通过游戏化的理财体 验、
专属化的理财服务、智慧化的投顾服务等功能实现代销及自
销业务的沉浸式体验。同时提供财富规划、资产配置、理财
经理等服务。用户可以在 VR 或 3D 场景中体验财富管理服
务、参加理财知识互动游戏、与理财经理进行线上沟通交流
等。民生云·代服务模式旨在满足年轻用户对于数字化、
智能化、个性化的金融服务需求。
中信银行 2023 年 中信银打造的首个全真互联元宇宙应用场景——中信元宇。
用户可以在元宇宙中享受沉浸式的金融服务体验,包括财富
管理理念培训、基金可视化、信用卡申请、数字藏品、虚拟
人服务等。中信元宇宙的推出旨在为用户提供更加便捷、高
121
效、个性化的金融服务体验。同时也可以提高中信银行的数
字化程度和品牌形象。
2. 虚拟数字员工
近年来,随着信息科技的飞速发展,虚拟数字员工已经成为一种
新兴的应用形式。在银行业,虚拟数字员工有望在产品宣传、客户营
销、客户权益、组织文化建设等领域开拓应用,进一步提升银行的服务
水平。
(1)数字人与数字员工
数字人和数字员工是两个相互关联但又有区别的概念。数字员工,
也称为数字化劳动力,是通过数字化技术创造的虚拟工作人员,可以 打
破人与机器的边界,为企业的用工模式注入“活力”。从广义上讲, 数字
员工是指通过各种新兴技术创造出的虚拟工作人员。而从狭义上 而言,
数字员工是基于 RPA 的软件服务。在银行业,已有许多银行将 RPA
相关软件服务称为“数字员工”。数字员工相对于人工具有不出现情绪问
题可连续工作等优点,其标准化程度高,可以为银行业提 高效率、降低
运营成本。数字人则是通过计算机模拟出一个类似真人 的虚拟人形象。
人物形象、语音生成模块、动画生成模块、音视频合 成显示模块和交互
模块构成了虚拟数字人通用系统框架。数字人可以 被视为一种拟人化的
形象,其创造既可以是凭空创造,也可以基于真 人进行“克隆”。
然而,随着时代的发展,数字员工和数字人之间的界限逐渐模糊,
两者之间出现了交集。目前,数字员工可以从形象上分为具有拟人化
122
形象和无可见形象两种类型,前者可以作为数字人员工,后者则单纯
的软件服务。而数字人则可以分为身份型和服务型两类,前者可以被
打造成为虚拟代言人,后者则可以提供办公等服务,实现部分人力资源
的替代,即数字人员工。通俗来讲,数字员工可以是数字人,也可以不
是;数字人可以是数字员工也可以不是。
总的来说,数字员工和数字人的相互渗透正在推动银行业的创新
和变革。这三种模式的发展和成熟将为银行业务的高效运转提供强大
的支持,同时也将帮助银行更好地满足客户的需求和期望。
(2)应用场景
虚拟数字员工主要应用于四大场景以提升的银行服务水平。
产品宣传:虚拟数字员工可以在手机银行、网银、公众号、网点
大屏等多渠道为客户提供现金理财、基金推介等产品的信息介绍或业
务宣传,升级服务体验。
营销活动:虚拟数字员工可以在发布会、展会、产品推介会、网 点
沙龙上提供智能解说、游戏互动、线上展厅等服务提升客户体验, 增强
业务营销能力。虚拟数字员工可以成为银行客户经理的销售助理、客服人
员,随时调阅及应答基础性问题,将客户经理的精力投放在满 足特殊需
及个性化服务上。
客户权益:在银行客户权益类产品的积分兑换、优惠券获取等权益
类业务上,使用虚拟数字员提升活动的趣味性;在服务企业客户时, 使用
虚拟数字员工将提升服务的便利性和客户体验。
组织文化建设:使用虚拟员工丰富培训方式,建设解说展馆、快
123
速生成培训材料播,提升员工业务素质,助力组织文化建设。
表 国内外银行虚拟数字员工概况
银行 发行年份 数字人应用功能
国外银行
摩根大通(JP
Morgan)
2020 年 产品宣传、客户营销、客户权益、组织文化建设、其他
花旗银行
(CitiBank)
2022 年 产品宣传、客户权益、其他
国内银行
中国农业银行 2021 年 产品宣传、客户营销、客户权益、组织文化建设、其他
中国农业银行 2021 年 产品宣传、客户营销、客户权益、组织文化建设、其他
中国建设银行 2021 年 产品宣传、客户营销、客户权益、组织文化建设、其他
中国邮政储蓄银行 2022 年 产品宣传、客户营销、客户权益、组织文化建设、其他
招商银行 2022 年 产品宣传、客户营销、客户权益、组织文化建设、其他
中信银行 2023 年 产品宣传、客户营销、客户权益、组织文化建设、其他
民生银行 2023 年 产品宣传、客户营销、客户权益、组织文化建设、其他
3. 数字藏品
数字藏品是基于 NFT 技术的中国特色路径实现,为数字资产提
供真实性和所有权证明的一种创新应用模式。我国数字藏品与 NFT
本质区别在于国内数字藏品不具备 NFT 的资金属性及社交属性,与
虚拟货币划清了明确的界限。
商业银行通过运用数字藏品,借助线上渠道优势快速传播和触达
客户,用于品牌宣传、获客以及促活。在品牌宣传方面,商业银行可通
过发行银行专属 IP 形象对应的数字藏品以提升自身品牌影响力, 增
强品牌亲和力。在获客方面,商业银行通过发行特定主题的数字藏品,
借助春节、元宵节等重大节假日氛围进行宣传与推介,以此激发互联
网话题效应,吸引客户参与和转发,以此实现各类业务场景的引
124
流拉新。在促活方面,数字藏品可作为商业银行新的营销手段甚至优
惠通道,和现有的理财产品、会员系统、积分兑换、消费挑战等产品或
场景结合,实现组合式营销,以此实现睡眠客户激活。数字藏品将有
望为商业银行打开互联网营销的另一扇大门。
目前,国内有工商银行、邮储银行、招商银行、微众银行等超过
13 家商业银行实现了数字藏品业务的上线,运用数字藏品探索创新
型营销之路。
(三)国内金融元宇宙建设面临的技术难点
1. 技术体系异常复杂且存在短板
金融元宇宙的建设是一项涉及多种新技术的复杂工程,包括扩展
现实、数字孪生、区块链、人工智能、算力网络、5G/6G 通讯、高速
光纤通信、物联网和电子游戏等。这些技术需要深度融合,以实现金
融元宇宙的各项功能和服务。
目前,金融元宇宙建设所依赖的多种新技术正在不断发展和创新。
其中,扩展现实技术可以帮助客户在虚拟世界中获得真实的体验,而 数
字孪生技术则可以为客户提供更加准确的虚拟服务。
区块链技术可以保证银行交易的安全性和可信度,而人工智能技
术则可以帮助银行提供更加智能化的服务。算力网络技术可以为客户
提供更加高效的计算能力,而 5G/6G 通讯技术则可以为客户提供更
加快速和稳定的网络连接。
然而,尽管这些技术在不断发展创新,但目前它们仍处于不同的
125
阶段,有些技术还面临一些挑战和局限性。例如,实现扩展现实的 VR 头
盔和眼镜等终端接入设备仍存在不够便携、沉重、眩晕、分辨率与刷
新率低、续航能力差等问题。
人工智能的热门算法深度学习也存在不可靠和不可解释等局限
性。此外,带有噪声或误差的训练数据可能会影响算法模型的准确性。
因此,金融元宇宙建设面临的不仅仅是技术体系的问题,还面临
着某些技术存在的短板和限制。为了克服这些挑战,需要采用各种技术
手段来解决问题,如优化算法、改进硬件设计、数据处理和模型训练
等。只有这样,才能建立一个高效、可靠、便捷的金融元宇宙服务体系,
满足客户的需求。
2. 应用开发尚未形成成熟案例
在元宇宙应用开发方面,国内外的银行业已经取得了一定的进展。
然而,目前这些应用主要集中在游戏、社交、媒体和广告等领域,银 行
自己开发的应用系统也主要面向查询、咨询、广告、教育、培训和 数字
人等方向,极少有实质性的动账类金融交易方面的探索。2023 年6 月,
中信金融元宇宙支付创新刚刚实现在话费充值场景的全链路支付功能,
完成了基于虚拟现实设备的真实话费充值支付案例,并报送 至银保监会。
目前,尚未有一套成熟、完整的金融元宇宙技术开发平 台,也没有一套
能够支撑银行开展涵盖动账类核心业务的应用系统。因此,开发“多元化、
沉浸化、无感化、定制化、主导化”的金融元宇 宙业务系统仍然缺乏可
复制的成熟案例。当前,金融元宇宙业务系统 的开发还处于探索期。为
了实现实质性的动账类金融交易和推广定制
126
化的金融元宇宙业务系统,需要不断探索和创新技术方案,并建立完善
的监管体系,以确保银行在元宇宙中的业务能够安全、稳定地发展。
3. 数据安全的技术管控难度加大
金融元宇宙基于三维空间和多重感官为客户提供服务,这将使得
数据的收集和使用更加全面、广泛和多样化。
一方面,金融元宇宙场景以及用户生理、行为、交易、社交和感
官体验等数据将大幅度增长,数据的分级分类安全保护技术将面临更
大的挑战。
另一方面,用户以虚拟数字人身份访问金融元宇宙,也增加了用
户虚拟身份被盗取的风险。因此,需要加强技术手段,保障用户虚拟
身份的安全性,防止用户的个人信息和资产受到损失。
为了应对这些挑战,金融元宇宙需要采用更加先进的数据安全保护
技术和措施,例如数据加密、身份验证、访问控制等。同时,也需要建
立完善的监管体系,对金融元宇宙的业务活动进行监管和管理, 确保银
行在数据收集、使用和保护方面符合相关法律法规和行业标准的要求。
4. 网络安全攻击的风险点增多
未来,金融元宇宙将为客户提供更加多元化的服务,超越目前银 行
的服务范围和内容。金融元宇宙的业务系统将演变成一个超大规模、极致
开放的复杂系统,这将增加被黑客攻击的风险点。例如,金融元 宇宙向
用户提供的 VR 头盔、眼镜等多种形式的终端接口都可能成为黑客攻击
的目标。
127
为了提供无感化的客户体验,金融元宇宙增加了交易链路防黑客攻
击的技术难度。此外,各项技术的深度融合也可能出现其他引发网络攻
击的未知风险点。因此,金融元宇宙需要采取更加先进的安全防护措施,
例如加强身份验证、访问控制、数据加密等方面的技术手段, 以确保客户
信息和资产的安全性。同时,银行需要不断创新技术手段, 提高安全防
御能力和响应速度,以应对不断变化的网络安全威胁。
同时,金融元宇宙也需要建立完善的监管体系,对银行的业务活
动进行监管和管理,确保银行在数据收集、使用和保护方面符合相关法
律法规和行业标准的要求。通过这些措施,金融元宇宙可以确保客户
在享受多元化服务的同时,保障客户信息和资产的安全性。
5. 技术人才缺乏
多年来,国内产学研和银行业在人工智能、区块链、云计算、大
数据等领域不断加大投入,已经取得了显著的成效,并积累了一定的
专业技术人才。然而,对于 VR(虚拟现实)、AR(增强现实)、MR
(混合现实)、XR(扩展现实)、虚拟数字人等元宇宙技术以及具备
开发能力的专业人才数量仍然很少,特别是银行业在这方面存在严重
的匮乏。这种情况在一定程度上制约了金融元宇宙的发展。
为了推动金融元宇宙的进一步发展,我们需要采取一系列措施来
加强人才培养和技术支持。首先,可以通过加强与高校和科研机构的
合作,共同培养具备元宇宙技术的专业人才。其次,可以通过引进国外
先进的技术和设备,提高国内元宇宙技术的研发水平。此外,还可以
通过开展专业培训和技能提升计划,帮助现有的银行业从业者掌握
128
元宇宙技术并提高开发能力。
同时,银行业也需要积极探索新的业务模式和产品服务,以适应
元宇宙时代的需求。例如,可以开发基于元宇宙技术的虚拟银行、数
字货币等创新产品,以满足客户日益增长的需求。此外,还可以通过
与元宇宙企业合作,共同探索新的业务合作模式,实现互利共赢。
通过这些措施的实施,我们可以逐步解决金融元宇宙发展中的人才
瓶颈问题,推动金融元宇宙的快速发展。同时,也可以为国内银行业提
供更加多元化、智能化的服务,提升其在金融科技领域的竞争力。
(四)国内金融元宇宙建设所面临技术难点的解决对策
1. 做好顶层设计
在金融元宇宙建设过程中,商业银行需要坚定信心、保持定力,
并做好顶层设计和战略谋划。
首先,商业银行应该充分认识到金融元宇宙作为一项探索中的科
学技术,发展过程中的每个阶段必然有每个阶段的局限性。在建设金融
元宇宙的过程中,商业银行将面临许多挑战,甚至会面临许多失败和试
错成本。这是必然的,绝不可能一蹴而就。因此,商业银行需要具备坚
定的信心和定力,以应对这些挑战和局限性。
其次,商业银行应该坚定地把金融元宇宙建设纳入银行发展战略,
把金融元宇宙建设作为银行数字化转型新的重要抓手,以及赢得战略 先
机的新战场、新赛道。通过将金融元宇宙建设纳入发展战略,商业 银行
可以更好地把握未来发展趋势,抢占市场先机,提高数字化转型 的效率
和效果。
129
最后,商业银行需要分阶段推进金融元宇宙建设。第一阶段是构
建金融元宇宙原型,即基于元宇宙理念及技术,构建平行于实体银行
同时又高度互通的金融元宇宙的业务及技术框架。这一阶段主要是为
了探索金融元宇宙的发展方向和业务模式,需要重点解决金融元宇宙
的基本架构、技术标准和业务规范等问题,为后续的技术开发和业务
推广提供基础。
第二阶段是构建金融元宇宙技术支撑平台,即深度融合金融元宇 宙
建设所涉及的各类技术,整合形成一套可支持应用开发的技术平台。这一
阶段主要是为了提高金融元宇宙的技术水平和应用能力,重点解 决金融
元宇宙的技术集成、数据共享和安全保障等问题,为后续的金 融元宇宙
业务推广提供技术支持。
第三阶段是构建金融元宇宙业务系统,即研发并逐步推出具备
“多元化、沉浸化、无感化、定制化、主导化”特征的元宇宙金融服务。
这一阶段主要是为了满足客户日益增长的需求,重点解决金融元宇宙
的业务模式、服务体验和风险控制等问题,提高银行的业务水平和市
场竞争力。
通过以上三个阶段的推进,商业银行可以逐步实现金融元宇宙建
设的目标,突破技术瓶颈创新业务模式,为客户提供更加多元化、沉浸
化、无感化、定制化和主导化的金融元宇宙服务。同时,商业银行也
需要根据实际情况不断调整和完善战略规划,加强与相关技术企业和
金融机构的合作,以应对不断变化的市场环境和客户需求。
2. 把握技术进步契机,确保不失先机
130
随着元宇宙技术的日益发展,商业银行在建设金融元宇宙时应该
抓住每一次技术进步的契机,不错过任何一次发展机会。
首先,商业银行应该建立一套紧密跟踪元宇宙技术和金融元宇宙
发展趋势的机制,专门研究元宇宙技术在银行的应用,并针对金融元宇
宙建设过程中面临的技术短板、数据安全和网络安全等问题进行科研
攻关。有条件的商业银行可以与头部企业、高校和科研单位合作建立
联合实验室,保持与元宇宙技术的发展同步。
其次,商业银行应该积极参与或组织与监管机构、企业、高校和
科研单位的研讨和交流等活动,集思广益,及时借鉴先进经验,解决实
际问题。通过与各方的交流和合作,可以更好地推动金融元宇宙的建设
和发展。
最后,商业银行应该积极参与监管机构、企业、高校和科研单位
组织的元宇宙和金融元宇宙相关技术标准、规范的制定工作,或者主动
组织或推动该项工作。通过参与制定标准、规范,商业银行可以牢固树
立按照标准、规范建设金融元宇宙的理念,避免不必要的返工和浪费。
3. 抓实人才,夯实发展根基
建设金融元宇宙需要注重人才培养,夯实发展根基。首先,商业
银行应该建立一套针对熟悉元宇宙技术的专业人才的市场化引进机
制。通过在晋级、薪酬等方面给予倾斜,按照市场化原则运作,真正
能够吸引这类人才进入银行。这不仅可以提高银行的专业水平,也有
助于推动金融元宇宙的创新和发展。其次,商业银行应该完善现有的
131
科技人才培养机制,加快对现有人才的培养,充分挖掘现有人才的潜 力。
通过提供良好的学习和发展机会,鼓励员工不断提升自己的技能 和知识,
让现有人才能够脱颖而出,为金融元宇宙的建设做出更大的 贡献。此外,
商业银行应该建立由技术与业务人员组成的专业化团队, 并保障团队人员
数量和骨干人员的稳定性。通过组建这样一个专职团 队,专职推进金融
元宇宙的建设工作,可以更好地推动金融元宇宙的 创新和发展。通过以
上措施的实施,商业银行可以建立一支高素质、专业化的人才队伍,为金
融元宇宙的建设和发展提供坚实的人才基础。
4. 与区块链、大模型等前沿技术融合共赢
元宇宙作为一个新兴的概念,它需要与多种前沿技术进行融合才
能实现最大化效益。通过与区块链、大模型的前沿技术融合,可以提
供更加安全、智能、高效的服务和体验,从而促进元宇宙的发展和应
用。
(2)元宇宙与大模型
元宇宙与大模型的融合在提供更加高效的服务和体验方面具有 显
著的优势。大模型作为一种机器学习技术,可以通过处理大量的数 据和
信息来训练模型,从而实现对用户需求和行为的智能预测和推理。在元宇
宙中,通过与大模型的融合,可以提供以下高效的服务和体验:
智能搜索:元宇宙中包含大量的信息和资源,用户可以通过大模
型技术进行智能搜索,快速、准确地找到所需的信息和资源。通过大
模型的深度学习和自然语言处理能力,可以理解用户的搜索意图,提
132
供更加智能化的搜索结果,提高搜索效率和用户体验。
智能预测:元宇宙中涉及到的数据和信息往往具有复杂的关系和
模式,通过大模型的训练和分析,可以实现对这些关系和模式的智能预
测和推理。例如,在金融元宇宙中,通过大模型技术可以对市场趋势、
股票价格、风险因素等进行智能预测,帮助用户做出更加明智的投资
决策。
智能推荐:元宇宙中存在着大量的服务和应用,通过大模型技术可
以进行智能推荐,根据用户的需求和兴趣,推荐合适的服务和应用。例如,
在娱乐元宇宙中,通过大模型技术可以推荐用户可能感兴趣的虚拟游戏、
音乐、电影等内容,提高用户体验和满意度。
智能交互:元宇宙中用户可以通过虚拟现实技术进行交互和交流,
通过大模型技术可以实现对用户交互行为的智能理解和应答。例如,
在社交元宇宙中,通过大模型技术可以分析用户的语言、行为、情感 等
信息,实现更加智能化的交互和沟通。
总之,元宇宙与大模型的融合可以提供更加高效的服务和体验。
通过大模型的深度学习和分析能力,可以实现对元宇宙中信息和资源的
智能搜索、智能预测、智能推荐和智能交互,提高用户的工作效率和体
验效果。同时,大模型技术还可以不断优化和改进元宇宙的服务和应用,
为用户提供更加丰富、个性化、智能化的虚拟体验,让智能金融服务更
有温度、更有趣。
133
134
随着人工智能技术的飞速发展,金融行业正经历着一场前所未有 的
变革。人工智能技术的引入为金融监管带来了新的机遇,它以高效、精确
的方式加强了监管部门对金融市场的监督和规范能力。然而,与 其带来
的便利和效益相伴而生的则是一系列新的风险和挑战。首先, 智能金融
的出现引发了一系列伦理规范上的挑战,人工智能如何服务 人类价值追
求是这个问题的核心,随即衍生出诸如透明度、可解释性、数据安全和问
责制等一系列问题,但这并非仅靠金融行业和监管部门 之力即可给出完整
正确答案的议题,而需要国际社会各界齐心协力、共同探索。其次,人工
智能决策的不透明性是现阶段亟待解决的突出 问题,与传统的统计模型相
比,人工智能模型往往更加复杂,其决策 过程难以被解释和理解,这使
得监管部门在评估模型的公平性和合规 性时面临巨大的挑战,如何确保
人工智能模型的决策不夹杂偏见和歧 视将是一个关键性挑战。再者,金融
的快速数字化智能化使得监管部 门必须具备更强的技术能力,高频交易、
风险评估、市场预测等领域 的人工智能模型需要庞大的计算能力和高超
的数据分析技能,监管部 门需要拥有足够的资源和技术支持,以保证对
这些复杂模型的审查和 监督。同时,金融科技企业与传统金融机构的合
作模式引发了一系列 监管问题,随着新兴科技公司的崛起,它们往往具有
更快的创新速度 和灵活的业务模式,而传统金融机构则在寻求与其合作以
保持竞争力, 然而,监管部门需要确保这种合作模式既能够促进创新,
又能够保证 风险的有效控制。此外,随着金融业务的数字化,数据隐私
和安全问 题也变得尤为突出,监管部门需要加强对于消费者金融数据的
保护,
135
以防止其被不法分子窃取或泄露,从而保护金融消费者的权益和金融
市场的稳定。因此,全球范围内的监管部门普遍关注智能金融的深入探
索与应用,密切监测与研究相关的新问题新风险,聚焦如何安全和负
责任地在金融领域应用人工智能等新型技术,并在适当的时机出手干
预以管理和减轻与智能金融应用相关的潜在风险和危害。
一、智能金融监管的基本原理
在实施对智能金融的监管治理之前,首先需要厘清为什么需要对
智能金融进行监管?如果仅靠市场的力量,智能金融业态自身就能够
安全、完善、有序地运作,那么监管的介入无疑是多余的。但事实恰恰
相反,人工智能技术作为一项新型技术,其本身就有一些问题尚未能
完全搞清楚,例如高度复杂模型的可解释性,算法和系统的安全与稳健
性,将这样一项技术投入于本身就以风险著称的金融领域,必然引发
更多有关金融风险防范和安全稳定方面的思考。在仅靠市场力量无法
解决相关的问题和消弭相关的风险,特别是相关的经济活动将产生对于
第三方的不利影响时,监管的介入就显得尤为必要。而在什么情况下需
要监管介入、介入的方式路径是怎样的、监管的边界在哪里以及如何衡
量监管的成效,是评价监管工作的主要标准,是搞清楚监管收益是否
大于其成本的评判依据。要解答这些问题就必须首先厘清智能金融监管
的一些基本原理问题,这些基本原理将指导监管工作的有效开展。智能
金融的本质还是金融,人工智能技术的引入提升了金融服务的效率、创
新了金融产品及提供方式,但同时也可能放大原有的金融风险和引入
全新的问题风险。目前,智能金融创新的推进方主
136
要是金融资本和私人资本,资本的逐利本性决定了智能金融想要大发展
首先需要给金融资本和私人资本带来极大的现实利益或潜在收益, 这就
决定了智能金融在便利金融消费者的同时,也可能因金融机构、平台
企业过度逐利而损伤金融消费者的权益,甚至因个体间的激烈角逐而损
伤整个金融体系的安全与稳定根基。从现阶段应用实践看,智能金融的
主要问题的风险点集中在以下几个方面:智能金融的伦理标准考量、人
工智能技术风险与系统安全、金融数据安全与个人信息保护、市场行为
与金融消费者权益保护、智能技术所引起的金融风险。
(一)智能金融的伦理标准考量
伦理是人类实现个体利益与社会整体利益协调过程中,形成的具
有广泛共识的引导社会人际和谐和可持续发展的一系列公序良俗,诸如
向善、公平、正义等,其内涵会根据研究主体的特性而改变。智能金融
作为人工智能与金融有机结合的产物,其伦理考量源自于人工智能和金
融本身的伦理基础,并基于现实发展而衍生出新内涵新意蕴。近年来,
中国始终致力于在人工智能领域构建人类命运共同体,积极倡导“以人
为本”和“智能向善”理念,主张增进各国对人工智能伦理问题的理解,确
保人工智能安全、可靠、可控,更好赋能全球可持续发展,增进全人类共
同福祉。在一般性人工智能伦理方面,我国《新一代人工智能伦理规范》
提出了六项基本伦理规范,包括增进人类福祉、促进公平公正、保护隐
私安全、确保可控可信、强化责任担当和提升伦理素养。而在金融科技
伦理方面,中国人民银行正式发布《金融领域科技伦理指引》,提出了
在金融领域开展科技活动需要遵循的
137
守正创新、数据安全、包容普惠、公开透明、公平竞争、风险防控、
绿色低碳等 7 个方面的价值理念和行为规范。在国际领域,国际组织也
在积极倡导人工智能伦理治理原则。联合国科教文组织《人工智能伦理
问题建议书》提出,发展和应用人工智能要体现出四大价值,即尊重、
保护和提升人权及人类尊严,促进环境与生态系统的发展,保证多样性
和包容性,构建和平、公正与相互依存的人类社会。经济合作与发展组
织(OECD)的《人工智能原则》提出了五项基本原则, 包括包容性
增长、可持续发展和福祉原则,以人为本的价值观和公平原则,透明性
和可解释性原则,稳健性和安全可靠原则,以及责任原则。综合各方提
出的观点,智能金融应当恪守的伦理原则至少包括: 增进人类福祉、坚
持公平公正、合理控制风险、保持公开透明、持续包容普惠。增进人类
福,意味着智能金融应该以提升人类福祉为核心目标,其技术和应用应
当有助于改善经济、金融和社会的发展,为个人和社会带来更多的福祉
和利益。坚持公平公正,意味着不应该歧视性地对待客户,应当提供公
平的机会和平等的待遇,避免利用技术优势实施不正当竞争和操纵市场。
合理控制风险,意味着智能金融应当遵循合理的风险控制原则,这包括
合规管理、风险评估和监测等方面的措施,确保智能金融系统和服务的
安全性和稳定性,减少潜在的风险和危害。保持公开透明,意味着智能
金融产品和服务应提供清晰的信息披露,让用户了解产品特性、风险和
收益等重要信息,金融机构应当公开相关数据和报告,接受监管和公众
的监督。持续包容普惠, 意味着智能金融技术和服务应当为所有人提供
平等的机会,不应该排
138
除或歧视任何特定群体,智能金融应当致力于促进金融包容和可持续
发展。
(二)智能金融技术风险与系统安全
智能金融技术包括人工智能、大数据、云计算、区块链等新型技
术手段,这些技术本身就存在着一定的潜在风险和问题隐患,并可能与
金融业务交织缠绕,形成新的问题和风险。一是智能金融算法的数据风
险。算法具有较强的数据依赖性,作为解决一系列问题的清晰指令,算
法通过代码表达和执行,决策通常被认为是准确和可靠的。但是算法
依赖于高质量的数据,如果用于训练算法的数据质量较差,过多的噪声
数据可能导致算法决策出现稳定性和准确性偏差。黑客人员也可以通
过操纵算法决策所依据的数据来控制算法交易者的决策,攻击者即使
在不知道交易算法内部工作原理的情形下,依然可以通过实时操纵输
入数据流获得对算法交易机器人的控制。二是智能金融模型的“黑箱”风
险。智能金融模型具有较强的黑箱性。架构复杂、性能优越的机器学
习尤其是深度学习算法目前在金融领域被广泛应用。但由于后者是非
线性算法,现阶段未能从技术上全面攻克其不可解释的难题。因此,对
特定算法运行的判别过程难以转化成具备逻辑关系的解释性规则,由此
导致算法的透明度不佳,与之伴随的算法归责和法律救济面临挑战。三
是智能金融系统安全和稳定性风险。人工智能在金融领域的应用覆盖甚
广,系统涉及前、中、后台各个环节,系统的安全稳定对于经营机构
十分重要。然而,应用系统的构建首先基于电力、网络、主机、柜台、
服务器等硬件设施,一旦基础设施发生故障
139
将导致系统瘫痪,进而引发技术风险;此外,技术系统仍然建立在代 码
基础上,如果技术部门未能排查代码漏洞,导致交易系统故障,也 会影
响金融市场的正常运行。四是智能金融系统的网络安全风险。智 能金融
系统对网络具有极强的依赖性,金融行业的算法技术颇易成为 技术攻击的
目标,这些不稳定性因素的增加将严重影响金融安全。近 年来,网络攻
击事件频发,网络空间安全形势日益严峻,金融行业作 为资金流动性较
大的行业也已经成为网络攻击的重要目标。五是智能 金融技术同质性风
险。人工智能在金融领域的应用推动产生了许多新 型的金融应用场景,
然而这类应用场景在人工智能技术上具有同质性, 这种同质性容易引致
技术性风险。人工智能的底层算法和运算模式具 有同质性,一旦这些技
术被破译或遭受黑客攻击,那么所有应用这些 技术的金融业务体系都会
在短时间内陷入瘫痪,风险将溢出至金融体 系的各个主体,引发系统性
风险。六是智能金融模型的学习局限性风 险。与人类不同,人工智能系
统缺乏对其部署环境的判断力和背景信 息。智能金融模型通常在部署于
用于训练它的数据以及训练模型时考 虑的各种场景相似的场景中是有效
的。但在大多数情况下,不可能在 所有可能的场景和数据上训练智能金
融模型。缺乏背景、判断力和整 体学习限制可能会限制智能金融模型的
运作并产生意想不到的风险。
(三)金融数据安全与个人信息保护
数据是人工智能模型的基石,只有通过海量数据的充分训练,才
能够得出高质量的人工智能模型,这一点同样适用于智能金融营销模
型。与基础设施、底层架构等方面模型不同的是,智能金融营销模型
140
旨在服务与金融消费者的交流互动、促进金融产品的推荐销售,因此,
所需求的数据主要是个人数据,如何依法获取、使用、传输海量的个人
数据成为智能金融营销绕不开的问题。简单而言,更多的数据意味着更
好的模型和对竞争者的比较优势,也就是更多的商业利益,因此, 金融机
构、互联网平台等数据处理主体对消费者的个人数据都有着天然的渴望。
在实践中,个人数据保护问题主要集中在违反“最少必要”、消费者知情同意
等重要原则和利用技术窃取数据等方面。为了尽可能获取更大量、更多
维的个人数据以支持人工智能模型的训练,数据处理主体往往倾向于在
与消费者的协议中模糊掉所要获取的信息种类、数量和区间,甚至在不
显眼处要求消费者同意对其手机中其他应用程序的数据获取,而后在实
际抓取消费者个人数据时违反“最少必要” 原则,近乎无限制地收集各类
信息数据。而出于降低谈判成本、顺滑处置流程等因素,数据处理主体
普遍使用格式合同条款从消费者处一揽子获取对其个人数据进行收集、
处理、使用和传输的全流程授权, 从而在后续的数据行为中能够为所欲
为、不受约束。还有少部分数据处理主体甚至突破法律限制,在其应用
程序中内嵌了窃取消费者个人数据的插件,在未获得消费者同意的情况
下肆无忌惮地窃取消费者的个人信息。同时,大量信息数据在使用过程中
若缺乏相应的技术保护, 便会导致数据泄露引致用户安全风险。鉴于金
融领域交易的特殊性, 使用金融服务的用户均需提供详细的个人信息,
因此金融服务商不仅掌握了诸如证件号码、手机号码等大量用户真实身
份信息,同时还掌握了用户银行卡号、卡片验证码、卡片有效期、客户
住址、电话、交
141
易记录等大量敏感性信息,这使得人工智能技术在应用过程中存在较大
的用户信息资料泄露隐患。用户信息泄露将进一步导致用户风险, 用户
自己在注册时会提供用户的姓氏、工作或学习地点、居住地、生活习惯、
婚姻状况、地理位置等信息,当社交网络用户的个人数据泄露被用于不
法的用途时,用户就面临被欺诈的风险。敏感数据是不能免费获取的信
息,非法使用这些信息可能会导致在日常生活中出现价格、政治和其他
方面的歧视,对用户造成损害或伤害。如果人工智能在数据保护技术上
不能与其发展相匹配或者存在技术漏洞而最终导致客户信息数据被恶
意盗取,将给金融市场带来极大的不稳定性。
(四)市场行为与金融消费者权益保护
人工智能技术在金融领域的使用是否对消费者有益将取决于它
的使用方式和目的。智能金融可以利用大数据力量来识别消费者的特征
及其偏好,从而为具有非标准历史记录的消费者提供金融服务,或者识
别具有特定需求或脆弱性特征的消费者,以及为消费者提供更好的产品
匹配。同时,随着对个体消费者特征更细致的了解,智能金融也更有可
能识别和利用消费者行为偏见和脆弱性特征——从利用消费者惰性到
有害的价格歧视,再到利用脆弱性消费者特征,进而实施对消费者权益
的侵害或者深度剥削。人工智能技术的使用可能会导致歧视性决定。与
种族或性别等受保护特征相关的偏见可能会在模型开发过程中无意中出
现。这是因为,即使这些变量被排除在模型之外, 它们仍然可以与其他
数据点相关联并识别受保护的特征。有偏见或歧视性的决定可能源于训
练智能金融模型所依据的基础数据的偏见。数
142
据可能反映了社会的历史偏见,例如某些群体获得信贷的能力较差,
或者整个数据集可能不具有代表性。一方面,智能金融模型可以放大输
入数据中固有的历史偏见,可能导致消费者做出有偏见的决定,另一方
面,在模型设计阶段,设计者或者公司利益带有的主观偏见也可能被带
入到模型中,造成“主观歧视”。智能金融模型的使用方式可能会排除某
些消费者。例如,基于人工智能的保险筛选或信贷提供可以更好地区分
“低风险”和“高风险”消费者群体。这可能会对风险分担产生影响,并可
能导致保险供应商排除或向“高风险”消费者提供无法负担的保费。个性
化(例如针对个人消费者的特定定价)还可能导致某些金融产品无法
提供给某些群体,从而可能导致基于受保护特征的非法歧视。在市场竞
争方面,人工智能技术的大规模引入可能显著提升智能金融领域的进入
成本(包括员工和技能以及数据和技术本身), 这可能会限制其他市
场主体进入智能金融领域提供金融产品或服务, 进而对市场竞争产生
潜在的有害影响,最终危及消费者利益。
(五)智能技术所引起的金融风险
尽管人工智能技术的应用使金融体系更加高效和智能,但并未改
变金融业务风险的本质,甚至在某些方面加剧了金融风险。由数据驱
动的智能化交易策略在宏观经济环境稳定的情形下才适用,在面临经
济动荡的环境时可能会做出错误的决策。在对人类和自动化系统执行交
易的差异研究中发现,自动化交易系统倾向于在经济动荡时期减少交易,
这可能进一步加剧金融市场风险。此外,人工智能技术的应用增强了不
同主体之间的关联性,导致风险在高度关联的背景下传播速
143
度更快,风险传染性更强。例如,智能金融算法趋同将会导致信贷市场
的顺周期性,进而对金融稳定格局产生影响。在信贷行业,信贷评估是
人工智能算法应用的高地,在促进信贷市场从“关系型贷款”向“交易型贷