斯坦福《企业�AI�实战⼿册》深度解读�
这份�2026�年�4�⽉由斯坦福数字经济实验室发布的报告,是⽬前全球;系统、;实证的企业�AI�落地研
究。三位核⼼作者都是⾏业顶尖学者:Erik�Brynjolfsson�是《第⼆次机器时代》作者、全球�AI�经济学
领域;权威的学者之⼀;Alvin�Wang�Graylin�有�35�年�AI、半导体⾏业经验,同时担任�MIT�讲师;
Elisa�Pereira�则有丰富的企业�AI�落地和⻛险投资背景。�
报告没有讲任何预测和空泛的理论,⽽是基于�2025�年�8�⽉到�2026�年�2�⽉整整半年的实地调研,深度
访谈了�41�家企业的⾼管和项⽬负责⼈,筛选出�51�个真正跑通、产⽣可衡量商业价值、且实现规模化
的�AI�部署案例。这些企业分布在�7�个国家、9�⼤⾏业,总员⼯数超过�100�万,覆盖了从客服、营销到
供应链、临床医疗的⼏乎所有企业职能。�
报告;核⼼的⼀句话,也是贯穿全⽂的结论:所有成功的�AI�项⽬,差异从来都不在模型本⾝,⽽在组
织。技术永远是最简单的部分。�
⼀、为什么要做这份研究�
现在关于�AI�的预测满天⻜,但真正在企业⾥落地的⼈,关⼼的从来不是�“五年后会怎样”,⽽是�“我
现在该怎么做”。MIT�2025�年的⼀项研究戳破了⾏业泡沫:95%�的⽣成式�AI�试点项⽬,;终都没能
产⽣任何可衡量的财务影响。失败的原因没有⼀个是模型不够好,全都是流程整合不到位、组织激励
错位。�
这就是报告要解决的问题:那些真的靠�AI�赚到钱、提了效的企业,到底做对了什么?那些没写在新闻
稿⾥的坑、那些失败的教训,⼜是什么?�
特别值得⼀提的是,这份研究没有只看成功。在每⼀次访谈中,研究者都会逼着受访者讲清楚:在这
次成功之前,他们失败过⼏次?为什么失败?改了什么?结果发现,61%�的成功项⽬,都⾄少经历过
⼀次彻底的失败。这些失败的沉没成本,从来不会出现在;终的�ROI�报表⾥,但却是成功必不可少的
铺垫。�
⼆、研究是怎么做的�
1.�严格的案例⼊选标准�
不是所有�“⽤了�AI”�的项⽬都能进样本,必须同时满⾜四个条件:�
• 运营稳定:系统已经正式上线,融⼊了⽇常⼯作流,不是演⽰⽤的�Demo�
• 持续采⽤:跨团队连续使⽤了⾄少�3�个⽉,不是三分钟热度�
• 量化价值:有明确的数字证明价值,⽐如⽣产⼒提升了多少、成本降了多少、收⼊涨了多少�
• 可扩展:能复制到其他团队、其他地区或者其他业务单元,不是⼀次性的定制项⽬�
2.�样本构成�
51�个案例覆盖了�9�个⾏业,其中制造业、⾦融服务、软件科技各�10�个,零售�6�个,医疗�6�个,专业
服务、法律服务、电信各�2�个,其他�1�个。�
从职能来看,客服�9�个、营销内容�8�个、销售�7�个、IT�运维�7�个、编码⼯程�6�个、招聘�6�个、⽂档审
核�3�个、薪酬福利�3�个、供应链�3�个、临床�3�个,合规、财务、采购等职能也都有覆盖。�
3.�研究⽅法�
每家企业⾄少做⼀次�60�分钟的结构化访谈,同时要求企业提供内部的项⽬⽂档、财务报表、系统运⾏
数据来交叉验证。访谈的核⼼不是问�“你们⽤了什么模型”,⽽是问:花了多少钱?谁牵头的?遇到
的;⼤阻⼒是什么?怎么解决的?失败过⼏次?每次失败的原因是什么?�
4.�明确的局限性�
报告坦诚地说,这份研究只看成功案例,所以存在选择偏差。它告诉你�“成功是什么样的”,但不告
诉你�“全⾏业有多少项⽬能成功”。同时,样本⾥技术和⾦融⾏业偏多,这也反映了�AI�早期落地的真
实情况。�
三、11�条颠覆认知的全局核⼼发现�
这�11�条结论,每⼀条都和市⾯上的主流认知不⼀样,全是从真实项⽬⾥摸出来的硬规律:�
1. 77%�的难题都是看不⻅的:变更管理(33%)、数据质量与架构(17%)、流程重构(10%)是
;⼤的三个拦路⻁,纯技术问题只占�23%。⼏乎所有受访者都说:“技术是;简单的部分,难的是
让⼈愿意⽤,还有把乱七⼋糟的流程理清楚。”�
2. 同样的⽤例,有⼈⼏周搞定,有⼈要做⼏年:⼀个⾦融科技公司⽤�AI�编码代理迁移百万⾏遗留代
码,只⽤了⼏周;⽽⼀家⼤银⾏做同样的智能客服系统,花了好⼏年还没上线。差异和技术⽆关,
只和⾼管⽀持⼒度、现有流程基础、员⼯愿不愿意⽤有关。�
3. 让�AI�先⼲,⼈只看例外,效率最⾼:AI�⾃主处理�80%�以上的任务,⼈类只审核异常情况的�“升级
式”�模式,能带来�71%�的中位数⽣产⼒提升;⽽要求⼈类审批每⼀个输出的�“审批式”�模式,只
有�30%�的提升。�
4. 好的⾼管不是只批预算,⽽是每周帮你清障碍:;有效的赞助⼈,会每周开⼀次会,提前把跨部⻔
的障碍扫掉,把�AI�纳⼊公司的�OKR�和奖⾦体系。;重要的是,他们会给团队�“失败的许可”——�
没有⼈会因为�AI�项⽬搞砸了丢⼯作。�
5. 最⼤的阻⼒不是⼀线员⼯,是后台职能部⻔:法律、HR、⻛控、合规部⻔的阻⼒占了�35%,⽐⼀
线员⼯(23%)还⾼。他们不是故意找茬,⽽是怕出了问题⾃⼰背锅。但⼀旦把他们拉进项⽬,让
他们负责治理,他们反⽽会变成;强的推动者。�
6. 裁员不是�AI�的必然结果:45%�的项⽬确实导致了⼈员缩减,但剩下�55%�的项⽬,企业选择了不招
⼈、把⼈转到更有价值的岗位,或者⼲脆维持编制、⽤多出来的产能做更多业务。不过要注意,宏
观数据已经显⽰,AI�暴露⾏业的初级岗位,已经出现了�16%�的相对就业下滑。�
7. AI�能赚钱,但很少有⼈做到:⼤部分项⽬还是在降本,只有少数项⽬实现了直接增收。增收的模式
只有三种:⽤个性化提升转化率、⽤速度抢订单、把内部⽤的�AI�⼯具包装成产品卖出去。�
8. 智能体�AI�真的好⽤,但⼤部分公司还没开始⽤:只有�20%�的案例⽤了智能体,但它们的中位数⽣
产⼒提升达到了�71%,⽽普通的⾼⾃动化模式只有�40%。智能体不是⼀个更好的聊天界⾯,它是
重新定义了⼈和机器的分⼯�——AI�不再是⼯具,⽽是能独⽴完成多步骤任务的�“数字员⼯”。�
9. 数据不⽤先洗⼲净再⽤,LLM�⾃⼰会洗:只有�6%�的项⽬,在上线前拥有�“完美”�的数据。⼤部
分项⽬的数据都⼜乱⼜散,但�LLM�本⾝就能解决数据提取、清洗、结构化的问题。核⼼不是数据有
多⼲净,⽽是你能不能让�AI�访问到这些数据。�
10. 安全不会杀死项⽬,反⽽会让项⽬⾛得更远:没有⼀个项⽬因为安全要求彻底⻩了。前期花在安
全上的功夫,;后都会变成核⼼竞争⼒�——�别⼈不敢碰的敏感数据,你能处理。⽽且,没有官⽅
的安全⼯具,员⼯就会偷偷⽤影⼦�AI,那才是真正的⼤⻛险。�
11. ⼤部分时候,⽤什么模型根本不重要:42%�的项⽬⾥,模型是完全可以互换的。你⽤�GPT�还是�
Claude,对;终结果没什么影响。企业真正的护城河,是把模型、数据、流程串起来的编排层,
⽽不是基础模型本⾝。�
四、每⼀章的核⼼细节与真实案例�
第⼀章:为什么�AI�的商业案例总是低估真实投资?�
市⾯上的�AI�商业案例,通常只算模型和服务器的钱,但这只是冰⼭⼀⻆。Brynjolfsson�之前的研究发
现,每花�1�美元在有形的技术上,就要配套花;多�10�美元在⽆形的东西上:流程重构、员⼯培训、组
织变⾰。这就是�“⽣产⼒�J�曲线”——�前期投⼊会拉低⽣产率,等到这些⽆形投资到位了,回报才会
爆发。�
报告⾥的物流公司发票处理案例,把这⼀点讲得特别透彻。这家美国物流公司每年要收�10�多万张供应
商发票,格式五花⼋⻔,有邮件、有传真、还有电话⼝述的。原来�7�个全职员⼯专⻔⼲这个,天天加
班还堆着⼀堆活。�
他们⼀开始想的是,找个�OCR�⼯具把发票扫进去就⾏。结果发现根本不⾏,因为公司攒了�750�个不同
的发票模板,⼤部分都是重复的、没⼈管的。所以真正的⼯作,是先把这�750�个模板砍到⼏百个,然
后让业务专家花了⼏千个⼩时,⼀张⼀张地标注�AI�的错误,教它怎么识别不同的发票。�
技术部分反⽽;简单,就是⽤了�Azure�的⽂档智能和�OpenAI�服务。整个项⽬�8�周就上线了,;后�7�
个⼈减到�2�个,处理时间从⼏天降到�24�⼩时以内,准确率�85%,⼀年省了超过�100�万美元。�
项⽬负责⼈说:“所有⼈都以为难的是技术,其实不是。所有的硬功夫都在流程⽂档和数据架构上。
这两个搞定了,其他的都很简单。”�
第⼆章:怎么跨越从试点到�ROI�的�“死亡⾕”?�
现在⼤部分公司都卡在�“试点地狱”�⾥:做了⼀堆�Demo,看起来都挺好,但就是推不开、赚不到
钱。报告发现,能不能快速跨过这个坎,取决于三个加速因素和四个减速因素。�
三个加速因素⾥,⾼管赞助占了�43%,是;重要的。其次是复⽤现有的基础�——�⽐如你已经做了智能
客服,再做销售�copilot�就会快很多。第三是⽤⼾真的有痛点�——�如果员⼯已经被⼯作压得喘不过
⽓,他们会求着你上�AI,根本不⽤你去说服。�
四个减速因素分别是:学习曲线和迭代、数据质量、监管合规、流程⽂档缺失,各占�21%�左右。�
还有⼀个�100%�的规律:所有成功的项⽬,⽤的都是迭代开发,没有⼀个⽤传统的瀑布模式。都是先
做⼀个;⼩可⽤的版本,上线⽤起来,然后慢慢改。�
翻译公司的招聘案例特别有代表性。这家公司第⼀次做�AI�招聘,完全失败了。他们以为把简历扔给�
AI,让�AI�筛⼈就⾏,结果�AI�有严重的偏⻅,⽽且原来的招聘流程本⾝就⼀团糟,AI�只是把坏流程放⼤
了。�
第⼆次他们换了思路:⾸先,CEO�亲⾃牵头,每周开⼀次会清障碍;然后,先把整个招聘流程从头到
尾理了⼀遍,把没⽤的环节都砍掉;;后,他们瞄准了招聘团队;⼤的痛点�——�每天⼏百份简历根本
看不过来,⼈都快被逼疯了。�
这次项⽬只⽤了⼀个⽉就上线了,招聘效率提升了�83%,每个岗位的筛选时间从�3�⼩时降到�3�分钟,
候选⼈转化率还提升了�75%。�
第三章:到底需要多少⼈盯着�AI?�
很多⼈觉得,AI�越成熟,需要的⼈就越少。但报告发现,不是这样的。;优的⼈类监督程度,取决于
任务的容错率、监管要求和复杂度。�
报告把⼈机协作分成了三种模式:�
• 升级式:AI�⼲�80%�以上的活,⼈只看例外。⽐如�IT�运维、客服、理赔,中位数提升�71%。�
• 审批式:AI�把活⼲完,⼈必须每⼀个都看了才能发出去。⽐如临床⽂档、法律⽂书、对外的营销内
容,中位数提升�30%。�
• 协作式:⼈和�AI�⼀起⼲,谁也离不开谁。⽐如写代码、做战略分析,中位数提升也是�30%。�
Anthropic�之前的数据很有意思:个⼈⽤�AI,52%�是协作模式,45%�是⾃动化;但企业⽤�AI,刚好反
过来,77%�是⾃动化。这说明企业更倾向于让�AI�⼲重复的活,⼈⼲判断的活。�
有⼀个⾦融公司的营销案例,他们⽤�AI�⽣成多渠道的营销内容,采⽤了�80/20�的模式:AI�写�80%,⼈
改�20%。结果原来�7�周才能做⼀个活动,现在�6�⼩时就能搞定,点击率还翻了⼀倍。�
负责⼈说:“企业级的营销,不能出⼀点错。⼀个错误的⼴告发给⼏百万客⼾,损失是⽆法估量的。
所以我们需要那�20%�的⼈来把关。但这�20%�不是成本,是保护我们⼏⼗年攒下来的品牌。”�
第四章:什么样的⾼管才能把�AI�做成?�
很多公司的�AI�项⽬,都是�CEO�在⼤会上说⼀句�“我们要全⾯拥抱�AI”,然后把活扔给�CTO�就不管
了。这种项⽬⼏乎都会死。�
报告把⾼管的参与度分成了四个等级:�
1. 被动审批:只批预算,剩下的全不管,占�12%�
2. 定期监督:每个⽉开⼀次会,出了问题再解决,占�12%�
3. 主动掌舵:每周开⼀次会,提前清障碍,参与重⼤决策,占�58%�
4. 战略整合:把�AI�纳⼊公司的�OKR�和奖⾦体系,推动整个公司的⽂化变⾰,占�29%�
前两个等级的项⽬,;多只能在单个部⻔做成。只有达到第四个等级,才能实现全公司的转型。�
好的⾼管会做四件事:给够钱和⼈、把�AI�和业务⽬标绑在⼀起、在全公司讲清楚�AI�的重要性、;重要
的是,在团队遇到问题之前,就把障碍扫掉。�
还有⼀个关键:必须是业务和技术联合赞助。纯技术牵头的项⽬,⼀定会死。因为技术⼈员不懂业务
痛点,业务部⻔也不会配合。�
半导体公司的现场服务案例就是这样。这家公司原来的现场服务⼯程师,遇到客⼾问题,要花�40�多个
⼩时,从五六个不同的部⻔找资料,才能开始诊断。�
他们第⼀次做�AI,是⼯程部⻔⾃⼰搞的,做了个�Demo�就没⼈⽤了。第⼆次,AI�负责⼈直接找到�
CEO,做了三件事:在每个部⻔都找了⼀个�AI�⼤使;把�AI�采纳率做成了全公司的�OKR,和奖⾦挂
钩;每个⽉开⼀次�AI�演⽰⽇,CEO�亲⾃给做得好的团队颁奖。�
结果新的多智能体系统上线后,找资料的时间从�40�多个⼩时降到了�1�⼩时以内,95%�以上的问题都能
拿到完整的数据,产品测试周期还缩短了�20%。�
项⽬负责⼈说:“AI�根本不是技术问题,是⼼态问题,完完全全是变⾰管理驱动的。”�
第五章:⼤家为什么反对�AI?�
⼤家默认的阻⼒来源是⼀线员⼯,怕被�AI�抢了⼯作。但报告发现,;⼤的阻⼒其实是后台的职能部
⻔:法律怕担责任、HR�怕不好管、⻛控怕违规。他们⼿⾥有否决权,不管�CEO�怎么⽀持,他们只要
拖着不批,项⽬就⻩了。�
不同的⼈反对�AI,原因不⼀样,解决⽅法也不⼀样:�
• 职能部⻔:怕背锅。不要去说服他们,要给他们权⼒,让他们负责�AI�的治理,再把�AI�采纳率和他
们的�OKR�挂钩。�
• C�级⾼管:要看到真⾦⽩银。先做⼀个⼩试点,拿出实实在在的�ROI�数据,再要更多的钱。�
• ⼀线员⼯:不信任�AI�的稳定性。要提前设好预期,告诉他们�AI�会犯错,需要他们来把关,AI�是帮
他们⼲脏活累活的。�
• 真正怕被裁员的⼈:给他们明确的出路。告诉他们哪些活会被�AI�⼲了,哪些活会留下来,他们未来
会做什么。�
安全运营中⼼的案例特别好。这家公司的�SOC�团队有�6�个⼈,每个⽉要处理�1500�个安全警报,⼤部
分都是误报。他们天天加班,低优先级的警报根本没时间看。�
⼀开始领导说要上�AI,⼤家都很抵触,怕被裁员。结果领导说:“AI�不是来取代你们的,是来取代那
些我们本来就想招但招不到的⼈的。你们原来天天删垃圾警报,以后这些活�AI�⼲,你们去做威胁�
hunting、安全架构这些真正有技术含量的事。”�
;后�AI�上线后,每个⽉能处理�4�万个警报,原来需要�6�个⼈,现在只需要��个⼈。没有⼀个⼈被裁
员,多出来的��个⼈,都转到了更⾼价值的岗位上。�
第六章:⽣产⼒提升了,⼈怎么办?�
这是⼤家;关⼼的问题。报告的数据很明确:裁员是;常⻅的结果,但不是必然结果。45%�的项⽬裁
了⼈,19%�的项⽬选择了不招⼈,17%�的项⽬把⼈转岗了,还有�19%�的项⽬,⼲脆维持了原来的编
制。�
企业怎么选,完全取决于他们的战略。成⻓型的公司,会把多出来的产能投⼊到新业务⾥;⽽私募股
权控股的公司,或者正在扭亏的公司,⼏乎⼀定会选择裁员。�
教育科技公司的案例很有代表性。这家公司给⼯程师上了�GitHub�Copilot�和�Cursor,⽣产⼒提升了�
20-30%。同时⽤�AI�写课程内容,省了⼏百万美元的成本。�
这时候公司内部出现了分歧:CEO�和�COO�在私募的压⼒下,想裁掉⼀部分⼯程师和内容团队;但�
CTO�说,我们有⼀⼤堆产品需求排着队做不完,为什么不把省下来的时间⽤来加速产品开发?多做⼏
个功能,多赚的钱,⽐裁员省的那点钱多得多。�
;后公司采纳了�CTO�的建议,没有裁⼀个⼯程师,把省下来的钱和⼈⼒,都投⼊到了�AI�产品的开发
上。�
但报告也给出了⼀个很严肃的警告:现在的情况,可能是;好的情况。ADP�的⾼频率⼯资数据显⽰,
从�2022�年底到�2025�年,22-25�岁的初级软件⼯程师,就业⼈数相对下降了近�20%。这些�“煤矿⾥的
⾦丝雀”�告诉我们,AI�对劳动⼒市场的冲击,已经开始了。随着智能体�AI�的成熟,未来的裁员压⼒只
会越来越⼤。�
第七章:AI�能做哪些以前根本做不了的事?�
⼤部分公司⽤�AI,都是为了把原来的活⼲得更快、更便宜。但真正厉害的公司,会⽤�AI�去做以前根本
不可能做的事。�
报告⾥的区域超市案例,简直是降维打击。这家超市只有�20�多家店,和沃尔玛这种巨头⽐,⼀点采购
优势都没有,利润率只有⾏业平均的⼀半。�
原来他们有⼀个采购经理,凭经验给所有店订货。结果要么是货订多了烂在货架上,要么是订少了缺
货,客⼾跑到竞争对⼿那⾥去了。�
后来他们上了⼀个完全⾃主的�AI�采购系统。这个系统不是给采购经理提建议,是直接决定买什么、买
多少、从哪个供应商买。它会⾃动拉取每个店的销售数据、库存数据、天⽓数据,预测每个�SKU�的需
求,然后⾃动下订单。�
结果是:浪费减少了�40%,缺货减少了�80%,公司的�EBITDA�直接翻了⼀倍。⼀个只有�20�多家店的
⼩超市,利润率居然和⾏业巨头差不多了。�
还有⼀个医疗�AI�公司的案例。医疗美容⾏业是全现⾦⽀付,没有医保,所以没有任何结构化的市场数
据。医药公司根本不知道哪个医⽣做什么⼿术、做多少量,销售只能瞎跑。�
这家公司⽤�AI�爬取了所有公开的信息:医⽣的⽹站、社交媒体、点评⽹站、新闻报道,然后给每个医
⽣建⽴了档案,估算他们的⼿术量和增⻓潜⼒。这是以前任何⼈都做不到的事。现在医药公司的销
售,拿着这个名单去跑,转化率提升了好⼏倍。�
第⼋章:智能体�AI�到底有没有⽤?�
现在智能体�AI�炒得很热,但很多⼈觉得是噱头。报告⽤数据证明:智能体真的有⽤,⽽且效果⽐普通
的�AI�好得多。�
⽬前只有�20%�的案例⽤了智能体,但它们的中位数⽣产⼒提升是�71%,⽽普通的⾼⾃动化模式只有�
40%。
成功的智能体项⽬,都有四个共同点:�
1. 处理⾼容量、重复性的任务�
2. 有明确、客观的成功标准�
3. 就算出错了,也能补救,不会造成灾难性的后果�
4. 能访问多个系统的数据�
报告特别强调:智能体不是⼀个更好的聊天机器⼈。它是重新定义了⼈和机器的关系。以前�AI�是⼯
具,⼈告诉它做什么,它就做什么。现在智能体是你的同事,你告诉它⼀个⽬标,它⾃⼰会规划步
骤、调⽤⼯具、完成任务,遇到搞不定的事再找你。�
METR�的研究数据显⽰,前沿模型已经能可靠地完成需要⼈类专家⼲�15�⼩时的任务,⽽且这个能⼒每�
7�个⽉就会翻⼀倍。报告预测,未来�3�年,智能体将成为企业�AI�的主流形态。到时候,不会⽤智能体
的公司,根本没法和别⼈竞争。�
第九章:企业的数据到底需要多⼲净?�
以前做⼤数据项⽬,有⼀句名⾔:“垃圾进,垃圾出”。所以⼤家都觉得,要先花⼏年时间,把所有
数据都洗⼲净、集中起来,才能做�AI。�
这份报告彻底推翻了这个认知。只有�6%�的项⽬,在上线前拥有�“⼲净、准备好”�的数据。剩下�94%�
的项⽬,数据都⼜乱、⼜散、⼜脏。但他们还是成功了,因为�LLM�本⾝就是;好的数据清洗⼯具。�
LLM�能处理以前任何技术都处理不了的⾮结构化数据:扫描的�PDF、⼿写的单据、电话录⾳、聊天记
录、遗留代码。88%�的案例⾥,AI�解锁了以前根本⽤不了的数据。�
报告说,现在;重要的不是数据有多⼲净,⽽是你能不能让�AI�访问到这些数据。你不需要把所有数据
都集中到⼀个数据仓库⾥,只要建⼀个�RAG�架构,或者⼀个多智能体框架,把分散在各个系统⾥的数
据连起来就⾏。�
还有⼀个;重要的建议:存储⼀切数据。现在存储数据的成本⼏乎可以忽略不计,但你永远不知道,
未来的�AI�能从这些数据⾥挖出什么价值。那些⼗⼏年前就开始存数据的公司,现在已经有了别⼈根本
复制不了的护城河。�
建筑公司的采购案例很能说明问题。这家公司的技术员,都是⽤纸、邮件、Excel�来提交零件申请的,
格式乱七⼋糟。⽽他们⾃⼰的零件⽬录,数据也不准,很多东西的名字都写错了。�
他们没有先花⼏个⽉去洗数据,⽽是做了⼀个四阶段的管道:先⽤�Python�提取,再⽤⽣成式�AI�清
洗,然后做模糊匹配,;后⼈只看例外情况。结果项⽬花了�50�万到�100�万美元,预计�3-5�年能有�10�
倍的�ROI。�
第⼗章:安全是保护项⽬,还是杀死项⽬?�
很多⼈觉得,安全部⻔是�AI�的敌⼈,他们会把所有有意思的项⽬都毙掉。但报告发现,没有⼀个项⽬
因为安全要求彻底失败。相反,那些前期在安全上花了功夫的公司,;后都获得了别⼈没有的优势。�
美国⼀家⼤型零售银⾏的案例很典型。这家银⾏因为之前出过合规问题,有⼀个死规定:所有系统必
须部署在公司防⽕墙以内,绝对不能⽤云服务。但现代�AI�都是云原⽣的,这个规定等于直接判了�AI�的
死刑。�
后来他们想了⼀个办法:客⼾的问题进⼊防⽕墙后,先把所有的个⼈信息(名字、账号、⾦额)都删
掉,换成假的合成数据,然后再发给云⾥的�AI�模型。AI�处理完,返回结果,银⾏再把真实的个⼈信息
换回去,发给客⼾。�
这个项⽬花了好⼏年时间才搞定,但现在他们能安全地⽤云�AI�处理客⼾的敏感数据,这是很多竞争对
⼿都做不到的。�
报告还特别提醒了影⼦�AI�的⻛险。现在�70%-80%�的员⼯,都会偷偷⽤公司没批准的�AI�⼯具,57%�的
⼈上传过敏感的公司信息。IBM�的数据显⽰,⼀次�AI�相关的数据泄露,平均会给公司造成�488�万美元
的损失。�
解决影⼦�AI�的;好办法,不是禁⽌,⽽是提供更好的官⽅⼯具。如果公司的⼯具⽐员⼯⾃⼰找的好
⽤,他们⾃然就不会偷偷⽤了。�
第⼗⼀章:什么时候选模型才重要?�
现在⼤家天天在争论,⽤�GPT�还是�Claude,⽤开源还是闭源。但报告说,对于⼤部分企业⽤例来说,
⽤什么模型根本不重要。�
42%�的项⽬⾥,模型是完全可以互换的。你把�GPT�换成�Claude,;终的结果⼏乎没有区别。只有在
做复杂的多步推理、智能体⼯作流的时候,模型的能⼒才会成为瓶颈。�
现在⼏乎所有的领先公司,都在⽤多模型架构。他们不会把宝压在⼀个⼚商⾝上,⽽是建⼀个抽象
层,把所有的模型都接进来。然后根据每个任务的需求,⾃动路由到;合适的模型:⽤便宜的⼩模型
做分类,⽤贵的⼤模型做推理,⽤开源模型做安全这种需要完全控制的场景。�
这样做有三个好处:避免⼚商锁定、优化成本、未来可以⽆缝接⼊新出的更好的模型。�
报告还提到了⼀个很有意思的趋势:2026�年�2�⽉,OpenRouter�上流量;⼤的�5�个模型⾥,有�4�个是
中国的开源模型(MiniMax、Kimi、GLM、DeepSeek)。主要是因为智能体任务会消耗巨量的�
token,中国开源模型的成本优势太明显了。不过美国的企业,还是主要⽤�OpenAI、Anthropic�这些
美国⼚商,因为合规和⽀持的问题。�
现在企业选模型,第⼀看能⼒,第⼆看上线速度,成本根本不是主要考虑因素。但报告预测,随着智
能体的普及,token�消耗会爆炸式增⻓,未来成本会成为模型选择的第⼀要素。�
五、结论:给企业的实战⾏动指南�
报告;后说,我们现在正处于⼀个�“⽣产⼒岔路⼝”。AI�既可以⽤来赋能员⼯,创造新的业务和新的
⼯作岗位,让所有⼈都受益;也可以⽤来裁员降本,把利润都集中到少数⼈⼿⾥。;终的结果,取决
于企业和政府的选择。�
但对于单个企业来说,没有选择。AI�的竞赛已经开始了,窗⼝正在关闭。现在不是要不要做�AI�的问
题,是你能不能跑得⽐竞争对⼿快的问题。�
所有企业都能买到同样的基础模型,所以未来的竞争,本质上是组织执⾏⼒的竞争。谁能先完成流程
重构、组织变⾰、数据积累,谁就能获得持久的优势。�
报告给所有企业提出了五条具体的⾏动建议:�
1. 先做⽆形的⼯作:不要⼀上来就买模型、搭服务器。先把流程理清楚,把数据的访问权限打通,把
变更管理做好。这些才是�AI�项⽬成功的前提。�
2. 建⽴正确的衡量体系:不要只盯着裁员省了多少钱。要定义更全⾯的�KPI:质量提升了多少、客⼾
满意度⾼了多少、收⼊涨了多少、新业务做了多少。�
3. 存储所有数据:不管现在看起来有没有⽤,先存起来。未来的�AI�⼀定会给你惊喜。�
4. 从第⼀天就建多模型架构:不要绑定任何⼀个⼚商。把模型当成可替换的零件,你的核⼼竞争⼒在
编排层。�
5. 现在就开始布局智能体:智能体的⽣产⼒优势是碾压性的。现在开始积累经验,未来才能跟上。�
六、附录:最实⽤的⼯具表�
报告的附录是;有价值的部分之⼀,整理了所有成功项⽬都在⽤的�KPI,以及;常⻅的失败模式和解决
⽅案。�
1.�按职能划分的核⼼�KPI�
职能� 核⼼�KPI�
客服� ⼯单偏转率、平均处理时间、
⾃助解决率、客⼾满意度、⼈
员缩减�
销售� 销售代表节省时间、线索发现
速度、转化率、⼯具使⽤率�
⼯程� 开发时间减少、代码质量、团
队产出⽐、新产品数量�
营销� 活动上线时间、内容⽣产成
本、点击率、个性化规模�
法律� ⽂档审核时间、处理量、信息
提取准确率�
采购� 浪费减少、缺货减少、采购成
本降低、处理时间减少�
招聘� 每个岗位筛选时间、招聘效
率、候选⼈转化率�
医疗� 临床⽂档时间、收⼊周期时
间、编码准确率�
2.�六⼤常⻅失败模式与解决⽅案�
失败根源� 占⽐� 典型表现� 解决⽅案�
组织准备不⾜� 35%� 试点永远推不开,没⼈⽤� 拿�CEO�的强制令,建�AI�
⼤使体系,做结构化的培
训�
知识没有沉淀� 27%� AI�说的都是废话,不如⽼
员⼯�
先建数据架构,⽤�AI�把⽼
员⼯的隐性知识提取出来�
合规部⻔阻挠� 18%� 项⽬拖⼏个⽉批不下来� ⼀开始就把合规拉进来当
合作伙伴,提前搭好⻛控
体系�
技术不成熟� 16%� 上线就崩,错误太多,⽤
⼾不信任�
⽤模块化架构,先做�
80%�AI+20%�⼈的混合模
式�
选错了问题�/�预期太⾼� 14%� 为了�AI�⽽�AI,做出来没
⼈⽤�
先找员⼯;痛的痛点,把
成功定义为迭代改进,⽽
不是⼀步到位�
没有合适的⼈和赞助⼈� 12%� 进度慢,依赖⼚商,赞助
⼈⼀⾛项⽬就死�
建专职的�AI�团队,争取跨
多个层级的赞助�