智库文档所有分类

斯坦福企业 AI 实战手册深度解读.pdf

下载

He Wangmin

10页 | 745KB | 1次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

斯坦福《企业�AI�实战⼿册》深度解读� 这份�2026�年�4�⽉由斯坦福数字经济实验室发布的报告，是⽬前全球;系统、;实证的企业�AI�落地研究。三位核⼼作者都是⾏业顶尖学者：Erik�Brynjolfsson�是《第⼆次机器时代》作者、全球�AI�经济学领域;权威的学者之⼀；Alvin�Wang�Graylin�有�35�年�AI、半导体⾏业经验，同时担任�MIT�讲师； Elisa�Pereira�则有丰富的企业�AI�落地和⻛险投资背景。� 报告没有讲任何预测和空泛的理论，⽽是基于�2025�年�8�⽉到�2026�年�2�⽉整整半年的实地调研，深度访谈了�41�家企业的⾼管和项⽬负责⼈，筛选出�51�个真正跑通、产⽣可衡量商业价值、且实现规模化的�AI�部署案例。这些企业分布在�7�个国家、9�⼤⾏业，总员⼯数超过�100�万，覆盖了从客服、营销到供应链、临床医疗的⼏乎所有企业职能。� 报告;核⼼的⼀句话，也是贯穿全⽂的结论：所有成功的�AI�项⽬，差异从来都不在模型本⾝，⽽在组织。技术永远是最简单的部分。� ⼀、为什么要做这份研究� 现在关于�AI�的预测满天⻜，但真正在企业⾥落地的⼈，关⼼的从来不是�“五年后会怎样”，⽽是�“我现在该怎么做”。MIT�2025�年的⼀项研究戳破了⾏业泡沫：95%�的⽣成式�AI�试点项⽬，;终都没能产⽣任何可衡量的财务影响。失败的原因没有⼀个是模型不够好，全都是流程整合不到位、组织激励错位。� 这就是报告要解决的问题：那些真的靠�AI�赚到钱、提了效的企业，到底做对了什么？那些没写在新闻稿⾥的坑、那些失败的教训，⼜是什么？� 特别值得⼀提的是，这份研究没有只看成功。在每⼀次访谈中，研究者都会逼着受访者讲清楚：在这次成功之前，他们失败过⼏次？为什么失败？改了什么？结果发现，61%�的成功项⽬，都⾄少经历过⼀次彻底的失败。这些失败的沉没成本，从来不会出现在;终的�ROI�报表⾥，但却是成功必不可少的铺垫。� ⼆、研究是怎么做的� 1.�严格的案例⼊选标准� 不是所有�“⽤了�AI”�的项⽬都能进样本，必须同时满⾜四个条件：� • 运营稳定：系统已经正式上线，融⼊了⽇常⼯作流，不是演⽰⽤的�Demo� • 持续采⽤：跨团队连续使⽤了⾄少�3�个⽉，不是三分钟热度� • 量化价值：有明确的数字证明价值，⽐如⽣产⼒提升了多少、成本降了多少、收⼊涨了多少� • 可扩展：能复制到其他团队、其他地区或者其他业务单元，不是⼀次性的定制项⽬� 2.�样本构成� 51�个案例覆盖了�9�个⾏业，其中制造业、⾦融服务、软件科技各�10�个，零售�6�个，医疗�6�个，专业服务、法律服务、电信各�2�个，其他�1�个。� 从职能来看，客服�9�个、营销内容�8�个、销售�7�个、IT�运维�7�个、编码⼯程�6�个、招聘�6�个、⽂档审核�3�个、薪酬福利�3�个、供应链�3�个、临床�3�个，合规、财务、采购等职能也都有覆盖。� 3.�研究⽅法� 每家企业⾄少做⼀次�60�分钟的结构化访谈，同时要求企业提供内部的项⽬⽂档、财务报表、系统运⾏数据来交叉验证。访谈的核⼼不是问�“你们⽤了什么模型”，⽽是问：花了多少钱？谁牵头的？遇到的;⼤阻⼒是什么？怎么解决的？失败过⼏次？每次失败的原因是什么？� 4.�明确的局限性� 报告坦诚地说，这份研究只看成功案例，所以存在选择偏差。它告诉你�“成功是什么样的”，但不告诉你�“全⾏业有多少项⽬能成功”。同时，样本⾥技术和⾦融⾏业偏多，这也反映了�AI�早期落地的真实情况。� 三、11�条颠覆认知的全局核⼼发现� 这�11�条结论，每⼀条都和市⾯上的主流认知不⼀样，全是从真实项⽬⾥摸出来的硬规律：� 1. 77%�的难题都是看不⻅的：变更管理（33%）、数据质量与架构（17%）、流程重构（10%）是 ;⼤的三个拦路⻁，纯技术问题只占�23%。⼏乎所有受访者都说：“技术是;简单的部分，难的是让⼈愿意⽤，还有把乱七⼋糟的流程理清楚。”� 2. 同样的⽤例，有⼈⼏周搞定，有⼈要做⼏年：⼀个⾦融科技公司⽤�AI�编码代理迁移百万⾏遗留代码，只⽤了⼏周；⽽⼀家⼤银⾏做同样的智能客服系统，花了好⼏年还没上线。差异和技术⽆关，只和⾼管⽀持⼒度、现有流程基础、员⼯愿不愿意⽤有关。� 3. 让�AI�先⼲，⼈只看例外，效率最⾼：AI�⾃主处理�80%�以上的任务，⼈类只审核异常情况的�“升级式”�模式，能带来�71%�的中位数⽣产⼒提升；⽽要求⼈类审批每⼀个输出的�“审批式”�模式，只有�30%�的提升。� 4. 好的⾼管不是只批预算，⽽是每周帮你清障碍：;有效的赞助⼈，会每周开⼀次会，提前把跨部⻔的障碍扫掉，把�AI�纳⼊公司的�OKR�和奖⾦体系。;重要的是，他们会给团队�“失败的许可”——� 没有⼈会因为�AI�项⽬搞砸了丢⼯作。� 5. 最⼤的阻⼒不是⼀线员⼯，是后台职能部⻔：法律、HR、⻛控、合规部⻔的阻⼒占了�35%，⽐⼀线员⼯（23%）还⾼。他们不是故意找茬，⽽是怕出了问题⾃⼰背锅。但⼀旦把他们拉进项⽬，让他们负责治理，他们反⽽会变成;强的推动者。� 6. 裁员不是�AI�的必然结果：45%�的项⽬确实导致了⼈员缩减，但剩下�55%�的项⽬，企业选择了不招⼈、把⼈转到更有价值的岗位，或者⼲脆维持编制、⽤多出来的产能做更多业务。不过要注意，宏观数据已经显⽰，AI�暴露⾏业的初级岗位，已经出现了�16%�的相对就业下滑。� 7. AI�能赚钱，但很少有⼈做到：⼤部分项⽬还是在降本，只有少数项⽬实现了直接增收。增收的模式只有三种：⽤个性化提升转化率、⽤速度抢订单、把内部⽤的�AI�⼯具包装成产品卖出去。� 8. 智能体�AI�真的好⽤，但⼤部分公司还没开始⽤：只有�20%�的案例⽤了智能体，但它们的中位数⽣产⼒提升达到了�71%，⽽普通的⾼⾃动化模式只有�40%。智能体不是⼀个更好的聊天界⾯，它是重新定义了⼈和机器的分⼯�——AI�不再是⼯具，⽽是能独⽴完成多步骤任务的�“数字员⼯”。� 9. 数据不⽤先洗⼲净再⽤，LLM�⾃⼰会洗：只有�6%�的项⽬，在上线前拥有�“完美”�的数据。⼤部分项⽬的数据都⼜乱⼜散，但�LLM�本⾝就能解决数据提取、清洗、结构化的问题。核⼼不是数据有多⼲净，⽽是你能不能让�AI�访问到这些数据。� 10. 安全不会杀死项⽬，反⽽会让项⽬⾛得更远：没有⼀个项⽬因为安全要求彻底⻩了。前期花在安全上的功夫，;后都会变成核⼼竞争⼒�——�别⼈不敢碰的敏感数据，你能处理。⽽且，没有官⽅的安全⼯具，员⼯就会偷偷⽤影⼦�AI，那才是真正的⼤⻛险。� 11. ⼤部分时候，⽤什么模型根本不重要：42%�的项⽬⾥，模型是完全可以互换的。你⽤�GPT�还是� Claude，对;终结果没什么影响。企业真正的护城河，是把模型、数据、流程串起来的编排层，⽽不是基础模型本⾝。� 四、每⼀章的核⼼细节与真实案例� 第⼀章：为什么�AI�的商业案例总是低估真实投资？� 市⾯上的�AI�商业案例，通常只算模型和服务器的钱，但这只是冰⼭⼀⻆。Brynjolfsson�之前的研究发现，每花�1�美元在有形的技术上，就要配套花;多�10�美元在⽆形的东西上：流程重构、员⼯培训、组织变⾰。这就是�“⽣产⼒�J�曲线”——�前期投⼊会拉低⽣产率，等到这些⽆形投资到位了，回报才会爆发。� 报告⾥的物流公司发票处理案例，把这⼀点讲得特别透彻。这家美国物流公司每年要收�10�多万张供应商发票，格式五花⼋⻔，有邮件、有传真、还有电话⼝述的。原来�7�个全职员⼯专⻔⼲这个，天天加班还堆着⼀堆活。� 他们⼀开始想的是，找个�OCR�⼯具把发票扫进去就⾏。结果发现根本不⾏，因为公司攒了�750�个不同的发票模板，⼤部分都是重复的、没⼈管的。所以真正的⼯作，是先把这�750�个模板砍到⼏百个，然后让业务专家花了⼏千个⼩时，⼀张⼀张地标注�AI�的错误，教它怎么识别不同的发票。� 技术部分反⽽;简单，就是⽤了�Azure�的⽂档智能和�OpenAI�服务。整个项⽬�8�周就上线了，;后�7� 个⼈减到�2�个，处理时间从⼏天降到�24�⼩时以内，准确率�85%，⼀年省了超过�100�万美元。� 项⽬负责⼈说：“所有⼈都以为难的是技术，其实不是。所有的硬功夫都在流程⽂档和数据架构上。这两个搞定了，其他的都很简单。”� 第⼆章：怎么跨越从试点到�ROI�的�“死亡⾕”？� 现在⼤部分公司都卡在�“试点地狱”�⾥：做了⼀堆�Demo，看起来都挺好，但就是推不开、赚不到钱。报告发现，能不能快速跨过这个坎，取决于三个加速因素和四个减速因素。� 三个加速因素⾥，⾼管赞助占了�43%，是;重要的。其次是复⽤现有的基础�——�⽐如你已经做了智能客服，再做销售�copilot�就会快很多。第三是⽤⼾真的有痛点�——�如果员⼯已经被⼯作压得喘不过⽓，他们会求着你上�AI，根本不⽤你去说服。� 四个减速因素分别是：学习曲线和迭代、数据质量、监管合规、流程⽂档缺失，各占�21%�左右。� 还有⼀个�100%�的规律：所有成功的项⽬，⽤的都是迭代开发，没有⼀个⽤传统的瀑布模式。都是先做⼀个;⼩可⽤的版本，上线⽤起来，然后慢慢改。� 翻译公司的招聘案例特别有代表性。这家公司第⼀次做�AI�招聘，完全失败了。他们以为把简历扔给� AI，让�AI�筛⼈就⾏，结果�AI�有严重的偏⻅，⽽且原来的招聘流程本⾝就⼀团糟，AI�只是把坏流程放⼤了。� 第⼆次他们换了思路：⾸先，CEO�亲⾃牵头，每周开⼀次会清障碍；然后，先把整个招聘流程从头到尾理了⼀遍，把没⽤的环节都砍掉；;后，他们瞄准了招聘团队;⼤的痛点�——�每天⼏百份简历根本看不过来，⼈都快被逼疯了。� 这次项⽬只⽤了⼀个⽉就上线了，招聘效率提升了�83%，每个岗位的筛选时间从�3�⼩时降到�3�分钟，候选⼈转化率还提升了�75%。� 第三章：到底需要多少⼈盯着�AI？� 很多⼈觉得，AI�越成熟，需要的⼈就越少。但报告发现，不是这样的。;优的⼈类监督程度，取决于任务的容错率、监管要求和复杂度。� 报告把⼈机协作分成了三种模式：� • 升级式：AI�⼲�80%�以上的活，⼈只看例外。⽐如�IT�运维、客服、理赔，中位数提升�71%。� • 审批式：AI�把活⼲完，⼈必须每⼀个都看了才能发出去。⽐如临床⽂档、法律⽂书、对外的营销内容，中位数提升�30%。� • 协作式：⼈和�AI�⼀起⼲，谁也离不开谁。⽐如写代码、做战略分析，中位数提升也是�30%。� Anthropic�之前的数据很有意思：个⼈⽤�AI，52%�是协作模式，45%�是⾃动化；但企业⽤�AI，刚好反过来，77%�是⾃动化。这说明企业更倾向于让�AI�⼲重复的活，⼈⼲判断的活。� 有⼀个⾦融公司的营销案例，他们⽤�AI�⽣成多渠道的营销内容，采⽤了�80/20�的模式：AI�写�80%，⼈改�20%。结果原来�7�周才能做⼀个活动，现在�6�⼩时就能搞定，点击率还翻了⼀倍。� 负责⼈说：“企业级的营销，不能出⼀点错。⼀个错误的⼴告发给⼏百万客⼾，损失是⽆法估量的。所以我们需要那�20%�的⼈来把关。但这�20%�不是成本，是保护我们⼏⼗年攒下来的品牌。”� 第四章：什么样的⾼管才能把�AI�做成？� 很多公司的�AI�项⽬，都是�CEO�在⼤会上说⼀句�“我们要全⾯拥抱�AI”，然后把活扔给�CTO�就不管了。这种项⽬⼏乎都会死。� 报告把⾼管的参与度分成了四个等级：� 1. 被动审批：只批预算，剩下的全不管，占�12%� 2. 定期监督：每个⽉开⼀次会，出了问题再解决，占�12%� 3. 主动掌舵：每周开⼀次会，提前清障碍，参与重⼤决策，占�58%� 4. 战略整合：把�AI�纳⼊公司的�OKR�和奖⾦体系，推动整个公司的⽂化变⾰，占�29%� 前两个等级的项⽬，;多只能在单个部⻔做成。只有达到第四个等级，才能实现全公司的转型。� 好的⾼管会做四件事：给够钱和⼈、把�AI�和业务⽬标绑在⼀起、在全公司讲清楚�AI�的重要性、;重要的是，在团队遇到问题之前，就把障碍扫掉。� 还有⼀个关键：必须是业务和技术联合赞助。纯技术牵头的项⽬，⼀定会死。因为技术⼈员不懂业务痛点，业务部⻔也不会配合。� 半导体公司的现场服务案例就是这样。这家公司原来的现场服务⼯程师，遇到客⼾问题，要花�40�多个⼩时，从五六个不同的部⻔找资料，才能开始诊断。� 他们第⼀次做�AI，是⼯程部⻔⾃⼰搞的，做了个�Demo�就没⼈⽤了。第⼆次，AI�负责⼈直接找到� CEO，做了三件事：在每个部⻔都找了⼀个�AI�⼤使；把�AI�采纳率做成了全公司的�OKR，和奖⾦挂钩；每个⽉开⼀次�AI�演⽰⽇，CEO�亲⾃给做得好的团队颁奖。� 结果新的多智能体系统上线后，找资料的时间从�40�多个⼩时降到了�1�⼩时以内，95%�以上的问题都能拿到完整的数据，产品测试周期还缩短了�20%。� 项⽬负责⼈说：“AI�根本不是技术问题，是⼼态问题，完完全全是变⾰管理驱动的。”� 第五章：⼤家为什么反对�AI？� ⼤家默认的阻⼒来源是⼀线员⼯，怕被�AI�抢了⼯作。但报告发现，;⼤的阻⼒其实是后台的职能部⻔：法律怕担责任、HR�怕不好管、⻛控怕违规。他们⼿⾥有否决权，不管�CEO�怎么⽀持，他们只要拖着不批，项⽬就⻩了。� 不同的⼈反对�AI，原因不⼀样，解决⽅法也不⼀样：� • 职能部⻔：怕背锅。不要去说服他们，要给他们权⼒，让他们负责�AI�的治理，再把�AI�采纳率和他们的�OKR�挂钩。� • C�级⾼管：要看到真⾦⽩银。先做⼀个⼩试点，拿出实实在在的�ROI�数据，再要更多的钱。� • ⼀线员⼯：不信任�AI�的稳定性。要提前设好预期，告诉他们�AI�会犯错，需要他们来把关，AI�是帮他们⼲脏活累活的。� • 真正怕被裁员的⼈：给他们明确的出路。告诉他们哪些活会被�AI�⼲了，哪些活会留下来，他们未来会做什么。� 安全运营中⼼的案例特别好。这家公司的�SOC�团队有�6�个⼈，每个⽉要处理�1500�个安全警报，⼤部分都是误报。他们天天加班，低优先级的警报根本没时间看。� ⼀开始领导说要上�AI，⼤家都很抵触，怕被裁员。结果领导说：“AI�不是来取代你们的，是来取代那些我们本来就想招但招不到的⼈的。你们原来天天删垃圾警报，以后这些活�AI�⼲，你们去做威胁� hunting、安全架构这些真正有技术含量的事。”� ;后�AI�上线后，每个⽉能处理�4�万个警报，原来需要�6�个⼈，现在只需要��个⼈。没有⼀个⼈被裁员，多出来的��个⼈，都转到了更⾼价值的岗位上。� 第六章：⽣产⼒提升了，⼈怎么办？� 这是⼤家;关⼼的问题。报告的数据很明确：裁员是;常⻅的结果，但不是必然结果。45%�的项⽬裁了⼈，19%�的项⽬选择了不招⼈，17%�的项⽬把⼈转岗了，还有�19%�的项⽬，⼲脆维持了原来的编制。� 企业怎么选，完全取决于他们的战略。成⻓型的公司，会把多出来的产能投⼊到新业务⾥；⽽私募股权控股的公司，或者正在扭亏的公司，⼏乎⼀定会选择裁员。� 教育科技公司的案例很有代表性。这家公司给⼯程师上了�GitHub�Copilot�和�Cursor，⽣产⼒提升了� 20-30%。同时⽤�AI�写课程内容，省了⼏百万美元的成本。� 这时候公司内部出现了分歧：CEO�和�COO�在私募的压⼒下，想裁掉⼀部分⼯程师和内容团队；但� CTO�说，我们有⼀⼤堆产品需求排着队做不完，为什么不把省下来的时间⽤来加速产品开发？多做⼏个功能，多赚的钱，⽐裁员省的那点钱多得多。� ;后公司采纳了�CTO�的建议，没有裁⼀个⼯程师，把省下来的钱和⼈⼒，都投⼊到了�AI�产品的开发上。� 但报告也给出了⼀个很严肃的警告：现在的情况，可能是;好的情况。ADP�的⾼频率⼯资数据显⽰，从�2022�年底到�2025�年，22-25�岁的初级软件⼯程师，就业⼈数相对下降了近�20%。这些�“煤矿⾥的⾦丝雀”�告诉我们，AI�对劳动⼒市场的冲击，已经开始了。随着智能体�AI�的成熟，未来的裁员压⼒只会越来越⼤。� 第七章：AI�能做哪些以前根本做不了的事？� ⼤部分公司⽤�AI，都是为了把原来的活⼲得更快、更便宜。但真正厉害的公司，会⽤�AI�去做以前根本不可能做的事。� 报告⾥的区域超市案例，简直是降维打击。这家超市只有�20�多家店，和沃尔玛这种巨头⽐，⼀点采购优势都没有，利润率只有⾏业平均的⼀半。� 原来他们有⼀个采购经理，凭经验给所有店订货。结果要么是货订多了烂在货架上，要么是订少了缺货，客⼾跑到竞争对⼿那⾥去了。� 后来他们上了⼀个完全⾃主的�AI�采购系统。这个系统不是给采购经理提建议，是直接决定买什么、买多少、从哪个供应商买。它会⾃动拉取每个店的销售数据、库存数据、天⽓数据，预测每个�SKU�的需求，然后⾃动下订单。� 结果是：浪费减少了�40%，缺货减少了�80%，公司的�EBITDA�直接翻了⼀倍。⼀个只有�20�多家店的⼩超市，利润率居然和⾏业巨头差不多了。� 还有⼀个医疗�AI�公司的案例。医疗美容⾏业是全现⾦⽀付，没有医保，所以没有任何结构化的市场数据。医药公司根本不知道哪个医⽣做什么⼿术、做多少量，销售只能瞎跑。� 这家公司⽤�AI�爬取了所有公开的信息：医⽣的⽹站、社交媒体、点评⽹站、新闻报道，然后给每个医⽣建⽴了档案，估算他们的⼿术量和增⻓潜⼒。这是以前任何⼈都做不到的事。现在医药公司的销售，拿着这个名单去跑，转化率提升了好⼏倍。� 第⼋章：智能体�AI�到底有没有⽤？� 现在智能体�AI�炒得很热，但很多⼈觉得是噱头。报告⽤数据证明：智能体真的有⽤，⽽且效果⽐普通的�AI�好得多。� ⽬前只有�20%�的案例⽤了智能体，但它们的中位数⽣产⼒提升是�71%，⽽普通的⾼⾃动化模式只有� 40%。成功的智能体项⽬，都有四个共同点：� 1. 处理⾼容量、重复性的任务� 2. 有明确、客观的成功标准� 3. 就算出错了，也能补救，不会造成灾难性的后果� 4. 能访问多个系统的数据� 报告特别强调：智能体不是⼀个更好的聊天机器⼈。它是重新定义了⼈和机器的关系。以前�AI�是⼯具，⼈告诉它做什么，它就做什么。现在智能体是你的同事，你告诉它⼀个⽬标，它⾃⼰会规划步骤、调⽤⼯具、完成任务，遇到搞不定的事再找你。� METR�的研究数据显⽰，前沿模型已经能可靠地完成需要⼈类专家⼲�15�⼩时的任务，⽽且这个能⼒每� 7�个⽉就会翻⼀倍。报告预测，未来�3�年，智能体将成为企业�AI�的主流形态。到时候，不会⽤智能体的公司，根本没法和别⼈竞争。� 第九章：企业的数据到底需要多⼲净？� 以前做⼤数据项⽬，有⼀句名⾔：“垃圾进，垃圾出”。所以⼤家都觉得，要先花⼏年时间，把所有数据都洗⼲净、集中起来，才能做�AI。� 这份报告彻底推翻了这个认知。只有�6%�的项⽬，在上线前拥有�“⼲净、准备好”�的数据。剩下�94%� 的项⽬，数据都⼜乱、⼜散、⼜脏。但他们还是成功了，因为�LLM�本⾝就是;好的数据清洗⼯具。� LLM�能处理以前任何技术都处理不了的⾮结构化数据：扫描的�PDF、⼿写的单据、电话录⾳、聊天记录、遗留代码。88%�的案例⾥，AI�解锁了以前根本⽤不了的数据。� 报告说，现在;重要的不是数据有多⼲净，⽽是你能不能让�AI�访问到这些数据。你不需要把所有数据都集中到⼀个数据仓库⾥，只要建⼀个�RAG�架构，或者⼀个多智能体框架，把分散在各个系统⾥的数据连起来就⾏。� 还有⼀个;重要的建议：存储⼀切数据。现在存储数据的成本⼏乎可以忽略不计，但你永远不知道，未来的�AI�能从这些数据⾥挖出什么价值。那些⼗⼏年前就开始存数据的公司，现在已经有了别⼈根本复制不了的护城河。� 建筑公司的采购案例很能说明问题。这家公司的技术员，都是⽤纸、邮件、Excel�来提交零件申请的，格式乱七⼋糟。⽽他们⾃⼰的零件⽬录，数据也不准，很多东西的名字都写错了。� 他们没有先花⼏个⽉去洗数据，⽽是做了⼀个四阶段的管道：先⽤�Python�提取，再⽤⽣成式�AI�清洗，然后做模糊匹配，;后⼈只看例外情况。结果项⽬花了�50�万到�100�万美元，预计�3-5�年能有�10� 倍的�ROI。� 第⼗章：安全是保护项⽬，还是杀死项⽬？� 很多⼈觉得，安全部⻔是�AI�的敌⼈，他们会把所有有意思的项⽬都毙掉。但报告发现，没有⼀个项⽬因为安全要求彻底失败。相反，那些前期在安全上花了功夫的公司，;后都获得了别⼈没有的优势。� 美国⼀家⼤型零售银⾏的案例很典型。这家银⾏因为之前出过合规问题，有⼀个死规定：所有系统必须部署在公司防⽕墙以内，绝对不能⽤云服务。但现代�AI�都是云原⽣的，这个规定等于直接判了�AI�的死刑。� 后来他们想了⼀个办法：客⼾的问题进⼊防⽕墙后，先把所有的个⼈信息（名字、账号、⾦额）都删掉，换成假的合成数据，然后再发给云⾥的�AI�模型。AI�处理完，返回结果，银⾏再把真实的个⼈信息换回去，发给客⼾。� 这个项⽬花了好⼏年时间才搞定，但现在他们能安全地⽤云�AI�处理客⼾的敏感数据，这是很多竞争对⼿都做不到的。� 报告还特别提醒了影⼦�AI�的⻛险。现在�70%-80%�的员⼯，都会偷偷⽤公司没批准的�AI�⼯具，57%�的⼈上传过敏感的公司信息。IBM�的数据显⽰，⼀次�AI�相关的数据泄露，平均会给公司造成�488�万美元的损失。� 解决影⼦�AI�的;好办法，不是禁⽌，⽽是提供更好的官⽅⼯具。如果公司的⼯具⽐员⼯⾃⼰找的好⽤，他们⾃然就不会偷偷⽤了。� 第⼗⼀章：什么时候选模型才重要？� 现在⼤家天天在争论，⽤�GPT�还是�Claude，⽤开源还是闭源。但报告说，对于⼤部分企业⽤例来说，⽤什么模型根本不重要。� 42%�的项⽬⾥，模型是完全可以互换的。你把�GPT�换成�Claude，;终的结果⼏乎没有区别。只有在做复杂的多步推理、智能体⼯作流的时候，模型的能⼒才会成为瓶颈。� 现在⼏乎所有的领先公司，都在⽤多模型架构。他们不会把宝压在⼀个⼚商⾝上，⽽是建⼀个抽象层，把所有的模型都接进来。然后根据每个任务的需求，⾃动路由到;合适的模型：⽤便宜的⼩模型做分类，⽤贵的⼤模型做推理，⽤开源模型做安全这种需要完全控制的场景。� 这样做有三个好处：避免⼚商锁定、优化成本、未来可以⽆缝接⼊新出的更好的模型。� 报告还提到了⼀个很有意思的趋势：2026�年�2�⽉，OpenRouter�上流量;⼤的�5�个模型⾥，有�4�个是中国的开源模型（MiniMax、Kimi、GLM、DeepSeek）。主要是因为智能体任务会消耗巨量的� token，中国开源模型的成本优势太明显了。不过美国的企业，还是主要⽤�OpenAI、Anthropic�这些美国⼚商，因为合规和⽀持的问题。� 现在企业选模型，第⼀看能⼒，第⼆看上线速度，成本根本不是主要考虑因素。但报告预测，随着智能体的普及，token�消耗会爆炸式增⻓，未来成本会成为模型选择的第⼀要素。� 五、结论：给企业的实战⾏动指南� 报告;后说，我们现在正处于⼀个�“⽣产⼒岔路⼝”。AI�既可以⽤来赋能员⼯，创造新的业务和新的⼯作岗位，让所有⼈都受益；也可以⽤来裁员降本，把利润都集中到少数⼈⼿⾥。;终的结果，取决于企业和政府的选择。� 但对于单个企业来说，没有选择。AI�的竞赛已经开始了，窗⼝正在关闭。现在不是要不要做�AI�的问题，是你能不能跑得⽐竞争对⼿快的问题。� 所有企业都能买到同样的基础模型，所以未来的竞争，本质上是组织执⾏⼒的竞争。谁能先完成流程重构、组织变⾰、数据积累，谁就能获得持久的优势。� 报告给所有企业提出了五条具体的⾏动建议：� 1. 先做⽆形的⼯作：不要⼀上来就买模型、搭服务器。先把流程理清楚，把数据的访问权限打通，把变更管理做好。这些才是�AI�项⽬成功的前提。� 2. 建⽴正确的衡量体系：不要只盯着裁员省了多少钱。要定义更全⾯的�KPI：质量提升了多少、客⼾满意度⾼了多少、收⼊涨了多少、新业务做了多少。� 3. 存储所有数据：不管现在看起来有没有⽤，先存起来。未来的�AI�⼀定会给你惊喜。� 4. 从第⼀天就建多模型架构：不要绑定任何⼀个⼚商。把模型当成可替换的零件，你的核⼼竞争⼒在编排层。� 5. 现在就开始布局智能体：智能体的⽣产⼒优势是碾压性的。现在开始积累经验，未来才能跟上。� 六、附录：最实⽤的⼯具表� 报告的附录是;有价值的部分之⼀，整理了所有成功项⽬都在⽤的�KPI，以及;常⻅的失败模式和解决⽅案。� 1.�按职能划分的核⼼�KPI� 职能� 核⼼�KPI� 客服� ⼯单偏转率、平均处理时间、⾃助解决率、客⼾满意度、⼈员缩减� 销售� 销售代表节省时间、线索发现速度、转化率、⼯具使⽤率� ⼯程� 开发时间减少、代码质量、团队产出⽐、新产品数量� 营销� 活动上线时间、内容⽣产成本、点击率、个性化规模� 法律� ⽂档审核时间、处理量、信息提取准确率� 采购� 浪费减少、缺货减少、采购成本降低、处理时间减少� 招聘� 每个岗位筛选时间、招聘效率、候选⼈转化率� 医疗� 临床⽂档时间、收⼊周期时间、编码准确率� 2.�六⼤常⻅失败模式与解决⽅案� 失败根源� 占⽐� 典型表现� 解决⽅案� 组织准备不⾜� 35%� 试点永远推不开，没⼈⽤� 拿�CEO�的强制令，建�AI� ⼤使体系，做结构化的培训� 知识没有沉淀� 27%� AI�说的都是废话，不如⽼员⼯� 先建数据架构，⽤�AI�把⽼员⼯的隐性知识提取出来� 合规部⻔阻挠� 18%� 项⽬拖⼏个⽉批不下来� ⼀开始就把合规拉进来当合作伙伴，提前搭好⻛控体系� 技术不成熟� 16%� 上线就崩，错误太多，⽤⼾不信任� ⽤模块化架构，先做� 80%�AI+20%�⼈的混合模式� 选错了问题�/�预期太⾼� 14%� 为了�AI�⽽�AI，做出来没⼈⽤� 先找员⼯;痛的痛点，把成功定义为迭代改进，⽽不是⼀步到位� 没有合适的⼈和赞助⼈� 12%� 进度慢，依赖⼚商，赞助⼈⼀⾛项⽬就死� 建专职的�AI�团队，争取跨多个层级的赞助�

联系我们

智库文档公众号

客服微信

斯坦福企业 AI 实战手册深度解读.pdf

下载

标签

联系我们

意见反馈