智库文档所有分类

电商大模型及搜索应用实践.ppt

下载

来自星星的小胖子

31页 | 2.91MB | 0次下载 |

0.0

(0人评价)

我要评价：

投诉举报

用手机看文档

扫一扫,手机看文档

下载

开通VIP

电商大模型及搜索应用实践 C O N T目E录N TS 01 电商行业的发展和技术演进 02 大模型在电商场景下的问题 03 电商大模型关键技术 04 电商搜索大模型应用实践 05 下一代A I电商搜索电商行业的发展和技术演进 • 电商行业发展 • 电商场景问题分析 • 关键问题和技术挑战 • 技术演进洞察电商行业发展过去10年实物商品网上零售额高速增长，电商模式也从货架电商为主发展为和内容电商并存的局面货架电商(阿里,京东,拼多多等) 内容电商（抖音,快手,小红书等）本质上都是通过技术驱动大幅降低了商品流通成本，显著提升了零售效率，而电商模式的发展变化背后也是技术演进的结果电商场景分析购物需求非购物需求即兴需购物求电商平台物流售后用户从电商用户的消费决策链出发，用户从需求的产生到最终决策下单可拆解为购前，购中，购后，这三个阶段：购前购中购后搜索搜索搜索在消费决策链路中用户购买需求产生后搜索是决策的关键环节，而电商搜索的核心就是基于用户需求的商品分发，电商搜索技术就是主要解决商品分发效率的问题，优化的目标就是GM V和UCVR，和一般的信息搜索（如百度）有很大的区别。内容平台：以抖音，快手，小红书等为主的内容分发平台，也是当前的新兴内容电商平台，处于消费链路上游电商平台：以阿里，京东，拼多多为主的商品分发平台，也是当前的货架电商平台，处于消费链路中下游渗透发展内容平台推荐需求激发关键问题和技术挑战产品形态：京东主站三大搜索产品形态京东app 京东小程序宏观目标：更低的成本，更高的效率，更好的体验关键问题：GMV：UV * UCVR * 客单价京东 PC 关键问题和技术挑战 1.文本+图像多模态匹配 2.动态价格,促销,物流等 3.权衡UCVR和长期GMV 4.宏观流量调控和反作弊相关性 1.复杂用户需求理解 2.数千数万商品属性和类目精准识别 3.用户画像等复杂上下文意图理解 1.多维度召回和融合 2.商品和库存等动态变化 3.个性化和多样性问题商品召回 1.提升交互效率同时考虑激发用户需求 2.时效性问题 3.丰富性问题交互引流优化目标：GMV=UV * UCVR * 客单价，多目标优化难题，还要坚持宏观目标：更低的成本，更高的效率，更好的体验，从技术角度拆解存在以下技术挑战：电商搜索技术演进洞察技术演进本质上还是通过技术创新去实现更低的成本，更高的效率，更好的体验文本检索阶段 1.规则引擎的应用 2.基础文本检索技术 3.关键词的人货匹配机器学习阶段 1.统计NLP为核心的用户意图理解和商品理解 2.基于M L的CTR/CVR建模排序模型 4.用户反馈数据学习深度学习阶段 1.基于D N N的意图/商品精准理解提升分发准确率 2.以文本+语音+图像的新搜索交互, N N语义召回,多模态召回和D N N匹配技术 3.个性化搜索，千人千面大模型阶段 1.交互上单向引导到对话式交互导购 2.基于大模型的用户理解和商品理解解决长尾 3.大模型生成式检索技术 AGI导购助手 1.完全AGI技术驱动 2.完全多模态交互 Agent式购物服务 4.人格化数字虚拟助理大模型电商场景下的问题 • 大模型的技术优势 • 电商场景下的应用问题 • 电商大模型解决方案大模型的技术优势广泛的知识总结和归纳能力显著迁移学习和多任务能力 2 3 逻辑推理和分析能力 4 多语言多模态建模 5 强大的语言理解和生成能力 1 算法多模态，M OE 算力 GPU,NPU 数据 WebData, 专有知识数据电商场景下的应用问题电商知识理解： • 通用大模型商品知识专业性不足商品类目,品牌, 属性等 • 通用知识和商品的对齐问题 • 图像商品理解差效果和个性化 • 直接应用没绝对效果优势 • 理解购物历史，偏好，评论，商品细节等个性化挑战时效性 • 大模型本身更新很慢，知识陈旧 • 新商品，促销，价格等更新时效性很高成本和速度 • 训练和推理成本大，ROI低，很难大规模商用 • 在线推理速度很难满足实时性安全性 • 用户敏感数据泄露风险 • 生成商品相关内容的安全合规电商大模型解决方案 NPU平台 GPU平台 Alignment Learning Model Expansion+多阶段Continue Pretraining 文本大模型底座(Dense + MOE) 多模态大模型底座电商大模型京东App 京东PC 京东小程序应用：Prompt+SFT/DPO/PPO等+Distillation RA G 电商知识图谱 Web 搜索用户画像电商大模型关键技术 • 数据和预训练 • 通用对齐和领域对齐 • 安全性 • 评估体系数据和预训练- DataPipline • 核心：站外和站内商品相关数据去噪音，提升专有数据的电商知识密度站外数据站内数据文法引擎过滤困惑度评分器质量评分器数据去重分析基于聚类和分类类目过滤用户行征过滤通用数据拒绝采样安全性过滤配比均衡策略数据和预训练-Continue Pretraining 祖先/ 前辈知识积累教育系统个体学习新知识知识继承历史经验和智慧书本,文化,科技教师,家庭,社会获取知识研究和创新等下一代继承人类学习模式 • 基于NPU集群 • 高效训练框架 • 100B • MOE 基于知识继承的增量学习框架 • 基于对知识学习的认知，成本和效率的考量平台和框架基座大模型参数扩展 • Depth Up- Scaling • MOE 长上下文扩展 • 增加长上下文数据配比 • 分块缓存工程架构优化持续预训练 • Cosine Learning Rate Scheduler • 退火学习 • 数据配比通用对齐和领域对齐学习目标：通用指令遵循优化，同时在电商领域增强对齐 • 通用指令:一级数十，二级数百类，数十万级 • 电商指令:数十级，规模数万级 SFT DPO • 通用指令：数万级 • 电商指令：数十万级 • RewardModel: • 电商反馈数据数百万千万级 PPO 安全性电商大模型 prom pt 检测生成内容检测安全日志记录数据标注平台 SFT+RLHF annotator 安全检测服务 user 1 2 从潜在安全事件发生前后可以划分为被动安全和主动安全 • 被动安全：安全检测服务，从检测方向，对用户输入的prompt和大模型生成的内容进行安全检测 • 主动安全：大模型生成安全性，从生成方向，对于任何输入保证大模型生成的回复内容是安全可控的，包括幻觉，毒性，偏见等，主要通过SFT和RLHF技术实现安全攻击挖掘一级涉政恐暴色情赌博违禁品欺诈违法有害意识形态供应链漏洞安全性-被动安全目标：对用户输入的prom pt和大模型生成的内容进行安全检测，输出安全分类标签，执行A ction 策略，除公司统一的安全审核服务外，同时构建了增强的被动安全审核。安全干预平台文法规则引擎分类模型大模型安全检测融合策略 • 安全干预平台:目标是快速干预实现紧急安全问题 • 文法规则引擎:以句法分析模板 + 词典进行识别，侧重关键词特征明显的文本识别 • 分类模型：以NN为核心的小模型，例如基于bert的分类，保证一定泛化，同时满足实时要求 • 大模型安全检测：通过SFT等技术通过大模型来检测，为了满足低时延往往低于13B参数实现拦截A ction 策略安全性-主动安全 • 一级9类，二级100+ 类安全指令类型 • 数据规模：数十万+ SFT DPO • 多个大模型辅助生成+ 人工编辑校验 • 数据规模：数万级 • :安全RW ：基于被动安全检测审核数据训练一个安全性打分模型 • 融合：和通用RW 非线性融合 PPO 两种思路 • 融合路线：通用对齐+电商对齐+安全对齐在SFT和DPO阶段数据融合，PPO阶段模型融合 • 两阶段对齐：最后单独进行二阶段的安全对齐评估体系 • 使用主流Benchmark： • MMLU,CMMLU,C-Eval,GSM8K，GAOKAO，SuperCLUE等 • 和电商应用任务对齐构建了电商Benchmark • 自动评估+人工评估 • CValues，Safety-Prompts，自建安全评估集 • Score = 安全回复数量/总回复数量或总prompt数量 • FRR：错误拒答率通用Benchmark 电商Benchm ark 安全性Score 电商搜索场景下大模型应用实践 • 搜索交互 • 电商用户意图理解 • 文案创意生成 • 电商搜索相关性搜索交互通过query引导，更好的获取满意结果，同时降低交互成本，提升搜索交互效率，通过引导有效提升转化，如下示意图：难点和挑战 • 传统方法核心是基于召回+排序思路，SMT, NMT，优化链路长，噪音大 • 歧义，多义，个性化等理解挑战 • 准确性，泛化效果很难进一步提升用户query 交互引导商品检索 SKU 候选结果展现 sku List 方向功能 Sug 基于前缀的补全提示纠错在用户提交了错误的查询词后进行纠正搜索发现基于搜索query和用户画像推荐相关query 我猜你搜等基于个性化的query推荐，激发购物需求搜索交互-以纠错/Sug等为例大模型应用核心点 • 基于电商知识增强的电商大模型进一步结合业务任务对齐 • 搜索交互日志利用+对齐优化目标需考虑对搜索效果的增益 • MultiInstruction Learning 电商大模型 SFT对齐阶段 • Rejection sampling • MultiTask 小流量应用 • 小流量验证，观察UCTR等 • 收集反馈数据 RLHF阶段 • 基于小流量用户SKU点击构建偏序数据 • RW 基于商品检索系统收益指导循环迭代电商意图理解电商意图理解目标：解决用户需求表达和商品的语义对齐问题，提升商品召回的相关性和多样性，最终提升用户转化UCVR 方向： • query理解：分词，实体识别，类目预测，品牌识别，改写，需求识别等 • 商品理解：商品SKU理解，商品图像理解，sku-to-query等用户需求商品检索商品空间 query理解商品理解问题和挑战： • query理解: 传统基于规则+基于bert的二分类或多分类,序列标注等算法,优化成本高,长尾难解决 • 商品理解：商品理解泛化差，商品图像基于OCR准确率不高电商意图理解电商大模型 Instruction SFT RA GRLHF：基于搜索反馈+CTR/CVR的R W prom pt应用实体识别类目预测 ...... 意图预测商品理解. 电商知识图谱用户画像搜索反馈核心技术： • Instruction learning • 搜索用户反馈用于DPO/PPO • RAG：知识图谱-RAG，用户画像- RAG 文案创意生成 • SKU描述- > 标题 • SKU描述+ SKU图像- > 标题商品标题生成 • SKU描述+场景- > 营销文案 • SKU描述+ SKU图像- > 图文文案商品文案生成 • SKU商详 - > 卖点 • SKU商详+卖点- > 卖点文案卖点生成等目标：利用大模型的生成能力，降低商品素材的成本，提升营销转化效率典型场景图像编码器文本编码器图像输入文本输入图文匹配学习融合编码器图像输入文本输入多模态大模型关键技术 • 图文语义对齐学习 • 商品图文数据构建图文对比学习电商搜索相关性 • 核心问题：用户需求和商品的匹配问题，最终会被转化为sim(query, sku)的相关性,同时优化考虑CRT和CVR为目标 • 主流模型：主流的基于NN的语义相关性模型分为两大类：孪生网络和交互式匹配孪生网络也称双塔模型，特点： • • 完全独立编码，上层相关性交互可离线计算编码，在线速度快交互式匹配网络也称单塔模型，特点： • 在底层直接self-attention完成细粒度交互 • 不可离线计算，在线速度慢，效果相对好典型代表：DSSM 典型代表：Bert 问题挑战：长尾泛化效果存在瓶颈，超长上下文以来理解有限电商搜索相关性 • query, click_sku_title • query- query预训练增强 •数百万级高质量数据 • COT增强对齐 • RA G:画像,商详等 RLHF •大规模点击反馈偏好数据 • 结合UCVR的R W 方案1：prompt工程应用+数据增强蒸馏通用大模型 prom pt工程 • few-shot 标注样本 NN相关性模型方案2：增强预训练+相关性对齐电商增强大模型相关性SFT 数据增强蒸馏数据增强蒸馏下一代A I电商搜索下一代A I电商搜索传统电商和新兴电商核心还是搜推技术驱动购物需求非购物需求即兴需购物求电商平台物流售后购前购中购后需求激发搜索搜索搜索内容平台推荐痛点问题用户消费链用户路 •用户交互成本高，需要精准的关键词表达 •用户购买决策成本高，结果是sku列表，多次点击查看 • 转化链路长低效 • 长尾不相关或无结果导致搜索效率低 •交互表达受限，只支持以query单向交互为主 •用户多平台跳转成本效率体验下一代A I电商搜索多模态大模型- >AGI 商品A gent 物流A gent 售后A gent ...A gent 多模态直接结果语音+文本 + 视觉+ 空间以搜推技术驱动以大模型 + Agent / AGI 技术驱动内容A gent

合作伙伴

来自星星的小胖子

关注进入主页

联系我们

智库文档公众号

客服微信

合作伙伴

来自星星的小胖子

标签

联系我们

意见反馈