企业智能云盘方案之
AI+知识库应用
CONTENTS
大模型企业知识库落地的需求与痛点
AnyShare智能云盘方案:安全、准确且经济的加速AI+知识库落地
PART 1
PART 2
PART
01大模型企业知识库落地的需求与痛点
传统知识库是企业常见的业务场景:但知识构建、运营难,应用效果差
研发知识库 客服知识库
制度规范知识库
设备维护知识库
价值
开放性
市场销售知识库
IT服务知识库
售后服务知识库
生产制造知
内
识
部
库
知识应用 外部知识应用
通用知识库:传统知识管理系统
• 构建难:手工标签、分类难
• 运营难:与业务流程或者业务系统脱节,给业务部门带来负担;
• 应用效果:传统的关键词搜索,难以理解业务场景和语义;
业务专用知识库:客服知识机器人类应用
• 构建难:手工构建问答对为主
• 运营难:耗时耗力,业务部门难以持续构建
• 应用效果差:难以理解用户语义,错答、泛化能力差;
大模型给知识库应用带来的新希望:知识组织、生成和应用智能化
OpenAI:
• 未来80%的人,10%的工作任务场景将被GPT影响
• 19%的人,至少有50%的工作任务场景将被GPT替代。
AGI
大模型
模型基础能力 模型能力开放 行业知识结合
智能对话
短文创作
图片生成
视频生成
办公
内容推荐
医疗咨询
辅助诊断
结构化感知
3~6个月
6~12个月
12~24个月
2023
编程
设计
搜索
文档摘要
文档写作
代码开发
运营商
金融
医疗
生物
教育
城市大脑
社交
消费
网络自治
智能客服
智能风控
量化交易
大数据分析
内容剪辑
新闻采编
传媒
分子生成
智能教学
智能问答
Source:OpenAI、Frost & Sullivan、HW MI
城市营销
网站制作
精准获客
调研报告
平面广告
商业文案
内容搜索
视觉
语音
语义
生成
海量离散小模型
向
少数大模型汇聚
通用 2B 应用
行业通用场景数据
场景化 2B 应用
行业生产场景核心数据
2C 现象级应用
公开数据集
每个企业都应意识到:大模型 + 知识库是大模型落地企业的第一站
内容、文档、知识类
但是:大模型+知识库在企业落地,存在三大痛点
• 大模型落地三大件成本高:GPU服务器、大模型
集成开发、大模型应用产品的投入,成本高昂,动
辄百万起,必须降低软硬件成本;
• AI人才贵:智能应用涉及小模型算法、提示词、知
识图谱/数据增强、智能体开发、应用开发等等多
环节。降低运营、开发门槛,能够让大多数技术和
开发,甚至业务专家能够快速、自主、可配置、灵
活的开发智能应用机器人,是关键能力。
经济性
大模型落地要大幅降低TCO
准确性
大模型存在幻觉,必须严谨约束确保准确
• 内容准确:必须使用企业内部数据,并
结合知识图谱增强大模型的生成准确性,
• 场景准确:输出内容和范围针对特定业
务场景或者用户的,精准推荐和个性化,
范围可控;
• 可信:输出内容必须可信,有依据、可
解释;
• 数据安全权限可控:企业数据大多数是有
权限管控要求,必须在安全可控范围内利
用大模型的能力。
• 大模型是黑盒模型:大模型作为黑盒模型,
存在决策过程不透明、易受攻击、数据泄
露风险高、难以解释和控制等安全隐患,
可能导致误判、被操纵或信息泄露
安全
大模型要解决推理和数据安全:
PART
02
AnyShare智能云盘方案
安全、准确且经济的加速AI+知识库落地
AnyShare智能云盘解决方案:基于DATA+AI架构加速AI+知识库落地
AnyShare智能云盘是集企业云盘与AI于一体的新一代云盘方案。它采用DATA+AI架构创新,深度服务于企业各类AI+知识库场景,基于AnyShare认
知助手自定义各类知识库助手,员工可随时随地智能搜索和问答,轻松总结经验、撰写报告。是企业提升效率、优化管理、驱动创新的得力助手。
业务访问层
平台层:
DATA+AI架构
应用层
AI+知识库场景 研发知识库 制度规范知识库
Windows客户端 Mac客户端 Web Portal iPhone App Android App Linux 客 户端 国产化客户端
...
开放架构 云原生架构 内容数据湖
共享与访问
多级文档库
审核
Office预览/编辑 PDF预览/批
注
CAD预览/测
量
虚拟盘
智能问答
智能搜索
智能总结/摘要
辅助撰写
AnyShare认知助手
服务知识库
场景化机器人
领域知识网络 领域大模型
联邦AI的推理能力:
安全、高效、低成本
知识增强能力:
准确性、场景适应性
灵活的智能体编排能力:
准确性、场景适应性
爱数
TOME
丰富的AI+知识库场景:大模型 赋能业务知识库
大模型+知识赋能业务运营,成为企业提升效率、优化管理、驱动创新的得力助手!
IT服务 售后服务
人力资源
制度规范知识库:
加速员工入职和促进标准规范 “统一
制度规范文档发布查询,促进企 业内
部的信息透明度,提高员工工作合 规
性,并在工作中遵循统一的标准。”
法务证券
市场营销
市场营销知识库:
更快进入市场
“管理产品市场文档,更好的与经销商、生 态
伙伴协作,更快的进入市场,获得商机。”
法务合同知识库/专利技术知识库:
保持合规降低风险
“有效管理和保护企业的核心资产—知识产权,
促进内部交流协作、提升工作效率和服务水平,
并为企业的持续创新和发展提供坚实的基础。”
IT服务知识库:
提升企业内部IT服务效率和员工体验
“管理IT服务资料手册,提升IT部门服务效
率和员工满意度,降低服务压力,加速新系
统部署和数字化能力提升。”
销售
服务知识库:
提高客户满意度
“统一技术、服务经验知识库,更好的赋能 技
术工程师和服务流程,加快问题解决速度,
提高客户满意度和服务口碑。”
销售知识库:
加速销售周期,完成更多交易 “管理销售
计划、销售指南和案例,使流动 销售队伍
加速销售周期,完成更多交易。”
研发/设计
研发设计知识库:
加快产品和技术创新
“管理研发设计规范和历史经营知识,规范
研发流程并提升产品质量,减少重复发明轮
子,加快产品交付效率”
设备维护
设备维护知识库:
提升设备产能利用率
“管理设备维护资料和经验知识,减少设备
故障中断时间,解决设备检修时间长、故障
定位不准、设备检修经验知识流失”
某大型企业集团:企业报销制度的智能化问答
客户场景
AnyShare 认知助手最佳实践
集团内部有大量政策和制度,对于员工来说从海量
的制度文件中找到自己所需的条款是比较困难的。
比如新员工入职,对差旅相关的标准不了解,通常
需要向行政部门咨询或者找到对应的制度文件查阅
对应的标准,查找过程费时费力。
AnyShare认知助手结合企业制度文档库,提供制度
知识库问答。
用户通过自然语言的方式进行提问,AnyShare认知
助手快速将差旅标准给到他。比如直接提问我是工程
师,去某个城市出差,住宿费标准是多少?节省大量
询问和制度查询时间,大大提高报销制度获取效率。
智能报销问答演示视频
某大型汽车配件企业: SAP操作手册问答场
景
客户场景
AnyShare 认知助手最佳实践
SAP通过命令进行操作十分繁琐,虽然提供了对
应 的操作文档以及常见问题的QA文档,但是内容
太 多且繁杂,命令的查找费时费力。
基于SAP使用的场景问题及报错的QA文档,通过
AnyShare 认知助手实现SAP操作步骤的智能查询,
轻松查询SAP操作指令及对应业务操作,以图文并
貌 向用户展示每一个操作步骤。
SAP操作手册问答演示视频
基于AnyShare智能云盘:
三步极速搭建AI+知识库
PART
三步搭建 AI+知识库:第一步,建立基本从文档协作和知识库管理规范
知识库目录与权限
知识库发布流程
知识库管理
知识库范围
业务领域
概念、政策、法规
职能领域
制度、规定、指引、FAQ
协作库(部门文档库) 发布库(知识库) 归档库
标签体系
• 业务对象标签(文档与
业务对象相关)
• 业务域标签
• 其他专业标签
文档/知
识编目
• 业务对象描述
• 业务对象的BOM文档
等;
知识治理
文档管理规范
项目文档管理
部门文档规范
常见活动及文档模版
找文档用文档
在线共享协作
智能搜索
智能问答
辅助阅读
文案/报告助手
...
归档规范
档案管理系统(可选)
数字预归档
历史文档关联
...
三步搭建AI+知识库:第二步,从部门库发布到知识库(自动化/智能化)
会议纪要
智能总结
智能内容处理
将AI能力作为工作流的可配置节点,可以利用大模
型对文档进行自动化处理。
0011
02 典型场景一:招投标资料的生产
基于投标项目的要求,创建文档模板,利用大模型
可实现围绕着标题的扩写及主要内容的续写,加速
招投标资料的产出速度。
典型场景二:项目会议的报告生成
项目现场会议音频\视频等会议文件上传至
AnyShare中,通过工作流自动将音频转换成文本,
并通过大模型基于模板总结生成会议纪要。
03
提交文档 文档审核
文档发布入库
版本关联
文档/知识发布
通知
自动标签/智
能内容处理
三步搭建AI+知识库:第三步,配置智能机器人,实现场景化智能应用
智能Bot,精准回答
智能Bot根据用户的业务场景完成小而精的自定义
范围问答,答案更精准
0011
灵活可自定义的智能Bot
可根据不同的用户场景,选择不同的数据源(文档、
文档库、WikiDoc、知识图谱(版本上线)、外
部数据源(规划中))与大模型,实现专属问答。
02
03 多种访问方式
支持在认知助手侧边中选择智能Bot
支持在文档预览界面的侧边栏中选择Bot
支持在全部Bot中查看并使用已创建的Bot
与外部集成
智能Bot提供标准API可以便捷的与外部业务系统和
APP进行集成对接。
04
自定义机器人
任务调试
认知助手侧边栏
全部机器人
文档预览侧边栏
AnyShare智能云盘的一体化方案:
帮助企业安全、准确且经济的实现大模型+知识库落地
PART
智能云盘 的“一体化”方案:AnyShare + AnyDATA + 大模型一体机
经济性
安全性
低资源推理 单块 GPU 实现百亿参数级别模
型推理
低成本训练 基于行业预训练模型,极低
finetune 成本
低成本部署 一体机解决方案,0 部署成本
数据安全 完全私有部署,保障数据安全
数据隐私 基础模型训练数据脱敏,无非公开、
未经授权数据
偏见和歧视 产品层封装设计(无开放问答),模
型结果通过安全性校验
“智能化”配置
必配:AnyShare认知助手+AnyDATA
选配:大模型一体机AD19000
领域认
知智能引擎
云盘应用
领域大模型
领域知识网络
Family 7 智能内容管理平台
内容门户 文档中心 工作中心 表格中心
AD19000
On-Premise
BERT CLIP
大模型及
一体机
能力层 辅助创作
• 智能引用
• 辅助撰写
• 智能补全
• 语法纠错
• 全文撰写
生 产
辅助知识运营
• 自动化知识主题
• 主动知识推荐
• 自动化知识聚合
• 智能机器人精准
知识问答
消 费
智能搜索
• 智能问答
• 搜专家
• 综合搜索
• 图片搜索
• 认知搜索
辅助阅读
• 内容概述
• 知识点
• 智能问答
• 关联文档
• 关联专家
• 任务规划
• 内容自动化
AnyShare 认知助手
任务管理 多端扩展
• Office 插件
• 同步盘
• 客户端
• 浏览器
领域认知智能引擎:基于AnyDATA,以大模型中立提供经济、准确、安全的AI能力
认知助手
AI能力 搜索 推荐 问答 生成
统一数据管理
模型工厂:统一模型管理
Benchmark
模型微调
联邦AI 模型接入及用
量管理
统一算力调度
混合策略
资源可视化管理
推理加速
异构芯片适配 GPU调度优化
统一智能体管理
智能体工厂
...
Tool 2 Tool N
AnyDATA
AI集成平台
领域知识网络
知识增强 DATA+AI
能力
Benchmark
• 自动/任务规划
• 数据/知识增强
私域数据: • 内存管理
结构化/非结构化
机器数据 Tool 1
• 工具管理
DCU昇腾
大模型中立:私有大模型一体机或公有模型服务
On-Premise SaaS
爱数 TOME
BERT
On-Premise
基于AnyShare权限体系+AnyDATA提示词与智能体评估,确保大模型安全合规
大模型输入:指令+文本
• 数据有毒:内容过时、不良伦理价值观等;
• 数据安全:隐私泄露、公司/业务机密、知识产权/版权数据等;
• 数据质量:虚假信息、垃圾信息等;
• 数据偏见:内容中存在歧视、偏见等;
• 诱导攻击、提示词注入攻
击;
• 提示和文本存在敏感/虚假
信息;
领域微调
数据
• 恶意标注:诱导错误的人类信息对齐、错误价值导向;
• 低质标注:标注人员素质不齐、数据不可靠;
• 固化标注:缺少多样性、模式机械化;
输出:生成内容
• 幻觉,不可控;
• 不可解释
人类对齐
指令微调SFT RLHF
领域大模型 领域知识网络
模型工厂 智能体工厂
知识库
用户反馈
基于DATA+AI的大模型安全体系
AnyShare 认知助手
• 提示词控制,提示词效果评分;
AnyShare 认知助手
• 基于数据权限的输出权限管控;
• 知识网络(知识图谱)来强化生成、质量校验、
纠偏、防恶意输出;
• 通过统一高质量知识数据来进行领域微调;
• 基于用户反馈优化;
核心能力之一--知识增强: 领域知识网络增强智能体准确性和场景适应性
模型工厂
清洗后的数据
结构化后的数据
本体库
知识图谱
STEP1:领域数据源接入 STEP3:领域知识网络构建 STEP4:智能体工厂应用
知识抽取
数据加工
知识映射
洞察智能体
抽取模型
知识网络工作台 智能体工厂
数据接入
关系型数据
索引数据
数据接入
STEP2:数据处理
知识映射
向量数据
10101010101
10000100111
10010010100
文本向量
文本向量化
问答智能体
撰写智能体
文档/图片/音视频
内容流程引擎
音视频
ASR OCR
识别 标签/
编目 分类
分级
STEP5:接入AnyShare
认知助手(智能机器人)
AnyShare 认知助手
智能服务机器人
...
制度规范机器人
IT服务机器人
研发知识机器人
设备维护机器人
行业专利机器人
销售机器人
产品配置机器人
...
核心能力之二--联邦 AI :按需调度AI,高效、低成本且隐私保护
Agent
with p=a
Agent
with p=b
L M S
Benchmark
不同规格的大模型
智能体
Benchmark 特定任务效果满足要求
特定任务效果不满足要求
在线服务 AB test 分流测试
定期对线上智能体效果进行受控流量
下的 AB test,在可选模型中发现更优
组合
自动模型选择
根据特定任务Benchmark 选择满
足任务效果要求的最小模型,最大
化利用计算资源
自动参数优化
根据可选参数组合进行批量效果测试,
自动优化智能体整体效果
核心能力之三--可灵活编排的智能体:轻松搭建高适应性的智能体
Input
Output
LLM逻辑块
Retrievers逻辑块
query增强 query重写
智能体处理流程的终点,负责输出最终的处理结果
• query增强:例如用户搜索“高血压的症状”→“高血压 症状风险因素饮食建议治疗方法”
(通过知识图谱识别出“高血压”与相关症状、原因、治疗方法和预防措施的关联)
• query重写:例如用户搜索“纽约市中心住宿”→ “纽约市中心五星级酒店,包括时代广场附近 的
酒店”(大模型根据用户历史搜索行为改写查询)
LLM逻辑块是智能体中用于处理语言任务的模块,它通过接收用户输入的提示词,并选择合适的大
模型进行处理,执行特定的任务或回答相关问题。同时还支持添加多种内置工具,增强处理能力。
召回逻辑块是智能体中负责信息检索的模块,它通过添加知识图谱和AnyShare文档数据源来确定
搜索过程中应该覆盖的信息范围。通过结合知识图谱和丰富的非结构化文档数据,提高搜索的质量
和效率。
智能体处理流程的起始点,负责接收输入数据
智能体工厂的智能体们作为数字领域的得力助手,将业务流程中的各个环节巧妙地串联起来,用户无需关心技术细节,只需关注业务需求。通过逻辑块的高度封装,
用户可以轻松选择数据源、描述业务需求、添加定制逻辑,实现业务流程的自动化和智能化。
核心能力之三--智能体产品示意图
• 智能体工厂的智能体们作为数字领域的得力助手,将业务流程中的各个环节巧妙
地串联起来,用户无需关心技术细节,只需关注业务需求。
• 通过逻辑块的高度封装,用户可以轻松选择数据源、描述业务需求、添加定制逻
辑,实现业务流程的自动化和智能化。
知识图谱 文档数据
大模型逻辑块:根据提示控制生成效果 数据/知识逻辑块:领域数据和知识网络增强大模型生成准确性
准确性/效果反馈
DATA Doc & Info
(数据信息化)
Knowledge Network
(数据知识化)
Scenarios
(AI场景化)
Application
(AI产品化) USER
个性化定义Bot提升准确性(典型RAG)
标准化/产品化能力
可配置/调优的能力
第三方应用
图例
场景描述:公司或者某个部门的系列制度、行业标准知识库的智能问答(找资料并定位到相关文档段落)
办公文档
PDF
图纸扫描件
制度文档库
OCR识别
内容向量化
标准文档库
制度Agent
制度Bot
标准Bot
标准Agent
AnyShare认知助手
内部
员工
找文档
写材料
...
注:
1. AnyShare标准知识图谱默认自动化,默认图谱主要服务于主题、标签、作者的关联,无需调整配置,除非客户有明确的场景需要扩展图谱。
2.默认每个Bot下面会有自动化的Agent,可根据场景优化提示词或者能力。
展望:未来的知识工作者
“Human-AI”结合知识工作者
知识工作效率比传统工作者高 1-2 个数量级