企业信息搜索及商业价值概述
维思比科技(北京)有限公司
2010年4月
技术的进步改变了企业的信息环境。
企业信息源的日益多元化令管理者和员工查找信息的成本越来越高;而互联网搜索的模式是如此简单,使用者只要输入一个关键词并按下 Enter 键,系统就会自动地将符合的结果列出,即使面对的是数千万的网页,入口网站依然在一秒内就完成查询。通用的互联网搜索引擎对人们使用习惯的巨大影响力使Google化的企业搜索成为企业用户的梦想。
但是当公司真要导入时,却发现系统的复杂度远超过先前的想象,常会因为评估期过程太长而导致项目无疾而终。虽然企业信息搜索复杂,但信息利用的成本/收益分析证明企业搜索不仅必要而且重要。Web 的模式不断渗透企业日常行为,大量数据、信息和知识的电子化,其带来的知识共享诉求要求企业搜索深入参与企业知识建设。
对多数的企业来说,在购买企业搜索引擎时的出发点都很简单,往往只是要解决几个典型的问题,比如:
1. 在企业网站中提供搜索功能。
2. 公司内数据越来越多难以管理,且储存在不同计算机内。
3. 离职员工的文件数据已完成备份,但想使用时却难以发现。
4. 同一份文件需要重复的提供给不同的人。
5. 不同部门对内部文件都有自己的管理方式,难以整合。
一方面,我们需要认识企业搜索的商业价值,另一方面,我们必须洞察企业搜索的常见误区。在此基础上明确我们的建设目标,着手构建专业的企业搜索。
下面我们将围绕以下几个方面展开介绍,希望给企业一个比较清楚地概念,藉此节省评估时间并简化系统建设流程,以解决企业内部的信息分享问题。
4为什么需要企业搜索?
6企业搜索的发展趋势
7企业搜索的商业价值
8企业搜索的常见误区
9企业搜索面对的挑战
10VSP搜索系统的主要优势
11VSP搜索系统的功能列表
14企业参与程度决定了效果
为什么需要企业搜索?
十几年前,企业内部要查找信息相当容易。大部分信息存储在业务数据库中,只要进入相应的数据库里进行查询就能找到所需要的信息。比如,想要查询关于某个客户的所有统计数据,或者想要调取某笔有问题的支付记录的详细信息,在数据库里进行检索即可快速获得信息。除此之外,纸质文档则被分门别类进行存档,包括合同、备忘录、产品描述等,需要时可按类别调阅。
然而,随着技术的发展,企业的信息化建设已经势不可挡,各类业务信息系统不断被采用,互联网与内联网更是广泛应用,信息全面电子化。但是创建信息的过程是一个成本不断累加的过程,只有持续的利用数据、信息和知识解决企业的问题,才能将信息的成本转化为收益,并放大价值,因此信息搜索本身是一个信息价值体现的必经途径。
在大部分行业中,企业内容每年增加一倍以上,比如数量巨大的电子邮件、会议记录、业务数据、开发文档、管理流程文档和市场宣传材料等。信息数量的飞速膨胀,令快速有效地查找信息成为了难题。企业内部信息搜索的必要性正日益凸显。
1. 信息源日益多元化,查找信息的成本越来越高
信息源日益多元化。企业内部信息重要、敏感,却遍布各处,无论在电子邮件附件、专用内容管理服务器、分布式文件系统还是私人工作区,无论在内联网还是和面向公众的企业外部网站,都可能存储着我们需要的信息。
当每个员工每天不断地在工作中创造着信息时,要想从信息海洋中快速获取所需的信息却越来越难,成本越来越高。如果我们只是想查个别客户的地址和邮编,那么我们登陆单个系统就能查到,难度不大。但如果我们需要经常查询各类文档,那可能就不得不在一天之中不断登陆各个系统分别进行查找才能实现,因此信息获取的成本越来越高。
2. 通用搜索引擎的普及,激发了企业简化搜索的梦想
百度、Google等通用搜索引擎已为网民所熟知,改变了用户查找、使用信息的习惯。我们已经如此习惯于Google等互联网搜索引擎,并且熟悉它们的界面。在企业内部我们往往需要运用好几个搜索工具才能获取所需要的信息,但在互联网上搜索一个Google就足以满足我们的需求。
于是,在企业内部查找信息时,大部分员工都梦想着,能有一个企业内部的Google搜索,只要在一个简洁的搜索框中敲上几个词,就能找到存储在文件、邮件和不通的数据库中的信息。
3. 信息利用的成本/收益证明企业搜索不仅必要而且重要
通常情况下,信息工作者花费大量的时间查找信息,却得不到真正有价值的信息。理论上,简单的成本/收益分析适用于信息搜索。信息搜索的指导原则就是从中获得的收益大于其成本投入。搜索成本的问题,可以被简要归纳为不必花更多时间在搜索上,尽量缩短从输入检索词到找到有效结果的过程。
成本评估相对容易,而收益评估则很困难。人们评价搜索的投入产出比时,会倾向于认为:
“对于重要的信息,那么冗长费时的搜索还算在合理可接受的范围之内;而第一次搜索,如果搜索到的信息价值不大,且搜索不到其他信息,则标志着搜索行为的结束。”
我们从google搜索上就能看到通用搜索面临的问题。大部分的搜索都将产生千百万的相关结果。我们用的搜索术语也可能会有多重涵义,并且只有在我们第一次搜索后才能做更进一步的细化搜索。即便如此,新的搜索也可能导致成千上万的链接,确定哪个才是最相关搜索结果则变成了一个冗长艰苦的任务。可是紧接着依赖于通用搜索获得到的信息,对我们和对企业,我们能再做什么?
4. 内部知识共享建设需要企业搜索
的普及与深入人心,令我们认识到交流、沟通与协作对于生活的重要性。协作、共享、互通不仅令生活丰富多彩,更可令工作轻松高效。近年来,除了内部通讯工具、内部邮箱、内部个人网页等的应用,内部知识共享也越来越引起企业管理者的关注。
如果个人能自由分享企业组织内部的知识,企业作为一个整体将从中获益。对知识型企业来说,知识共享有可能变成企业发展中最重要的环节。
然而,实践证明,建设一个完备的知识管理系统很难。一方面因为人们保护自己的知识和经验的意愿远远超过我们的预想。另一方面,搭建知识管理系统进行知识共享的周期长而效率低。当投资的机会成本和建立氛围与环境的成本比获得的收益高,只有我们通过企业搜索系统,实现知识共享和协作,收益才会超出成本。
企业搜索的发展趋势
不仅仅是信息搜索
企业搜索应该不仅仅是信息搜索,尽管搜索目标就是找到有记录的信息,但除此之外,即便我们带着明确目的进行信息查询,也往往沿途会发现以前不知道并且有用的信息。“启发式搜索(Refine Search)”就是增强这种实际效果的有力途径,其呈现信息的方式即及时又方便。
一般来说, 启发是指在解决问题过程中根据问题的特点,加入一些具有提示作用的信息,加速问题的求解过程。启发式搜索与传统搜索引擎不同,从提交查询表达式到最后用户确认精确的搜索结果的过程中,有一个不断形成新类别导航(Summary Guide)的人机交互环节, 即基于智能分析结果和信息的不同描述维度,检索结果列表自动生成动态的信息导航树,每个导航类别都具有信息提示的作用。用户根据个性需求在选择新检索条件的过程中,其既可以获得内容的全局信息,又可以发现以前未曾知道的信息。
不仅仅是个搜索框和一列结果集
搜索技术,比如谷歌,他们的搜索设计目标是满足大量用户进行简单的搜索,模糊的搜索,用返回的结果最大限度地提高第三方付费广告的效果。
然而,企业搜索的目标市场和设计目标都是不同的:搜索为相对很少的企业内部用户设计,为他们提供有助于决策的重要信息。因为这些决策通常比较关键,搜索的结果需要是百分之百的新鲜,强调搜索的实时性,而不是一些陈旧的信息。新鲜的检索结果对于所有企业都是重要的。
不仅仅局限于一个数据库
为了有效做出决策,搜索广泛信息源,包括所有商业系统、开放信息源、收费信息和国家数据库。
信息更新及时
因为企业决策比较关键,搜索的结果需要是百分之百的新鲜,强调搜索的实时性,而不是一些陈旧的信息。新鲜的检索结果对于所有企业都是重要的。
如果搜索自动运行,当发现新信息时能及时自动把信息发送给相关人员的话,是未来信息服务的理想状态。目前当用户需要时,企业搜索首先要能帮助用户精确找到所需信息,以便应对瞬息万变的市场。
比我们期望的更智能
检索结果结合用户身份信息, 申请人的查询资料可以通过各种数据资源和商业数据系统马上搜索到。根据返回的结果,查询会自动缩小或扩大,而且更符合客户的需要,比如结果排序参考用户同事或者领导等人经常选择的查询结果进行个性化的微调。
企业搜索的商业价值
一套专业的能够适应复杂IT环境的企业搜索系统,将通过信息发现,知识分享,联通信息孤岛,展示企业信息的全貌,从而为各行各业的企业带来多元的商业价值,具体表现为:
企业搜索是决策支持工具
企业搜索的第一驱动力的是决策的需要。合理的决策依赖于全面的信息。
企业搜索是资源配置杠杆
无论什么行业,企业搜索将促进经营决策更有效分配稀缺的资源。
企业搜索是节省成本之道
往常员工们必须通过不同的系统获取信息,造成了时间成本的无谓损耗。专业的企业搜索可以整合不同的系统并一次性查询所有系统的信息,从而有效控制时间成本。
企业搜索可增强竞争优势
在第一时间准确获取信息,在情报获取方面,领先竞争对手一步,竞争优势不言而喻。
企业搜索将扩展企业视野
专业的企业搜索将为企业的信息扩展留有余地。企业可通过轻松共享合作伙伴提供的资源库来扩展企业视野,比如引入外部的知识库以便管理者和员工查找。
企业搜索有助于保护数据
在特定时期内保留数据,既是企业自身的需要,也是外部监管机构的要求。数据在产生、传播和存储的过程中,难免会因为修改等变化产生不同的版本,利用搜索系统去除冗余的数据,简化数据的存储和管理是企业信息管理新趋势。
企业搜索有利于推动协作
大多数企业的信息存储在各个部门的不同系统中,当临时项目突然需要跨部门甚至跨企业协作时,不同系统的信息共享就成为难题。而专业的企业搜索是积极有效的工具,有利于推动协作。
企业搜索的常见误区
技术是双刃剑,一方面带来了进步与便利,另一方面却又潜藏着危机。过分迷信技术的力量,无助于企业正确进行建设。
误区一:无论技术先进与否,有搜索必然强于无搜索
调研机构埃森哲2007年1月公布的调查结果显示,美国、英国的经理们平均每天花两个小时搜索信息,其中半数以上的信息没有价值。然而,是否随便引入一个企业搜索就能改变现状?
许多企业的经验表明,引入一个搜索引擎,如果处理不当,员工们很快就会觉得自己被过载的信息淹没,纷纷质疑搜索结果的有效性。如果是在多个现有系统中分别引入搜索,由于不能很好协调,往往浪费了网络和IT资源。甚至于,在最坏的情况下,它将导致整个企业的信息裂隙,影响产品和服务质量。
此外,不专业的企业搜索会带来信息安全隐患。有些服务器原本是隐蔽的,仅限于部分员工知晓和访问,从而保证文件是安全的。而入门级的简单搜索,会令需要保密的文件暴露无遗,却又不能提供对访问帐户的限制。不专业的企业搜索犹如技术陷阱,将令企业深陷泥沼。
误区二:Google化的通用搜索是企业搜索的参照系
以Google和Baidu为代表的面向消费者的通用搜索和面向知识工作者的企业内部专业搜索有本质的区别,相似的仅仅是搜索框而已。比如,Google搜索可以搜到数百亿的网页,而企业内部的信息资源相对较少。我们同时还应注意到企业内部文献与互联网文档相比是通过截然不同的方式来连接的,另外企业搜索用户比互联网搜索用户更关注企业内部各类文件格式的转换和如何抽取附件内的信息。
一般而言,搜索结果可以分为无用、有用以及模棱两可的。前两者都好处理。如果是搜索结果无用,我们可以尝试新的策略或是放弃搜索。如果搜索结果有用则会对我们有积极作用。而模棱两可的结果最成问题。虽然平庸的搜索系统一直以来特别关注运行费用与可能价值的平衡,但通常的趋势仅是保持运行,不能提供给我们所需的搜索结果。
但由于Google等通用搜索引擎潜移默化的影响力,企业搜索建设中,管理者往往也以Google的搜索模式作为参照系提出需求,不仅搜索界面参照Google的搜索框,查询方式也要与Google的关键词检索保持一致,而且搜索结果也以Google的相关文献列表方式呈现。表面上看来,企业搜索是Google和百度搜索模式的微型应用,然而企业搜索的用户很难对于企业内部的通用搜索模式和结果满意。
企业搜索面对的挑战
企业搜索系统面临的挑战非常复杂,主要表现为:
非结构化信息为主
企业中,信息往往是非结构化的,比如电子邮件、公司发文等,以多种形式、多种渠道,存放于不同地点。另外,企业员工可轻松创建、复制、编辑各类内容,由此引起了组织内部各种不同版本的信息数量激增。这一方面为企业提供了有着巨大潜在价值的知识库和数据库,但同时也给信息搜索带来了巨大的负担。即便以同样的格式、同样的渠道存放在同样的地点,信息往往也是零散存储,不便检索。让用户可以一并搜索结构化和非结构化信息,对防止遗漏信息至关重要。
信息质量至关重要
信息质量的衡量,包括可靠性、相关性、易获取、及时性等因素。尽管企业系统繁多,但系统间很少存在关联,信息孤岛依然普遍存在。
对于企业来说,隐形成本与信息质量有关:由于找不到高质量的市场信息,基于错误信息做出的决策会而令企业失去竞争力。由于常常需要作出关键性的决定,所以企业领导者和员工需要知道他们可以信赖的信息。应用一般搜索技术获得的结果不仅数量过多且质量不高,不足以支持企业内部的业务处理或管理决策。
信息获取要安全规范
企业内部的不同用户,有各自的角色和职责,他们对信息的需求各有不同。与此同时,必须根据不同用户的角色和职务对其获取信息的权限进行控制。访问权限控制是关键任务。这是区分企业搜索要求和个人消费需求的最重要的因素。
不同行业差异明显
企业根据不同的行业类别运作,每个行业都会有自己的信息访问要求、不同信息类型、业务流程和本身相适应的信息存储压力。这些知识对企业搜索极其重要。因为搜索企业内部知识和信息的个性要求,导致通用搜索技术在企业市场很难产品化,需要解决方案需要保持高度的灵活和适应性。
企业内部的需求差异
每个行业的每个企业都是不同的,都有自己的信息访问需求和不同的业务流程。企业搜索系统应随需而设,故企业搜索提供商同样需要擅长流程的研究和分析。
在企业内部,每个人都是不一样的个体,无论你担任什么角色,都应该能够获得需要的信息。今天你需要这样格式的信息,不意味你明天需要的还是这些信息,因此搜索需求不断变化。
如何有效的控制成本
部署企业级搜索系统的技术门槛高,需要有效的成本控制,解决方案提供商要协助客户掌握技术的应用,并通过产品的持续创新和改进帮助客户控制企业搜索引擎在生命周期内的总拥有成本(Total Cost of Ownership)。
VSP搜索系统的主要优势
1.旨在促进任务的决定
往往在危急关头,用户需要及时和准确的信息做出重大决策,VSP搜索系统可以快速准确地从各个系统汇总信息,提供搜索结果的合理排序。
2.功能强大的智能搜索
所有具有高度相关性的结果和最新的信息在检索结果列表的顶端呈现给用户。 用户基于相关性自动排序结果,结合搜索目的确定满足需要的信息。
3.提供实时的搜索结果
信息的几个小时的差异可能会使基于其制定的决策产生巨大效果差别,因此需要实时的提供最新的数据和信息服务,让用户真实的掌握情况。
4.数据本身的安全限制
企业数据是封闭的,往往涉及商业秘密,这意味着只有部分信息呈现给用户时——他们可以看到结果但是部分被移除了。
5.降低了数据存储成本
VSP搜索系统设计不仅加快了搜索也避免了昂贵的数据存储空间。系统积极地通过自动优化索引和降低空间膨胀率,结果可以使企业存储需求是其他系统需求的十分之一,节省成本。
6.用户可自行设计搜索
VSP系统设计者明白各个机构的不同,并且知道机构内部大部分的技术型搜索者和普通用户存在巨大的差异。利用VSP系统,用户可以自行配置和个性化该系统,另外,系统可以收获知识和经验用户的使用技巧,让每一个用户受益于他们的技能和专业知识。
7.记录并跟踪搜索行为
日志记录了详尽的信息,对特殊情况下每个人的搜索行为进行保存,也就是发生了什么样的信息访问,以确保遵守法律政策要求。
VSP搜索系统的功能列表
功能及价值描述
标准版
增强版
个性版
一、先进的智能搜索系统
提供独一无二的启发式检索模式,集合全文检索技术和元数据信息分类技术的优势,方便用户交叉检索信息,提高决策效率和质量;
√
与一般的企业搜索系统不同,除了检索正文,可以对检索对象的多个附件进行查询,支持的附件格式包括Office 2007、、Mht、HTML、TXT等。(检索特殊附件格式,可以定制解决方案。)
√
利用可视化技术,系统可以展示信息的内在关联关系,方便用户把握信息全局;
√
基于专业的知识辞典, 提供同义词(或近义词)的概念检索功能,提高信息的查询质量;
√
提供数据来源配置功能,用户可以根据业务需要选择不同的信息系统数据来源,以提高效率和专注相关信息;
√
二、强大的信息搜索系统
提供丰富的检索排序方式,按业务系统的数据特征(如时间或者作者)等不同的元数据维度排列检索结果,以方便有价值信息的筛选;
√
有效的检索效率,百万数据条目,检索时间平均200毫秒,减少集团内部海量用户的等待时间,提高生产力;
√
%查全率保障机制;
√
99% 查准率保障机制;
√
三、安全的企业搜索系统
提供完整的数据查询和访问权限管理机制,避免企业内部重要信息的泄露;
√
四、易使用的搜索系统
设置个性化信息推荐,定制信息专题;
√
拼音提示,方便用户快速的定位信息;
√
检索词提示和拼音纠错,方便检索用户的日常操作,提高效率;
√
检索词的相关条目提示,
√
相关文章提示,方便用户交叉比对大量信息;
√
显示查询结果摘要,按照企业用户的需要定制摘要显示的颜色,字数,行数;
√
查询关键字高亮提示,根据用户需要,决定是否检索命中的关键词是否在标题或者摘要中高亮;
√
提供高级检索,为用户发现信息提供提示手段;
√
查询结果的系统执行效果提示,包括查询结果条数、查询响应时间等;
√
提供二次检索,在检索结果集中再次检索,有利于用户缩小检索范围;
√
根据用户的需要,基于检索日志,提示热点词;
√
根据用户的需要,基于检索日志,提示热点文章;
√
支持中、英文、数字等混合检索,可以对混排的文本进行检索;
√
支持表达式检索,可以进行多个词的与、或、非检索;
√
五、易管理的搜索系统
搜索系统可以灵活轻松的部署,降低系统运维和开发成本;
√
数据来源对接简便,支持主流关系型数据库和Notes系统;
√
数据来源对接支持桌面级数据源(Excel、Access、Xml);
√
数据来源对接支持开放数据源(Open API);
√
完备的操作日志记录,提供归档日志的管理与维护;
√
提供日志挖掘工具,方便系统管理员了解信息的使用状况;
√
提供词典维护工具,方便用户维护专业词典,提高信息检索的准确性;
√
索引速度快,原数据装载每小时高达容量以上,支持实时增量索引;
√
支持边索引边检索,搜索系统支持信息索引的同时可以进行多线程检索。检索的高性能体现为在G级数据集合上检索速度一般不超过;
√
支持GBK、UTF-8、Unicode检索;支持按段、句、位的特征来构建索引,满足特殊领域检索应用的需求;
√
数据维护、数据检查和数据优化简便,不需要增加系统管理人员的工作负担;
√
支持数据修复,即建立索引过程中,当系统当机或意外掉电等情况发生时,将会产生错误的或不完整的索引数据,此时可对索引数据进行修复;(建索引过程中,数据库没有正常关闭,需要进行修复才可继续建索引。)
√
支持数据紧缩,即当删除了大量数据后,对索引进行压缩可以回收被删除数据的空间并同时进行优化,从而达到回收空间和加快检索速度的目的;
√
支持数据删除,可以索引数据库中删除掉任何文章记录;
√
支持数据灾难保护,即在突发情况下,可以妥善保护已建立部分的索引数据,并可快速地对正建部分受损的索引数据实施修复,从而避免数据灾难。
√
企业参与程度决定了效果
在企业搜索中,二八定律同样适用,20%的精力决定着80%的效益。更尖端的技术应使搜索的过程更加有效,而复杂的成本不应该超过其带来的效益。
为搭建实用的企业搜索系统,提升专业搜索效果,企业应该主动参与系统建设。企业在导入搜索引擎之前,必须先了解搜索引擎并非一个全能的产品。它需要架构在现有的系统上去改善企业内部的分享流程,以减少内部资源的耗损。对企业来说,善用搜索引擎工具,可以明显提高企业内知识的重复使用率。
搜索引擎像是一扇任意门,可以大幅缩减人与目标数据之间的距离,减少时间浪费,而这扇任意门要运作的好,管理者必须给予搜索引擎正确的方向与良好的规划。企业内部的多数数据都尚未结构化,一般来说仅具备时间、客户、日期、负责人员等特征,所以当搜索引擎导入与设定时,需要比较花费心思进行系统分析,这一点Google, Baidu所提供的搜索服务不同,若企业想藉由搜索引擎企业来进行数据分享,那下列事项是管理者需要思考的:
了解企业内部需求
如之前所说,多数企业对搜索引擎的初步想法都很简单,但实际上系统的导入难度通常是与企业的信息化程度及作业复杂度成正比,这部分通常会因行业特性不同而有差异
分析企业内数据管理方式。
企业在导入搜索前,必须先了解公司内部的数据分布特性。了解的数据的分布状况后,才能知道要如何应用搜索引擎把这些被埋没的有价信息找出来,并达到共享与流通的目的。
进行企业内部的信息成长预估。
一般来讲,系统建设后,往往在三至五年内均不会进行系统更换。在此建议管理者在采购搜索引擎前,必须先预估未来三年的数据成长量、硬件承载量及软件扩充性,减少重复采购所造成的浪费。
投入成本评估。
一般来说,投入的金额会与组织大小及数据量成正比。
企业明确自身对专业搜索的建设需求,可以通过实例假设、场景描述等方式,概述专业搜索的具体应用及功能需求。经过需求梳理,管理者通常会开展系统的评估与测试。
对每一个企业来说,因为数据存放特性的差异,故在搜索引擎导入时都会有些许的不同,但系统是否稳定、是否便于管理维护,功能是否完备是任何时候都需要评估的要点。
另外,售后服务质量对于企业搜索系统尤其重要,因为搜索引擎产品是技术门坎高,系统内部复杂的软件,故在系统上线后的维运与调校,会需要比较专业的技术咨询服务。缺乏技术研发实力或者实施厂商不能掌握核心技术,甚至仅仅代理销售海外产品,定制化响应速度不足等问题,都能影响到系统的效果,难以维持服务的质量。
最后为了系统效果最佳,企业还可以持续改善检索效果,比如根据需要,构建属于自己的信息分类及知识辞典。企业将自己的行业背景、专业术语等通过分类或知识辞典的形式结合进搜索中,将有效提升搜索效果。
(欢迎联系VSP市场部咨询顾问获取更多信息)
PAGE
PAGE 14