第30卷情 报 杂 志 第6期 2011年6月 JOURNALOFINTELLIGENCEJune 2011基于RSS技术的图书馆定题服务系统研究———以图书馆个性化电子期刊订阅为例张海营(襄樊学院 襄阳 441053)摘 要 分析了图书馆定题服务的一般模式,总结了网络环境下定题服务的新要求和当前相关服务模式存在的不足。在对RSS技术发展和功能分析的基础上,提出了基于RSS技术理论的定题服务的模型———MJFB。MJFB系统采用MyLibrary的设计理念,灵活运用XMLtag的弹性和OPML档案规格,并通过关键字过滤搜寻等方法,实现在同一网页页面中完成个性化订阅需求及文章内容的浏览。研究表明,构建的MJFB定题服务系统运行稳定,可以满足各学科专家或专业课题研究的信息需求,深受定题服务用户的欢迎。关键词 定题服务 RSS 个性化 数字图书馆中图分类号 文献标识码 A 文章编号 1002-1965(2011)06-0182-04ResearchonLibrarySDIServiceSystemBasedonRSSTechnologyZHANGHaiying(XiangfanUniversity,Xiangyang 441053)Abstract ThispaperanalyzesthegeneralmodeloftheSDIservice,,MJFB,aRSStechnology-basedSDIservicemodel,,flexibleusingofXMLelasticityandOPMLfilesmeta,andsearchingbykeywordfilteringandothermethods, SDI RSS personalization digitallibrary 图书馆的定题服务(SelectiveDisseminationofIn-术的图书馆SDI服务系统的构建思路。formation,SDI)是图书馆针对读者的信息需求而实施的主动服务之一。长久以来,图书馆的定题服务针对1 定题服务的一般模式读者个别兴趣,选择最新信息,以主动积极的方式提供Luhn在1958年曾提出,SDI是一项在机器(计算信息服务,取得了卓越成效。目前,定题服务已经成为机)辅助下,传播新信息的服务,目的是要使组织内的国内外图书馆服务化被动转为主动的典型范例和主要每位成员能获取新的资料,而组织内各项资料的使用选择。《图书情报工作》2007年第11期曾经刊发了中率能达到最高点[2]。Housman和Kaskela在1974年说科院唐勇、袁大发研究员的论文《科研院所情报工作明,SDI系统的目的并不是研究人员在紧急时,去找出的定题跟踪服务》,论文探讨了定题跟踪服务的工作有用的资料,而是持续通知和帮助研究人员在其专业要求与方法,提出了信息内容的集成、服务手段的集成领域上的资料搜集和更新服务,让研究人员借助最便和个性化服务的网络SDI服务的发展趋势[1]。本文基捷的SDI服务获取最全面的专业领域的发展进程[3]。于此研究理论和国外相关学者的研究分析,在对目前定题服务在具体执行过程中,无论是人工手动或电子定题服务的一般模式的研究基础上,提出基于RSS技自动化系统,筛选资料和提供服务的一般模式如图1收稿日期:2011-02-05 修回日期:2011-04-11作者简介:张海营(1978-),男,硕士,馆员,研究方向:网络信息的组织与应用开发、数据库管理、信息检索等。
第6期 张海营:基于RSS技术的图书馆定题服务系统研究·183·所示。DaveWiner在UserLand公司时设计出的一种规格,由于应用了XML,使得撰写网页不用像以往一样编辑HTML档,只要编好item内容,便可转换成HTML的网页。RSS发展至今有多种版本,2003年7月,UserLand软件公司将的所有权移转给哈佛的伯克曼网络与社会中心(BeckmanCenterforInternet&So-cietyatHarvardLawSchool),成立独立的咨询委员会,推广RSS使用,及给予RSS开发人员建议[6]。在该委员会的指导下,RSS技术在网络信息定题服务中得以长足的发展和广泛的应用。图1 定题服务的一般模式[4]RSS可视为一个小型资料库,内含网站标题及内2容和网站本身的描述,起先主要用来发布和聚集网页 网络环境下定题服务的基本要求定题服务的发展受社会和技术条件的限制和影内容(例如新闻标题)。对网页内容供应方而言,可以响利用RSS半主动地将该网站的某些信息、状态等进行,每个历史时期SDI系统都有它各自的特点。目前在网络技术日趋成熟和普及的环境下,图书馆定题服整理后,通过标题列的显示方式提供给读者阅读,免去务和读者在众多文字、图片的网页中寻找标题位置,也不必SDI系统的服务内容和方式也提出了新的要求。网络环境下SDI系统具体服务要求包括再一一通知订阅用户内容有所更新;对网页订阅方而:言,只要订阅RSSfeed,不必开浏览器,就可通过RSSa.明确的挑选。SDI系统中,信息挑选的条件是以能描述读者搜寻信息的要求为基础。若系统中信息Reader自动获取网页更新的内容;如此可省却许多信资源的建立能反映读者以往的搜寻习惯息传递的时间和成本,达到内容联合(ContentSyndica-,系统接受度和满意度将会较高tion)的自动化[7]。在RSS技术支撑下,同样一份文。件,可以经由许多入口(各处的RSSReader)连结取b.简便的通知。使用SDI系统的最后结果,就是要获得和对象信息需求相符的新书摘要和期刊全文内阅,而不必有许多相同的复本散落网络各角落。容所以,在网络信息资源飞速增长和网络个性化服。以往是用纸本打印传递,现今多以电子邮件通知。c.全面的反馈。为了评估系统效能,读者常被询务需求日趋明显的环境下,RSS技术的产生解决了信问对于通知内容的反应,而多以文献的查全率(R息搜索和提供服务的诸多问题,为网络资源的定题服e-务提供了技术支撑。以下将本文研究应用RSS时会call)及精确率(Precision)来衡量。d.兴趣档的更新。若读者长期持续相同的研究,遇到的相关名词简单整理,分述如下:其文献搜寻型态一般会稳定不变。如果因为兴趣改。放置资料内容的档案,资料内容可变,或其他因素,造成搜寻重点突然转变,就必须根据能是一则新闻或网志,档案则是一份Well-Formed的转变调整兴趣档。XML档案,依循不同版本规格而有不同的写法。相对总之,SD的,现在很多RSSReader软件也同时支持不同的RSSI系统管理者应该全面策略性地考虑以上4项要求,其中任何一项特色的改进,都会增加系统feed版本。的使用敏感度。然而,在许多文献报告中,对于。剖析、接收RSSFeed档案的软I系统的重点都放在系统如何设计、硬设备的设定、软件的件,有各种形式,包括单机安装、浏览器内挂、和电子邮包装,而较少注意到这些要求与使用者间的互动。管件方式;支持各作业平台,如Windows、MacOS、及理者、研究人员、和计算机工程师们会注意到SDI系统PDA。使用者只要找到RSSFeed档案的URL网址并的存在,但却很少进一步了解可以如何利用,真正解决订阅,就可定期收到更新内容。信息处理的问题[5]。所以,为提升SDI使用率,必须。RSSAggregator为RSSFeed调整思考方向,对于潜在使用者应先告知这4项要求提供多一层的使用方法,其将RSSfeed收集在同一接及优缺点。而且,系统功能应和计算机硬设备分开,因口,分类、更新并过滤标题,成为订阅、搜寻RSSfeed为使用者只在意所提供的功能,所以这些功能必须符的来源。有些网站甚至提供公开的ServiceAPI呼叫,合使用者喜好及定位。供订阅用户运用,以分析RSSFeed的点选率及连结数[8]。3 RSS技术概况与相关名词OPML(OutlineProcessorMarkupLanguage)。是RSS(ReallySimpleSyndication)最早是1997年由一个XML档案,起源由RadioUserLand公司发展而
·1 84 · 情 报 杂 志 第30卷成,用在Outliner的文字编辑程序中。Outliner是将文服务的新方式。在此提出一个符合个性化需求,电子字资料以阶层式结构集合整理的编辑程序。因为具有期刊中间过滤机制的系统MJFB(MyJournalFilter结构性,OPML文件可以让许多RSSFeed清单有次序Broker),以期实现SDI个性化数字图书馆服务。系统地汇集成单一档案,以供RSSAggregator、RSSReader设计目的是以网页浏览器为读者与网络期刊资源的中软件汇入、汇出互相交换使用,这是应用最普遍的地介者接口。为让使用者能明确定义需求,借助个性化方[9]。服务的概念,设计出挑选、过滤订阅期刊的功能。而关键词对衡量网站的价值和重要性,占有较高的作用;因4 基于RSS技术的SDI系统模型此系统设计以关键词去寻找新发表的相关期刊文章;目前一些图书馆的期刊数据库厂商,开始提供以在最后以RSS作为传递新信息的工具,为了减少不明RSS方式传递SDI服务信息[10],这些信息包括新期刊确、非必要的RSSFeeditem数量,系统提供进一步检的目次和文章摘要。基于RSS技术的SDI系统模型索RSSFeed的功能;并且为了顾及浏览RSSFeed的如图2所示:便利,系统提供浏览排序的选项。早期阅览订阅的RSSFeed,大多需要安装额外的RSSReader软件;现在则有Web接口和电子邮件的方式可以选择。为了增加阅览RSSFeed便利,将所有处理过程结束后的RSSFeed同时显示在系统页面上,每位使用者在登入系统之后,不需额外软件,就可随时看到属于自己的所有订阅内容。就软件设计而言,系统以三层次的概念来实现,如图3所示。图2 以RSS技术订阅电子期刊的模式在图3中,与传统SDI服务模式比较,主要改进内容包括:RSSFeed是符合XML规格的档案,元素内容可视制作者需求而定。目前RSSFeed的制作者以资料库厂商为主。每则RSSFeed所传递的信息多是期刊目次,信息安排较规律;而邮件通知只是告知新到期刊,详细目次还要进一步连结。图3 基于RSS技术的系统软件设计a依据图3系统软件设计的基本流程,以下就系统.以RSS订阅电子期刊不需建立兴趣档,使用者进入系统后,就按需求直接订阅;数据库系统也不储存架构的三层次概念分别说明:订阅纪录。a.外部界面(ExternalInterface)。系统初始,通过b浏览器做个人账号的登入,以实现个性化服务的第一.在使用电子邮件的SDI服务模式中,数据库系统根据读者兴趣档和新资料做比对,把符合的新资料步身份验证,进入系统。另外,使用者通过外部一般以电子邮件传送给读者;在使用RSS的SDI中,只要RSSReader软件,订阅经系统处理过后的RSSFeed及判别有无新资料,不需比对,且判别及传送更新内容的OPML档案。动作可由分散世界各地的RSSReader分摊处理,如此b.系统处理(MJFBSystem)。系统处理是系统运可减轻期刊数据库集中处理的负担,并分散传送资料作的主要部分。在使用者登入之后,依据个人Profile的网络频宽资源。资料,系统做4个部分的处理:进一步增加或删除订c.若要取消或修改订阅内容,在使用电子邮件的阅、订阅后的处理、产生RSSFeed、并且让所订阅的SDI服务模式中,必须修改兴趣档,或依步骤取消订RSS能同时在系统中显示,而无须再通过额外的RSS阅;以RSS的方式则是直接删除RSSFeed订阅。Reader软件和界面,增加系统的整体便利性。c.资料搜寻与储存。数据库储存每位使用者的资5 基于RSS技术的MJFB系统设计料订阅纪录,关键字数据库储存每位使用者所建立的针对SDI服务,以RSS技术为基础,设计出SDI关键字组以及搜寻回来的新期刊文章相关信息。依据
第6期 张海营:基于RSS技术的图书馆定题服务系统研究·185·使用者及所建关键字的Profile资料,储存订阅纪录在解析期刊文章的metadata资料,并将其存入数据库。系统数据库,同时借助Ingenta数据库提供相关信息给SDI服务提供中,期刊文章的metadata资料规则的列系统做进一步处理。对全部资源按照学院分类储存,出来,详细内容提供链接的URL地址,可以点击直接并储存期刊的ISSN及RSSFeed的URL网址,详细期浏览。刊资料则通过URL连结。7 系统功能结构和实际应用效果6 订阅后置处理针对现代图书馆个性化需求与RSS技术本身的在期刊订阅中,使用者登入之后,则需先做身份的特性,根据MJFB系统流程和订阅后置处理程序,设计判断,得知使用者所属学院。接着,从订阅资料库查询出如图6所示的系统功能,使用者在远程通过浏览器已订阅清单,系统分别与该学院及历史查询清单比对,登入、身份验证过后,进入MJFB系统。在提供订阅与若订阅清单中并无纪录,则从历史查询及学院期刊资删除订阅功能之外,系统同时集成RSSReader软件,料库中列出全部期刊;若已有订阅纪录,则列出尚未勾使用者无须再额外安装RSSReader软件就可以实现选订阅过的期刊。订阅资料库仅纪录期刊ISSN(In-订阅和浏览所有过程,增加了使用的便利;在系统输出ternationalStandardSerialNumber)编号,详细的期刊的部分,除了个别期刊、关键词的订阅外,利用RSS本资料,包括RSSFeed网址,则以ISSN值在期刊资料库身的OPML格式,产生每位使用者自己的OPML档,(jurs)中查询[11]。在列出尚未订阅的期刊时,使用者达到个性化的服务效能。便可依此网址单笔在RSSReader中订阅。其中以关键字搜寻最新期刊文章的处理程序如图4所示,各步骤分述如下:图5 基于RSS技术的图书馆定题服务功能模型在电子化系统发展中,便利性和信息过量二者间,存在难以平衡的矛盾。一方面要自动通报新信息,一方面要花时间去处理这些新信息。普遍而言,现今各图个专业人员在通过电子邮件订阅网络专业资料的同4 MYFB关键字订阅处理程序a.关键字建立。在系统界面中,输入关键字内容、时,却收到50%以上的垃圾信息、群发广告邮件或不追踪频率选取关键字和检索条件完整的信息资料,局限了专业人员对新信息新资料的。认知需求、浪费了宝贵的时间。而在MJFB系统中,图b.关键字查询。系统每天自动判断有哪些关键字已到达追踪时间,将已到达追踪时间的关键字搜寻书馆定题服务人员根据其纸质或电子资源的信息资In-料,建立完整、精确、分类详细的RSSFeed内容资料genta数据库期刊内容,同时更新该关键字之最新时间;并纪录此更新时间存进数据库,以此更新时间为计库,借助MJFB实现图书馆定题服务业务的实施。对算下次是否已达追踪时间的依据使用者而言,可依不同需求筛选RSS的订阅资源,加。快搜寻订阅RSS的速度;配合检索条件,能减少RSSc.解析查询结果页面。搜寻完Ingenta数据库之后,接着做网页解析(Parsing)的动作,也就是分析查Feed中item的数量;设定排序条件,增加阅览时的便询结果页面上的内容该如何放入数据库栏位中。由于利;同时,可从MJFB系统获得自己的OPML档,一次本研究采用性将所有RSS订阅清单汇入Reader,节省单笔订阅的Ingenta数据库的搜寻界面,而Ingenta搜寻结果页面上的时间,实现个性化定题服务的目的。export(plaintext)功能中,则以每页50笔纪录的规则详列了搜寻结果的文字,成为网页解所以,本研究提出改良的SDI服务方式,保留了析的依据SDI的服务精神,又避免以往SDI的问题。借助MJFB。在以上处理流程中满足了为用户定题服务提供更少、更精、更专业、更完,在每个搜寻结果的页面中,很有规律的一笔笔纪录了搜寻到的期刊文章,利用程序(下转第193页)
·1 86 · 情 报 杂 志 第30卷췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍(上接第185页)湾),1984(55):14-15整的业内新信息的需求特点,同时可以根据需要订阅[5] ,SDIUseandProductivityintheCor-或检索更全面的专业资料,MJFB本身提供的RSSporateResearchEnvironment[J].SpecLibr,1990,81(4):265-79Reader功能,也让使用者在阅览新信息时更加便利。从系统在华中师范大学图书馆的专家定题服务的初步[6]