信息检索
课程介绍
课程目标:熟悉电子信息环境下信息资源的分布,掌握各类信息检索系统、检索工具及数据库的检索方法与技术,具备较强的信息检索技能,能够针对现实工作和学习研究中的各种信息需求,准确、高效地查找到相关信息;具备较高的信息素质 。
信息检索技能:问题 检索工具、参考资源 所需信息
课程介绍(2)
课程内容:
信息资源的分布、价值
信息检索基础知识
文献检索、 数据检索、事实检索
文献检索工具 参考工具
各类信息资源的分布、特点与利用
各类信息检索系统、信息检索工具的应用
第 1 章 信息资源
信息存贮载体
印刷型 Printed form
缩微型 Microform、 Microfilm microfiche
声像型 (视听型) Audio-Visual form、Compact audio/video form
计算机可读型 (电子型) Machine Readable form、 Electronic Publication,有:
计算机可读型
软盘floppy,
磁带Magnetic tape,
光盘CD-ROM,
联机数据库online database,
网络信息networked information:超文本Hypertext、超媒体Hypermedia、多媒体 multi-media(计算机对数字化视听信息交互存取)、类似文献的知识单元 DLO-document-like-object 等。
文献信息资源(1)
文献:存储有知识的物质载体。
文献信息:以语言、文字、数据、图象、声音、视频等方式记录在特定载体上的信息。
文献的功能:记录知识、传递知识、评价。
文献的级次:
一次文献(primary Literature):基于原始创作;是指作者以本人的研究成果为基本素材而创作的文献。又称原始文献、第一手资料。
二次文献(secondary document):文献工作者对一次文献进行加工、提炼和压缩后得到的书目控制、工具性文献。信息整理加工产物,有书目、文摘、索引等。
三次文献(Tertiary literature):对一次文献和二次文献进行广泛深入的分析、研究、综合、概括而成的产物。包括:述评、综述或文献指南等。
文献信息资源(2)
文献类型:
图书 Books (Monograph, Anthology, Textbook,Reference book):内容系统、成熟、可靠;新颖性稍差。学习、教育之用。
期刊 Periodical(Journal , magazine, serial,):数量大,覆盖面广;内容新颖、及时;交流、影响广泛,信息价值高。
报纸 (Newspapers) :出版周期更短;获取时事性、政策性信息。
文献信息资源(3)
政府出版物 (Government Publications):源自官方、权威、可靠,价廉;可获取政策性、法规性及科技信息。
科技报告(Sci-Tech Report)反映前沿科技、内容新颖、有密级控制。如:美国政府四大科技报告:PB、AD、NASA、DOE报告。
专利文献 (Patent Document,Patent specification/bulletin/aids)类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具。反映新的技术发明,是重要的技术、经济信息源。
文献信息资源(4)
会议文献 (Conference paper,Proceedings, compilation, collected paper, records from varied meetings: workshop, seminar, colloquium, symposium, conference)会前、会中、会后;会议论文集、会议录等;反映最新成果、最新动向、高水平、前沿发展动态。
学位论文 Dissertation, Thesis。内容专深,非卖品。有较高学术参考价值。
标准文献 Standards。反映成熟技术、掌握技术政策、技术水平,可供研制新产品、改造老产品、改进工艺和操作水平时借鉴。
产品资料。形象、直观、新颖,可了解工艺水平、产品发展、市场动态等。
技术档案与图纸。技术性、适用性、保密性。
电子信息资源
即以电子数据的形式,把文字、图形、图象、声音等多种形式的信息存放在光、磁等非印刷介质上,以电信号、光信号的形式传输,并通过相应的计算机和其他外部设备再现出来的一种信息资源。(声象型、机读型)
特点及优势:
高密度存储、
高速度传输、
高效率检索、
大范围共享。
第2章 信息检索基本知识
什么是信息检索
信息检索(Information Storage and Retrieval): 是指将信息按一定的方式组织和存储(Storage)起来,并根据信息用户的需要找出(Retrieval)相关信息的过程。
信息查找(Information Search, Information Seeking )
信息检索的类型
文献检索(Document Retrieval)
数据检索(Data Retrieval)
事实检索(Fact Retrieval)
文本检索
数值检索
多媒体检索(音频、视频检索)
信息检索基本原理
抽象概括为:对信息集合与需求集合的匹配与选择。
具体表述为:用户的信息需求特征与数据库中每条记录被标引出的特征进行比较、匹配。
信息检索的意义、作用
信息检索与科学研究
信息检索与技术开发
信息检索与决策管理
信息检索与教育
信息检索与个人发展
信息资源的发展
(量大、种类多、重复交叉严重、新陈代谢频繁等)
信息检索方式
手工检索方式
机械检索方式(机电检索系统、光电检索系统)
计算机检索方式:
脱机批处理方式(offline,1954-1960s)
联机检索方式(online, 1960s-1970s)
光盘检索方式(CD-ROMs, 1985-)
因特网检索方式( Internet 1990s-)
检索工具
概念 :
用以报道、存储和查找相关信息的工具与设备。(比较:检索系统 与 检索工具)
类型:
文献信息检索工具(bibliographic,书目型),有:目录(Bibliography, Catalog)、索引(Index)、文摘(Abstract)、全文数据库(Fulltext database)等。
参考工具(reference sources,数据与事实信息检索工具),有:百科全书( Encyclopedia )、年鉴(Yearbook, Almanac)、传记资料( Biographical Sources )、地理资料( Geographical Sources )、机构名录( Directory )、统计资料( Statistical Sources )、语文词典(Dictionary)等。
信息检索的方法
信息检索基本流程
1. 明确检索目标和检索信息需求的特征
2. 选择检索系统、检索工具
3.确定检索途径、制定检索策略
4.执行检索
5.获取并整理检索结果
6.分析评价检索结果、调整检索策略进行二次检索。
信息检索基本流程图
检索途径
指信息检索的角度、渠道,又称检索点(Access Point)。一般是利用信息的各种内容和形式等特征,作为检索出发点, 从不同角度来检索信息。有:
内容特征:
- 分类(Classified):所属学科分类,类目号
- 主题(Subject):所属主题内容、关键词
形式特征:
- 著者(Author),团体著者(Corporate Author),责任者
- 名称,题目(Title)
- 代码 (Code),编号等
文本检索的主要技术与方法
布尔逻辑检索(Boolean Logic Search) 最常用。检索时使用不同的布尔逻辑运算符号把检索词连接起来,用布尔提问式表示检索要求,通过对信息集合中的特征化表示(检索标识)与提问式的逻辑比较来检索信息。
逻辑或(OR): 表示它连接的检索词中只要其中任何一个出现就算满足检索条件。例:信息检索 OR 情报检索
逻辑与(AND):表示它连接的检索词必须同时出现才算满足检索条件。 例:信息检索 AND 图象
逻辑非(NOT):表示检索结果中要排除掉它所连接的一个检索词。 例:信息检索 NOT 图象
截词检索(truncation):即使用检索词的局部(词干)进行非准确性检索匹配;使用专门的截词符指定截词的位置与截断字符的数量。分为:
右截词(前方一致检索):例:brows?可检索出含browse, browser, browsing等词的记录。
左截词(后方一致检索):例:?magnetic可检索出含electromagnetic, paramagnetic等词的记录。
中间截词:例:wom ?n 可检索出含 woman和 women的记录。
短语检索(Phrase Search): 通常是使用双引号标出由多个检索词组成的词组或短语,要求检索结果中必须包含该词组或短语。例:“数字图书馆的用户界面”
位置检索(Proximity Search):即对检索词之间的相邻位置关系进行限定的检索,要求检索词在检索结果中出现时,其间的相互距离不应超过若干个字符或汉字的范围。例:solar (w)energy, 北京(2w)大学可以检索出:北京大学,北京师范大学,北京科技大学等信息。
还包括:同句检索,同段落检索等。
限制检索:可限制检索对象的媒体类型(如:网页、图片、mp3等)、语种、时间范围等。
字段检索:限制检索词在记录中出现的字段位置。例:鲁迅(Title), 鲁迅(Author), 鲁迅(Descriptor)。
其他检索:
区分大小写检索
二次检索(精炼检索)
多媒体信息检索的主要技术与方法
多媒体信息类型:
视频信息:有图形、图片、照片、绘画、动画、动态影像等。
音频信息:有声音、音乐等类型。
多媒体信息检索方法
关键字查询:要求每个对象都带有精确描述其内容的标签(或关键字),然后通过该关键字进行快速查询。该方法简单、易实现。而其缺点是:关键字的准确性不够,不足以描述图像及媒体本身的特性,使信息丢失。
多媒体信息检索方法(2)
可视化查询:查询对象都有本身的相似范围,对象间的相似程度依权重而定。- 非确定性查询、模糊查询;查询不仅包括数字字符表达式,还包括非数字字符表达式如图像、图标、样本帧等;查询模型与用户间的接口允许用户发出视图查询,用不完全或相似的图片来实现模糊查询。
多媒体信息检索方法(3)
基于内容的检索( Content-based Retrieval, CBR;或称语义查询):采用索引、模式匹配等技术。以某种知识表达技术将对象本身的性质特征用语义表示出来,性质的识别依赖于多媒体信息处理技术,包括图像处理、模式识别、语音识别、动态检测等;并根据媒体对象的语义特征及其相互关系作为检索的依据。
尚在发展中。
基于内容的检索
特点:
从媒体内容中提取信息线索:直接对图像、视频、音频进行分析,抽取特征,利用这些内容特征建立索引,进行检索。
近似匹配,逐步求精,以获得查询结果。
可对大型数据库快速检索;
多种检索手段:除利用多媒体内容特征检索外,还可通过样本进行相似性检索,或浏览检索。
基于内容的图像检索(Content-based Image Retrieval, CBIR )
主要依据图像的画面内容特征和主题对象特征来标引和检索——依靠计算机自动抽取图像特征和编制特征索引,检索时依据用户输入的图像某一特征(如绘制的草图、轮廓图或调用的相似图像)自动比较特征索引库中对应特征信息,将最佳匹配结果和相关信息输出。
模式识别与人机交互相融合。
基于内容的图像检索(2)
CBIR的检索内容主要有:
颜色(color):图像颜色分布、相互关系、组成等。
纹理(texture):图像的纹理结构、方向、组成及对称关系等。
形状(shape):图像轮廓组成、形状、大小等。
对象(object):图像中子对象的关系、数量、属性、旋转等。
基于内容的图像检索(3)
CBIR的常见检索方式:
选择颜色的比例、层次以及纹理图案的图样进行查询。
用画图工具生成表示物体和物体间空间关系的符号图像进行查询。
从检索界面所陈列的全部图像中选择接近自己意愿的图像进行查找,重复多次直至找到为止。
上述方法与字符型的关键词结合进行查找。
2. 10检索策略
检索策略:指为实现检索目标而制定的检索计划或方案,是对整个检索过程的谋划和指导。
检索策略的优劣直接影响最终的检索结果和检索效益。
常用检索策略:
——积木型策略(Building block,Build-in):是要把检索课题分析成若干个不同的概念面,检索时先分别对各个概念面进行检索,然后再把各个概念面组配起来,得到最终的检索结果。
检索逻辑过程清晰、明确,易于理解和执行,但缺乏人机交互。
常用检索策略(续):
——引文珠形增长策略(Citation pearl-growing):是首先以较为核心的检索词或概念面进行试检,仔细浏览初步的检索结果,并从中选取新的、更多、更合适的检索词补充到检索式中,再进行新的检索。如此反复操作,直到得到理想的检索结果。
具有很强的人机交互性,可丰富检索思路,在“滚雪球”的过程中得到意想不到的检索结果。
——逐次分馏策略(successive fractions):是指检索时先从较宽泛的检索词或概念面入手,得到比较大的、范围较广的初始检索结果集,然后利用各种检索的限制或限定措施,提高检索的专指度,逐步缩小检索范围,直至得到用户满意的检索结果集。
该模式有利于保证检索全面性,漏检较少。
检索效果评价
查全率(Recall Ratio, 简称R)
查全率(R)= 检出相关信息数量/系统中相关信息总量
查准率(Precision Ratio, 简称P)
查准率(P)= 检出相关信息数量/检出信息总量
查全率与查准率之间是互逆相关的,即任何提高查全率的措施会导致查准率下降,反之亦然。
第3章
文献信息检索工具与检索系统
图书信息的检索
书目信息检索工具
书目(bibliography):著录独立出版单元的文献,并按照一定的次序编排而成的一种揭示与报道文献的工具。
类型:
-- 国家书目( 如:《中国国家书目》 、 《 英国国家书目》 (BNB)等 )
-- 营业性目录(书商、出版商目录)
-- 联合目录
-- 馆藏目录
-- 专题文献目录
均在向数字化、网络化方向发展,建设网络检索平台。
主要的图书信息检索工具
各图书馆的网上公共可检索目录OPAC(Online Public Access Catalog),即一个基于网络的书目检索系统,提供本馆书目信息的检索服务。 可通过互联网检索世界各地图书馆的OPAC。 例:
中国国家图书馆OPAC,
美国国会图书馆的OPAC,
清华大学图书馆的OPAC,
世界各国、各地图书馆的OPAC
可在Yahoo!网站分类目录中,按路径ReferenceLibrary的指引找到各图书馆Web网页,进而利用其OPAC,; 或远程登录(Telnet)到各图书馆的服务器后,使用其公共资源中的OPAC。
主要的图书信息检索工具(2)
网上书店,提供在线图书信息检索、图书订购和图书递送等服务。 如:
亚马逊(AMAZON), 为世界上最大的网上书店,其数据库可作为一个庞大的营业性书目,可从多种途径查寻图书。电子商务、信息服务之典范。
当当(),
卓越()等。
各出版社或书商的网站,如:
清华大学出版社,
盖尔出版社,
主要的图书信息检索工具(3)
书目数据库,如:
- OCLC之FirstSearch中的数据库WorldCat
为OCLC开发的数据库,收录OCLC成员图书馆的馆藏,覆盖了370种语言,是全球最大的联合书目系统,且每日更新,并以每年200万条记录的速度增长。
期刊信息的检索
学术期刊:品种多、数量大、涉及面广,拥有最庞大的写作队伍和最广泛的读者群;因此是传递学术信息的最基本、最主要的渠道。
期刊信息检索工具主要有:
期刊目录、指南
期刊索引、文摘
期刊全文数据库
期刊目录、指南(期刊的出版、发行、收藏信息检索)
国际性:
《乌利希国际期刊指南》(Ulrich’s international periodicals directory, a. Bowker)
著名的国际在版期刊指南(以西文期刊为主),按学科主题排列,著录详尽且指明某刊物为哪些文献检索工具所收录,以反映该刊的参考价值。
(Dialog , File 480)
Publist, The Internet Directory of Publications
基于互联网的国际性、连续出版物指南。数据源自Ulrich’s。
期刊目录、指南(2)
国内:
《中文核心期刊要目总览》,北大图书馆、高校图工委编 (2000版, Z87):收编包括社会科学和自然科学等各种学科类别的中文核心期刊。其中对核心期刊的认定通过五项指标综合评估。
《中国当代期刊总览》
《中国期刊大全》
全国期刊联合目录,
主要中文期刊内容检索工具
《全国报刊索引》1951--, m.(综合性)
《人大复印报刊资料》(索引、全文数据库光盘)
中国期刊网 ,,(同方)
《中国学术期刊全文数据库》
《中文科技期刊数据库》(维普)
龙源期刊,
主要英文期刊检索工具
UnCover,
Producer: 美国CARL(Colorado Alliance of Research Libraries)公司, 1988—;该公司已被ingenta公司并购,其期刊索引库仍然是免费使用的,网址为:,
Scope: 世界范围各学科期刊论文,是目前世界上规模最大、内容更新最快的期刊数据库之一,并提供联机检索服务 。到目前为止,该库收录期刊已超过18,000种,拥有期刊论文款目近千万条,并且还在以每天5,000条的速度不断扩充。
Service: 免费检索题录或文摘(Opening search)、最新期刊文献报道(UnCover Reveal)、文章订购(UnCover SOS)、原文速递(UnCover Express)
主要英文期刊检索工具(2)
OCLC FirstSearch之ECO ---- 联机电子学术出版物
ECO是一个全部带有联机全文文章的期刊数据库。它的主题范畴广泛,目前记录来自3,100多种期刊,期刊的数量还正在逐步增加。数据库中的文章都以页映像的格式 (PDF, RealPage, 或 HTML) 显示,在页映像中包括了文章的全部原始内容和图像。
UMI之Academic Research Library(ARL)
该数据库涉及商业管理、社会与人文科学、科学与技术、金融与税务、医药学等广泛领域, 共收录期刊2300多种。可检索文摘和全文(HTML和PDF格式)。
EBSCO学术信息、商业信息数据库
Academic Search Elit(学术期刊数据库)和Business Source Premier(商业资源数据库)是EBSCO公司的网络版数据库。 数据库将二次文献与一次文献‘捆绑’在一起,为最终用户提供文献获取一体化服务,检索结果为文献的目录、文摘、全文(PDF格式)。
主要英文期刊检索工具(3)
ELSEVIER SCIENCE电子期刊全文库
荷兰Elsevier Science出版集团出版的期刊是世界上公认的高质量学术期刊。国内一些大学图书馆设立其镜像服务器,通过校园网提供电子期刊全文数据库-ScienceDirect OnSite(SDOS)-的服务。目前该全文库包括1995年以来Elsevier Science出版集团所属的各出版社(包括Academic Press)出版的期刊1500余种。
Kluwer Online,
荷兰Kluwer Academic Publisher是具有国际性声誉的学术出版商, Kluwer Online是该社出版的800余种期刊的网络版全文数据库,专门提供基于互联网的期刊检索、阅览服务。
电子期刊
电子期刊发展:
- 编制单位众多,发展势头强劲;
- 内容广泛、形式多样;
- 发行与订购方式、价格模式的多样化。
电子期刊(2)
可在网上免费阅读的著名英文期刊:
《自然》(Nature),
《科学》(Science),
《时代》(Time),
《美国新闻与世界报道》(. News & World Report),
开放存取(Open Access)
开放存取期刊(Open Access Journal)是一种网络化的免费期刊。
开放存取期刊目录DOAJ (Directory of Open Access Journal, ): 2003年5月由瑞典的隆德大学图书馆Lund University Libraries开发。最初收了350种期刊,截至2004年底已收录开放存取期刊超过1400种、文章超过6万篇。该目录收录的均为学术性、研究性期刊,具有免费、全文、高质量的特点。其质量源于所收录的期刊实行同行评审,或者有编辑作质量控制,对学术研究有很高的参考价值。
开放存取(2)
BioMed Central() 包含了一百多种生物学和医学期刊。
Public Library of Science() 包括非盈利科学期刊和医学期刊。
PubMed Central() 包括生命科学方面的期刊。
SPARC(Scholarly Publishing and Academic Resources)
中国预印本服务系统,
中国科技论文在线,
网络版报纸
报纸:出版周期最短,可及时获取新闻、时事、政策性消息、行业发展动态等。
网络版报纸,(可免费浏览当日内容,或回溯往日内容)
如: 北京青年报,
京报网,
国际组织与政府机构信息及出版物的检索
概述
名称:government publications、public documents、government information. 指源于政府及组织机构的工作过程,反映官方的意志和观点,由政府出资或根据法律出版的文献。
特点:
- 权威性、准确性和经济性(价廉);
- 包含大量原始的资料或数据;
- 数量庞大、来源分散、类型众多(书、刊、连续出版物、技术报告、音像等),且在版期短。
重要类型:法律法规、政策性文件,统计资料、科技文献,行政性文件。
概述(2)
政府机构网站
即通过互联网向公众发布政府信息及官方文件,向公众宣传该机构的宗旨、目标、使公众了解其职能、机构设置、联系方式,甚至在网上行使某些政府行政职能等。
电子政府、电子政务
国际组织信息检索
联合国机构及文献信息的网上检索与获取
- 联合国及其专门机构站点目录 Web Site Locator for the UN System of Organizations, 通过该目录,可按各机构名称的字母顺序,或机构的专业分类查找到UN各专门机构网站的地址并链接到该机构网站。
我国政府信息的检索
中华人民共和国中央政府门户网
其导航系统可供浏览、检索政府机构网站索引或按地域查询政府网站。
各中文搜索引擎或其他网络资源导航系统等的相关类目也为网络用户查找政府机构信息提供指南或链接服务。
中国互联网信息中心的资源调查报告中说明:
政府机构网站占%; 政府网站所提供的主要服务有:职能/业务介绍,政府公告/法律法规,以及政府新闻,行业/地区信息,办事指南等。
美国政府信息及出版物检索
GPO Access,
GPO(Government Printing Office)统管美国政府出版物发行的机构,同时负责编辑、出版目录,提供检索、咨询等服务。GPO Access是该机构近年来推出的一项网上服务,通过该网站可使网络用户免费检索联邦政府各机构生产出的大量具有一定参考价值的官方出版物和其它信息产品。如:可免费检索《美国政府出版物目录》(Catalog of government publications - CGP )和一系列数据库。
FirstGov, 美国政府信息门户网站
科技报告的检索
科技报告概述
特点:反映前沿科技和正在进行中的研究项目,类型多样、来源分散,内容专深、具体,在尖端技术领域有一定的密级控制,较难得。
类型:阶段报告、成果报告
著名的美国政府四大科技报告:PB、AD、NASA、DOE报告。
美国科技报告检索
NTIS,美国商务部国家技术情报服务局,是收集、管理和销售美国政府及其机构生产的科学、技术、工程以及相关的商业信息资料的核心机构。其传统检索工具《美国政府报告通报与索引》(Government Report Announcements and Index-GRA&I)专用于四大报告的检索,近年推出网站, , 该网站提供按学科分类(农业、商业、能源、卫生、军事等)的综合导航服务。同时,对其核心收藏-科技报告提供免费检索,同时提供联机订购服务。
我国科技成果检索
国家自然科学基金委员会,
全国哲学社会科学规划办公室, 有成果选介、重要成果推荐等。
万方之《中国科学技术成果数据库》(CSTAD)
部分网站有科技成果汇编,如:中国科技网,
中国高校科技成果转化网,
会议信息及会议文献的检索
会议文献概述
会议:重要的信息交流渠道,可获得本学科领域、行业范畴内的最新学术研究、产品开发成果信息,了解新政策、新发展、新动态等信息。
会议类型,有:国际性会议、地区性会议、全国性会议、学会、协会等专业性会议。
会议文献的类型:会前、会中、会后出版物(会议录,Proceedings, 会刊 Transaction,会议论文 Conference Papers 等)
会议消息的检索工具
会历(Calendar):是一种记 录或预报各种学术会议的出版物;可使人们掌握学术会议的动态、了解某一会议将在何时、何地、由何机构主持召开及参会的报名、提交论文等事项。如:
《World Meetings》, q. Macmillan .预报2年内要召开的学术会议,分8个时间段,按季度报道。主款目(Main entry)部分著录会议名称、会址、主办机构、会议议题、一般情况、论文征集途径等。索引有:主题索引、会议日期索引、报名或稿件截止日期索引、地点索引、主办单位索引,可从多角度检索。
会议消息的检索工具(2)
会议消息的网上检索:
从Yahoo!的分类目录中选择你感兴趣的学科主题,然后在检索框中输入“conferences” ,并在该类目中检索。
Forthcoming Conferences in ……, 一些专业性的会议消息预报,会议站点的目录、指南和导引网页;有些还可直接链接相关会议的站点。
专业机构网站:各专业范围内一些世界性、地区性学术团体、学术组织、学会、协会等机构的网站提供近期该机构主办的或本领域一些大型学术会议的消息,或对有关会议主页的链接。
有些大型会议还专门开设网站,随会议筹备、举行等进程报道相关内容,甚至会有主旨发言的摘要、演讲材料等。
会议消息的检索工具(3)
中国学术会议在线网站,
由教育部科技发展中心主办。为用户提供学术会议信息预报、会议分类搜索、会议在线报名、会议论文征集、会议资料发布、会议视频点播、会议同步直播等服务。
会议文献的检索
ISI之《Index to Scientific & Technical Proceedings》 (ISTP,科学技术会议录索引, 1998-- )与《Index to Social Science & Humanities Proceedings》(ISSHP,社会科学及人文科学会议录索引,1998--)在Web of Science 的检索平台上,ISTP和ISSHP集成为Web of Science Proceedings,简称为WOSP。它汇集了世界上最新出版的会议录资料,包括专著、丛书、预印本以及来源于期刊的会议论文,提供了综合全面、多学科的会议论文资料。
会议文献的检索(2)
OCLC之FirstSearch检索系统中的相关数据库:
PapersFirst:收录世界范围内各类学术会议上发表的学术论文的索引信息;
ProceedingsFirst:收录在世界各地举行的各类学术会议的会议录的目次表。
万方数据资源系统的《中国学术会议论文库》(CACP)
学位论文的检索
学位论文概述
高等院校或学术研究机构的学生为获得某种学位而撰写的科学论文,有学士论文、硕士论文、博士论文等。硕士以上学位论文内容专深,有一定参考价值。但其来源分散,大多不正式出版,是非卖品。
学位论文检索工具
我国:
万方之《中国学位论文书目库》(CDDB)
CALIS学位论文库,
(见)该库收录包括北京大学、清华大学等全国著名大学在内的83个CALIS成员馆的硕士、博士学位论文,收录加工数据70,000条。内容涵盖自然科学、社会科学、医学等各个学科领域。已上网提供试检索服务,用户可从题名、论文作者、导师、作者专业、作者单位、摘要、分类号、主题和全字段等不同角度进行检索。该数据库采用IP控制使用权限,参建单位的用户都可以通过CERNET访问。
学位论文检索工具(2)
国际:
检索网站:
ProQuest Digital Dissertation(PQDD), 提供世界范围内学位论文检索服务。普通用户可以免费检索部分学位论文的索引和文摘;而机构订户则可以访问全部数据库,获得全文。
专利信息的检索
专利文献概述
专利:是从法律上保护知识创造发明的一种专有的权利。
专利三性:新颖性、创造性、实用性。
专利类型:发明、实用新型、外观设计、(植物专利、防卫性公告)
形成过程:申请 审查 公告批准, 获得在法律规定的有效期限内的独占权。
专利文献概述(2)
专利文献:一切与专利制度有关的各种专利文件统称为专利文献。技术性、法权性。
类型:专利说明书、专利公报、专利检索工具等。
特点:数量多、范围广,内容新颖;
每件的内容具体、实用,有一定格式;
各国自成一体的出版物体系;
多语种,内容有大量重复
专利信息检索
检索源类型:
专利分类法(IPC - 国际专利分类法,各国专利分类法)及其关键词索引
专利公报
专利文摘、索引等数据库(英国德温特的WPI专利检索出版物、数据库系列,各国专利检索工具)
专利信息检索网站
专业期刊及专业检索工具
产品、设备
检索类型:
技术信息检索(开发研究借鉴)
法律信息检索(权属、权项、有效期等)
专利信息检索(2)
检索途径:
- 专利权人(个人、机构)
- 专利分类(IPC分类、各国专利分类)
- 专利主题(关键词)
- 相关号码(专利号、申请号(优先项)、入藏登记号等)
专利信息检索(3)
德温特专利检索工具
—— 概况:Derwent Publication ltd.,英国一家专门从事专利检索出版物和数据库的生产的私营公司。1951--
—— 报道世界上29个国家和2个国际组织的专利文献及2种技术杂志(英RD,美TD)上发表的技术发明。
—— 索引系列(WPI, WPI Gazette, w. ):1975- ,有: P(综合)、Q(机械)、S-X (电气)、CH(化工)四分册
—— 文摘系列(WPAJ):1975- ,有分国专利文摘和专业性文摘:
GMPI(General &Mechanical Patents Index)4分册,一般和机械领域; CPI(Central Patents Index)12分册,化工领域;EPI(Electrical Patents Index)6分册,电气领域。
专利信息检索(4)
国外相关检索网站:
--中国知识产权局,
-- 中国专利信息网,
-- WIPO知识产权组织
-- 欧洲专利局专利数据库
-- 美国专利商标局
标准信息的检索
概述
标准化:为在一定范围内获得最佳秩序,对实际的或潜在的问题制定共同的和重复使用的规则的活动。(——ISO定义)。包括制定、发布及实施标准的过程。其意义是改进产品、过程和服务的适用性,防止贸易壁垒、促进技术合作。
技术标准:是在各方通力合作下,对经济生产管理中需要协调统一的技术事项所制定的标准。
概述(2)
标准类型:
按对象分:技术标准、管理标准、工作标准
按内容分:基础标准、产品标准、方法标准、安全卫生标准;
按使用范围分:国际标准、外国标准、国际区域性标准; 国家标准、行业标准(部颁标准)、地方标准、企业标准--分5 级;
按成熟程度分:正式标准、试行标准、推荐标准、指导性技术文件、标准化规定等。
概述(3)
标准文献:以文件或规定基本单位的形式记录标准化的工作成果,并经权威管理部门批准后形成的一系列标准文件。
标准文献的特点:
制定、审批有一定程序,
适用范围明确专一
格式严谨、统一
技术可靠、现实
法规性
有时效性
技术新颖性逊于专利文献
标准信息检索
标准分类法
中国标准文献分类法
国际标准分类法(International Classification for Standards-ICS)、
标准号: 标准代号+序号+年份 如: GB 16483-1996, ISO9000
检索途径: 分类、标准号、主题
标准信息检索(2)
标准信息检索工具:
印刷型:标准目录
《国家标准目录及信息总汇》
《中华人民共和国部标准和专业标准目录》
《ISO Catalog》、
《Catalog of American National Standards》
标准信息检索(3)
检索网站:
国家标准化管理委员会
该会为统一管理全国标准化工作的主管机构,其网站提供了丰富的标准化知识和工作信息,并提供对标准目录(国家、国际、行业、地方标准等)的检索。
中国标准服务网
中国标准化研究院标准馆主办,2001年4月起推出开放式标准服务(需注册),可免费查询标准信息。
中国工程技术标准信息网
提供国内外、国际标准信息的检索。
标准信息检索(4)- 检索网站
国际标准化组织(ISO Online, )
- 检索国际标准
- 检索点: 国际标准分类法(ICS)、 标准名称关键词、文献号、委员会(TC)代码等。
National Standards System Network--NSSN,
提供广泛、综合的标准信息服务,可检索国际标准、美国国家标准(ANSI)、美国国防部的军事标准和经ANSI认证的其他团体或企业的标准。
IEEE Standards,
IEC 标准等
著名综合性文献信息检索工具
《化学文摘》CA,(美国,CAS)
《生物学文摘》BA, BIOSIS (美国,BIOSIS)
《科学文摘》 SA、 INSPEC(英国,INSPEC)
《工程索引》 EI、 COMPENDEX(美国,EI)
《科学引文索引》 SCI系列 、SSCI、A&HCI等 Web of ScienceWeb of Knowledge(美国,ISI)
美国化学文摘社(CAS)之《化学文摘》(CA)
概况: 1907--,周刊,
收录范围:世界范围内的化学、化工文献。
编排与著录:分类编排。
辅助索引:索引较完备,提供多种检索途径。(期索引:关键词索引、专利索引、著者索引;卷索引: 普通主题索引、化学物质索引等共7种。)
检索途径:分类、主题(关键)词、化学物质名称、分子式、专利号、著者姓名等。
CA数据库检索途径:关键词检索(Word Search),索引浏览式检索(Index Browse),化合物等级名称检索(Substance Hierarchy)、分子式检索(Formula Search)等。
美国生物科学信息服务社(BIOSIS)之《生物学文摘》(BA)
概况: 1926--, 半月刊,数据库名BIOSIS Previews。
收录:世界范围内生物科学研究及相关领域的文献。
编排与著录:分类编排
辅助索引:著者索引(Author Index)、生物系统索引(Biosystematic Index)、生物种属索引(Generic Index)、主题索引(Subject Index) 。
检索途径:著者、学科分类、主题关键词、生物体的分类、生物体名称等。
美国工程信息公司之《工程索引》(The Engineering Index, Ei)
概况:1884--,月刊, 数据库名COMPENDEX
收录:世界范围内的工程技术文献。
编排与著录:按主题编排。
辅助索引有:主题索引、著者索引、著者所在机构索引。
检索途径:主题关键词、著者、机构等。
检索网站:
英国国际物理与工程信息服务部(INSPEC)之《科学文摘》(Science Abstracts, SA)
概况: 1898--,A、B、C三辑 , 分别为:《物理文摘》(PA)、《电气与电子学文摘》(EEA)、《计算机与控制文摘》(CCA)
收录:世界范围内的物理、电子、电气、计算机与控制领域的研究文献。
编排与著录:分类编排,按INSPEC分类表编排。
辅助索引:主题索引、著者索引、专用索引等。
检索途径:主题词、学科分类、著者、其他(书名、会议名、组织机构名等)。
美国科学信息服务社ISI之《科学引文索引》 SCI系列及其网络平台Web of Knowledge
出版者:ISI( Institute for Scientific Information),1963--
引文索引系列:印刷版、光盘版,联机数据库版,网络版
科学引文索引(Science Citation Index, SCI)
社会科学引文索引(Social Science Citation Index, SSCI)
艺术与人文科学引文索引(Arts & Humanities Citation Index, A&HCI)
基于互联网的集成检索平台Web of Science(1997) Web of Knowledge
特点:收录各学科核心期刊,可从文献间引用、被引用关系检索、相关文献,并可评估文献的学术价值。有文献检索、文献计量、科学管理、评估等多重功效。
检索途径:著者、篇名、著者所在单位、学科主题等。
第 4 章
各类型参考工具的检索
4 .1 参考工具概论(1)
概念:reference books, reference sources
一切能用以查检特定资料的参考源。
特点:内容广泛、叙述扼要、简明、精确、概括性强,并按特定方法编排。
功能:查检特定知识、数据、资料。
排序方法有:字序 alphabetical (音序、形序)、分类classification、主题subject、关键词keywords、年代chronological、地区regional、表格式tabular等。
参考工具概论(2)
类型:
百科全书 Encyclopedia
年鉴 Almanac, Yearbook
手册 Handbook
指南 Directories
传记资料 Biographical Sources
地理资料 Geographical Sources
字典 Dictionary
统计资料 Statistical Sources
4 .1 参考工具概论(3)
结构:
前言
凡例
目录
正文
辅助索引
附录
百科知识检索
百科全书概述
定义: 百科全书是汇集和概述人类一切知识门类的知识或某一门类知识的系统而完备的工具书。 “工具书之王”
特点:广泛性、汇编性、概括性、查检性
类型有:
- 综合性与专科性百科全书;
- 国际性与、国家、区域性百科全书;
- 成人与少年儿童百科全书;
- 印刷型与多媒体百科全书等。
著名的百科全书
《新不列颠百科全书》(The New Encyclopedia Britannica, EB) 1768年创编,英语世界著名百科全书之一。
结构:
-百科前编(Propaedia,Outline of knowledge and guide to the Britannica): 知识分类纲要
-百科简编(Micropaedia, Ready reference and index): 小型百科,快速查检
-百科详编(Macropaedia, Knowledge in depth): 大型百科,系统全面地介绍知识
- 索引(Index): 检索简编、详编条目中的内容。
EB网站:,
著名的百科全书(2)
《美国百科全书》(Encyclopedia American,EA) 1829 -
特色:美国资料丰富、科技内容较多,文字简明易懂,原始文件较多。
结构:29卷按字顺排列之条目正文 + 1 卷索引
相关网站:
著名的百科全书(3)
《中国大百科全书》1978-1993,
共80卷,分24个学科分卷。 结构:前言、凡例、分类目录、条目正文、索引、附表。
光盘版。
网络版, ,涵盖66个学科,8万个条目,亿汉字,5万余幅插图。
利用普通搜索引擎(Google 、Baidu)查找百科信息
Wikipedia维基百科,
自由百科、开放式百科。其特点是任何人都可以编辑该百科信息库,为其添加条目。这种开放式的编辑方式使得该百科中条目质量差距较大,但它可以算是信息量最丰富,门类最齐全的百科知识检索平台。
百度百科,
人物信息检索
传记资料概述
传记资料:用以查找历史人物或当代著名人物的生平资料等相关信息(生卒年、学历、职务、经历、家庭、政治背景、学术观点、团体、著述、评价等)的工具书。
类型:传记辞典(Biographical Dictionary)、名人录(who is who)、人物年谱等。 - 或按收录范围:国际性与国家地区性,综合性与专业、职业性,传记索引,已故名人(回溯性)与在世名人。
重要的传记工具书
综合性、国际性传记工具书
《韦氏传记辞典》(Webster’s Biographical Dictionary)
Merriam-Webster, 1943- 收录国际范围各领域已故名人。旧版的附表很有用。
《钱伯斯传记词典》(Chambers’ biographical dictionary)
《国际名人录》(The International Who’s Who)Europa, 1936- 查在世名人最常用的国际性名人录,信息广泛、密集,履历体。
重要的传记工具书(2)
国家、地区性传记工具书
-《英国国家传记词典》(Dictionary of national biography , DNB)1886- 1901 63v. 西方国家传记词典典范。散文体撰写的英国历史名人(20世纪以前的)大词典,有很高学术水平。《Who’s Who》英国名人录
-《美国传记大词典》(Dictionary of American biography, DAB)美国各界历史名人,资料详细,索引多样。 《Who’s Who in America》Marquis,1899- Biennial 享有一定声誉的美国当代名人录。
- 《中国人名大词典》、《中华人民共和国人物辞典》等。
重要的传记工具书(3)
专业与职业性传记工具书
范围广,种类繁多,多为履历体。如:
-《American men and women of science》 Bowker, 1986- 8v.
收录美加在世科学家。按专业分卷,条目简要。
- 《Dictionary of scientific biography》DSB, 收录90多个国家各个时期的已故著名科学家,为研究学科史提供参考。
- 《中国专家大辞典》
人物信息检索网站
Biography Dictionary
收28000多位国际性名人,检索点有:生、卒年,职位、专业、文学艺术著作、成就和其他关键词。
Biography
Biography-center, 可检索的多语种传记指南,提供对传记性站点的链接,相当于传记索引。
人物信息检索网站(2)
部分网站提供的网上找人检索服务,白页服务(White page):
Four 11 -- People Search(Yahoo)
555-1212,
Anywho: Find Telephone Number and Address,
Whowhere,
Switchboard,
Bigfoot,
地理信息检索
地理资料概述
地理信息:地名、国家疆土、部族、区划、自然资源分布、城市变迁、名胜古迹等。
地理资料(Geographical Sources): 用于查考地理信息和研究地理的工具。
地理资料的类型:
- 地名工具书
- 地图集、地图
- 旅游指南
地名工具书
地名,对地物的指称。 数量大且日益增多(地名可分割性)、不断更新和嬗变,同名异地、同地异名、简称、别称、俗称、合称等现象导致地名的数量难以统计。
地名的构成:由专名和通名两部分组成。例:纽约市 New York City, 日内瓦湖Geneva Lake
地名工具书:用以查找古今中外的地名及所代表的地物的地理、历史、人文等简况。
地名工具书主要类型:地名词典、地名录、译名手册、地名学工具书等。
检索方法:一般按地名字顺查找。
地名工具书 (2)
地名词典 Gazetteer, geographical dictionary, 即地名的字顺表,并对古今地名的读音、位置(方位、经纬度)、地理特征及人口、经济、历史等加以描述,用以查考和研究地名 。
地名词典的种类:
- 历史地名词典 与 现代地名词典
- 综合性地名词典 与 区域性地名词典
地名工具书 (3)
几种常用的地名词典
中国:《中国古今地名大辞典》、《中国历史地名辞典》、《中国行政区划大辞典》等。
《韦氏地名辞典》(Webster’s Geographical Dictionary)Merriam-Webster
《钱伯斯世界地名词典》(Chambers’ world gazetteer and geographical dictionary)
《The Columbia Lippincott gazetteer of the world》
地名工具书 (4)
地名录(glossary):是经审定后规范化的地名工具书。如: 《中华人民共和国地名录》、《美国地名局地名录》(. Board on Geographic Names. Gazetteer)。
地名索引:标注地名所属国家名称、行政区划、经纬度和在某地图集中的位置。如:《“The Times” index-gazetteer of the world》
地名译名手册
地名转译原则:名从主人,约定俗成;专名以音译为主,通名以意译为主。
例:《世界地名翻译手册》、《美国地名译名手册》等。
地图集
地图集(Atlas):将多幅地图汇编成册的工具书。(内容互相关联、统一规格形式、并有说明文字和附录索引)
种类:世界地图集、国家、区域地图集、专题地图集(经济、军事、商务、自然资源等)。
构成:图例、注记(符号、色彩、比例尺)、文字说明、地图索引、附表(地理通名表)。
有:-《泰晤士世界地图集》(The Times atlas of the world)
-《泰晤士世界历史地图集》(The Times atlas of world histiory) 中文版
- 中国:《世界地图集》、《中国历史地图集》等
相关检索网站
数量多,且各具特色。如:
Geographic Names Information System
Official City Sites,
USA CityLink
相关检索网站(2)
ZIP Code Lookup and Address Information,
How Far Is It ?
Time Around the World,
Atlapedia Online,
Mapquest,
相关检索网站(3)
国家基础地理信息系统 (NFGIS) ,
是中国最大的全国地理信息存储、数据管理、地图生产和数据应用系统之一。是国家测绘局(SBSM)的专业信息系统。
图行天下,
数字地球网站,
时事性信息检索
年鉴概述
定义: 系统汇集一年内事物新情况和统计资料,按年度连续出版的工具书。
类型:综合性、专业性、地区性年鉴。
功能、用途:提供新资料(人物、事件、统计数字等);连续出版,还可提供回溯性检索;可起索引作用。
重要的年鉴
我国:《中国年鉴》、《中国教育年鉴》、《湖北统计年鉴》等。
国外:
《世界年鉴》(The world almanac and book of facts)1868- 百年历史,普及范围最广,发行量最大之年鉴。内容庞杂,检索主要利用其索引。
《咨询年鉴》(Information please almanac)1947- 内容、体例均与前者类似。
《欧罗巴年鉴》(The Europa yearbook),内容侧重政治和历史,对世界各国概况做简明、可靠介绍的统计性工具书。分“国际组织”和“世界各国”两部分。
《McGraw-Hill yearbook of science and technology》:重要的科技年鉴。
相关检索网站
Infoplease, 《咨询年鉴》的网络版,还同时提供Webster College Dictionary 和Columbia Encyclopedia.
The Old Farmer’s Almanac, 提供天文、天气、气象、烹饪菜谱和园艺技巧等信息查询。
Fact Monster,
机构信息检索
相关检索源概述
机构名录(directory),又称:名录、便览、指南、行名录等。是用以查找机构团体相关信息的检索工具。
功能:用以查询公司、企业的名称、地址、通信;机构的负责人、宗旨、资本额、经营业务范围、服务项目、信用指标;主要产品的品种、型号、规格、技术指标、价格等。
种类:国际性、区域性、专业性等。
其它参考源:年鉴、百科全书、统计资料、政府出版物、产品资料等。
国内外重要的机构名录
中国: 《中国企业、公司及产品数据库》(CECDB)1997- 万方数据资源系统 中国企业信息、产品信息主要数据库。
《中国百万商务通讯数据库》(CBML)、《中国科研机构数据库》(CSI)
国内外重要的机构名录(2)
政府机构名录
《国际组织年鉴》(Yearbook of international organization)1948- 英、法文出版,收录国际组织、非政府组织、学协会、社团、跨国公司等。分母本、参加国索引、主题和地区索引三部分。还派生了许多地区性国际组织指南类出版物。
《美国政府手册》(. Government manual)、《美国国会便览》(Official congressional directory for the use of the . Congress)
国内外重要的机构名录(3)
学术性机构名录
《学术世界》(World of learning)1947- a. Europa 分国际组织和世界各国两部分。介绍有关学术团体、研究机构、图书馆、博物馆及各类高等院校的地址、创建日期、负责人、历史、现状等。
其它有:《Research centers directory》、《The international foundation directory》、《World guide to scientific associations and learned societies》、《The world list of universities》、《Peterson’s annual guides to graduate study》等。
国内外重要的机构名录(4)
商业机构名录和有关商情数据库
邓白氏商业机构名录系列(Dun & Bradstreet Ltd., DB),如:《Principal International Business》、《Dun’s Europe》《Duns Asia/Pacific Key Business Enterprises》《Who Owns Whom》、《Million Dollar Directory 》等和D&B联机数据库。
《Standard & Poor’s Corporation Records 》(标准与波尔氏公司记录)及对应联机数据库。
《Thomas Register of American Manufacturers》(托马斯美国制造商名录)及对应联机数据库。
Moody’s (摩迪氏)投资指南系列(提供一系列金融、制造、公共机构等的背景信息)。
相关检索网站
各检索网站的黄页服务(yellow page)
专门网站,如:
Switchboard,
555-1212,
(Big Book, )
WorldPages,
Infospace: The Ultimate Directory,
全球黄页,
中华大黄页,
星空黄页,
黄页大全,
统计性信息检索
统计资料概述
统计资料是对各种统计工作产生的大量原始统计资料搜集、整理、汇编而成的,用以查找相关统计数据的参考工具。是最基本的经济和管理信息源。
主要形式:统计月报、统计年鉴、统计索引、统计摘要等。
其他统计资料源:年鉴、百科全书、专业地图集、机构名录指南、专著和论文集等。
概述(2)
类型:
国际性、区域性、国家性;
综合性、专业性、专题性;
现实性、历史性。
查找方法:按领域、按时间、或按国家、地区、行业等查找。要了解一些统计分类标准,如:我国的《国民经济行业分类与代码(GB/ T 4754-94)》、联合国的《国际标准产业分类》(ISIC)、美国的《标准工业分类法》(SIC)等。
概述(3)
统计资料的评价、选择:统计资料数量庞大、形式多样且鱼龙混杂、质量不一。
权威性(Authority):应重视利用国际组织、官方统计机构、专业学术团体出版的统计资料;
准确性(Accuracy)
可比性(Comparability):统计指标(indicator)、单位、分类标准,基期(base period)等是否统一或有可比性;
稳定性(Stability):出版及统计指标、单位、标准的连续、稳定。
重要的统计资料
统计索引:其本身并不提供统计资料,而将散见于各类书报期刊和政府出版物中的资料汇集起来,编成索引。
综合性报刊索引,如:RG, PAIS - Public Affairs Information Service等。
美国国会信息服务公司(Congressional Information Service - CIS)的统计索引系列:
- 《American statistics index》ASI,1973-收美政府机构出版的统计资料;
-《Statisstical reference index》SRI,1980-收美非政府机构出版的统计资料;
- 《Index to international statistics》IIS,1983-收国际组织机构出版的统计资料。
重要的统计资料(2)
国际性、综合性统计资料:多为国际组织收集、有统一的标准,权威、可靠、质量较高。可用于了解全球或地区概貌,易于不同国家间统计数字的对比、换算,还可弥补某些国家统计数据的不足。
《联合国统计年鉴》(Statistical yearbook)1948- 是当前编制水平最高的综合性国际统计资料,广为使用。内容包括280多个国家和地区的人口、工农业、制造业、财政、贸易、社会、文教等各方面的情况。提供的统计数字一般回溯几年甚至十几年。按领域分类,每类下有若干统计表格,多数表格内按洲、地区、国家排列。
《OECD main economic indicators》1965- m. OECD
重要的统计资料(3)
地区性统计年鉴, 如:
《Statistical yearbook for Asia and the Pacific》1968-
《Statistical yearbook for Latin America》1973-
重要的统计资料(4)
各国统计资料:
中国:《中国统计年鉴》、全国性统计公报、地区性统计公报(见中国统计信息网,
美国:《美国统计摘要》(Statistical abstract of the .)1878- 美国官方综合性统计资料汇编,内容涉及美经济、社会各领域,十分庞杂。分类编排各类图表,并给出资料来源。印刷版、网络版见:
重要的统计资料(5)
历史统计资料:辑录回溯性历史统计数据,为研究经济、社会、文化发展史提供重要资料。
《International historical statistics: Africa and Asia》Macmillan, 还有欧洲、美洲、大洋州等分卷。
《Historical statistics of the .: colonial times to 1970.》
《中国近代经济史统计资料选辑》等
重要的统计资料(6)
专题统计资料:种类很多,统计数据更深入、详细。较重要的有联合国各专门组织机构出版的,如:
《Demographic yearbook》1948-, UN
《FAO production yearbook》1958-, FAO
《International trade statistics yearbook》1950-, UN
《Yearbook of labour statistics》1935-, ILO
《Statistical yearbook》1963- , Unesco
相关检索网站
中国统计信息网 , 国家统计局主办,提供各类全国性、地区性、行业性统计公报。
POPIN - UN Population Information Network, 提供世界人口发展趋势,地区性人口信息。
Your Nation, 可获得某一国的概要介绍;可进行任何两个国家间多种特征的比较或依某一特征(如:通涨率、出生率、国土面积等)进行排序。
Bureau of the Census,
第5章 互联网信息检索
网络信息检索(NIR - networked information retrieval)
因特网信息资源
概述
对网络信息资源的不同认识:
- 积极的;
- 消极的。
网上较丰富的信息内容:
- 政府信息
- 教育信息
- 科研信息
-文化信息
- 商务信息
-消闲娱乐信息
概述(2)
特点:
丰富,覆盖面广,涵盖各学科领域;
超文本、超媒体、集成式地提供信息;
信息来源分散、无序;
没有统一的管理机构,没有统一的发布标准;
变化、更迭、消亡等都时有发生;
无限、无序、优劣混杂。
概述(3)
更具优越性之处:
- 新颖、深入;
- 广泛、直接交流;
- 非正式、自由;
- 价廉。
因特网信息资源种类
WWW
Telnet
FTP
Usenet/Newsgroup
LISTSERV/Mailing List
Gopher
WAIS
因特网信息资源评价
评价的必要性:
网络资源的无限、无序、优劣混杂,
数字化知识数据单元DLO(类文献的电子文件document-like-object)的随时产生,
信息过载(information overloaded),
缺乏质量监控导致的信息污染、检索噪音加大,
用户对获取高质量信息的需求迫切。
评价的对象:一般是网页(web page)或网站(website)。
因特网信息资源评价(2)
评价标准:
目的(purpose)
范围(scope)
内容(content):准确性(accuracy)、权威性(authority)、新颖性(currency)、独特性(uniqueness)、可靠性(reliability)、链接(links)
图形和多媒体设计(graphic and multimedia design)
信息的展示与设计(information presentation and design)
可操作性(workability): 用户友好性、检索性能、交互性、连通性等
费用(cost)
评论(review)
因特网信息资源评价(3)
评价方法:
定性评价:问卷调查、专家评议
定量调查:数量分析(访问、登录次数,链接数量等)以掌握用户兴趣、网站影响力等。
一般评价:
查看首页描述和更新时间;
阅读帮助文件,了解查找、使用方法;
查看FAQ;
发现有无空链、错链等;
关注各门户或相关网站的推荐站点(站点精选、热门站点、“Cool links” 等)和调查统计结果:如“中国互联网信息中心(CNNIC)”定期发布的调查统计报告。
因特网信息资源评价(4)
书目控制方法在网络信息资源组织中的应用:在广泛收集网络信息资源、并进行整理、筛选、比较、评价的基础上,开发出对用户使用网络资源有指导意义的书目控制工具。名称各异,如:Webliography、Web of webs、Meta index、subject guide 、subject index等。
因特网信息资源评价(5)
重要的网络信息书目控制工具站点:
The Argus Clearinghouse, the Clearinghouse for Subject-oriented Internet Resources. Michigan 大学图情学院师生开发。是各学科主题领域网络资源指南的指南,相当于网络资源的“书目之书目”。
The WWW Virtual Library, 集中组织、罗列了280多个由各学科专家开发的专科、专题性网络资源指南,均题名为“……. WWW Virtual Library”。
OCLC之NetFirst:是经过OCLC工作人员评价、筛选后编制的因特网资源目录,有分类、还著录内容提要。
Librarians’ Index to the Internet, 是UC Berkeley 大学图书馆员建立的网络资源主题指南,每日更新。按主题字顺排列,有简短提要,链接了数千个网络资源。
Infomine: Scholarly Internet Resource Collections,
Louisana State University Webliography,
国家科学数字图书馆学科信息门户,
国家科技图书文献中心,
其“服务导航”下的“网络信息导航”。
因特网信息检索( Networked IR, Web-based IR, Net searching)
简述:
开始于20世纪90年代中期
Web迅速成为查找网络信息的主要平台
较低的查准率是网络信息检索方面的突出问题
网络信息检索的特点
信息检索空间的拓宽
交互式作业方式
用户界面友好且操作方便
网络信息检索的一般方法
浏览(Browsing)——基于超文本文件结构的信息浏览
在较随意的顺“链”而行中发现、搜索信息——即“surfing”(冲浪)。
追踪某个网页的相关链接。(类似传统文献检索中的“追溯检索”,可能带有某种偶然性和片面性。)
创建书签(Bookmark)或热链表(Hotlink,、Hotlist)等将一些常用的、优秀的站点地址记录下来,以备今后之需。
借助目录型网络资源导航系统、资源指南(Resource Guide)等网络检索工具来查找信息,即通过浏览主题分类目录树发现有用信息。
浏览策略(browsing strategy)
检索(Searching)----利用搜索引擎等网络检索工具
常规、普及的网络信息检索方式。基于用户给出的关键词、词组或自然语言等进行检索匹配的工具。
基于浏览的检索方式的特点
优点:
能够针对具体任务或问题找到相关信息
在检索过程中,使检索思路逐步清晰
有时能意外地发现新目标、扩充检索范围、获取检索结果
是目前检索多媒体信息的实用方法
不足:
随机、偶然性
检全性不足
信息迷航
基于关键词的检索方式的特点
优点:
检索简单易行,利于上手
检索结果时效性高
适合特性检索
不足:
难以准确反映词间关系
检索冗余、误差较大
网络信息检索工具
(1) 网络检索工具一般构成:
信息采集机制(Harvesting mechanism)
自动程序 Robot(又名为:Spider,Crawler,Worms,Wanders)
人工选择、采集
网络用户递交
标引机制(Indexing mechanism):自动、人工
组织机制:数据库
检索机制(Searching facility):检索代理软件、用户界面(Interface)
网络信息检索工具(2)
(2)网络检索工具的工作原理
搜集网络信息资源数据:通过自动索引程序Robot(或人工)
信息加工建立索引:经过一系列的判断、选择、标引、加工、分类、组织等处理后形成供检索用的数据库,创建目录索引,并大多以Web页面的形式向用户提供有关的资源导航、目录索引及检索界面;
检索界面:用户可根据自己的信息查找要求,按照该检索工具的句法要求等来通过检索界面输入想要查找的检索项、提问式。
执行检索和输出结果:系统检索软件接受用户提交的检索提问后,按照本系统的句法规定对用户输入的字符串、运算符、标识符、空格等进行识别和判定后,代理用户在数据库中检索,并对检索结果进行评估比较,按与检索结果的相关程度排序后提供给用户。
网络信息检索工具(3)
(3)各类型网络信息检索工具
按检索对象分:
Web资源检索工具:主流
非Web资源检索工具:
FTP:Archie等
Usenet: Deja News等
Lists:Liszt等
Gopher:Veronica等
(3)各类型网络信息检索工具
按检索机制分:
目录型(Subject directory, catalogue)
索引型:搜索引擎(Search Engine)
混合型(Hybrid tools)
目录型检索工具和搜索引擎之间的界限越来越模糊,大多数流行的网络检索工具均同时提供两种方式的检索,担负网络资源主题指南和索引双重责任。目前这种混合型(hybrid)检索工具代表了网络检索工具的发展趋势,多被混称为搜索引擎。
按检索内容分:
综合型
专题型
特殊型
(3)各类型网络信息检索工具
按包含检索工具数量分:
单一型(Singular search tools)
集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine)
第一代网络检索工具的特点:
目录型与索引型分立
提供基本的检索功能:
- 第一阶段:布尔检索(Boolean search)、截词检索(wildcard/truncation search)、邻近检索(proximity/adjacency search )、区分字母大小写(case sensitivity)
- 第二阶段:字段检索(Quasi-field search)、权重检索(weighted search)、跨数据库检索(cross-database search)
可选择输出/显示格式
第二代网络检索工具的特点:
目录型与索引型的融合
排序输出(Ranked output)
相关反馈(Relevance feedback)
更多的检索功能,如:自然语言检索(natural language search )、多语种检索(multilingual search)、多媒体检索(multimedia search)
目录型检索工具
(Subject directory, catalogue)
人工设计和编制的、供检索的等级结构式目录(指南、导航系统)
所收录资源经过鉴选和组织
减少了检索中的噪音,提高了检索的准确性
数据库的规模相对较小
新颖性不强,(会有“死链接”dead link)
用户要熟悉其分类体系
目录型检索工具比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。
有代表性的目录型检索工具
Yahoo!
Galaxy
WWW Virtual Library
搜狐、新浪
搜索引擎(Search Engine)
收录、加工信息的范围广、速度快;
检索功能强,一般可称为网络资源的关键词索引;
检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便;
标引过程缺乏人工干预,准确性较差
检索误差(噪音)较大
搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明确的课题。
有代表性的中英文搜索引擎
百度
天网
中国搜索
3721
Google,
Lycos ,
Infoseek
Excite
Ask Jeeves ,
Inktomi,
Northern Light ,
()
Wisenut
AOL
Alltheweb
元搜索引擎 (Metasearch Engine或Megasearch Engine)
又称集合式搜索引擎。即将多个搜索引擎集成在一起,并提供一个统一的检索界面。目的:克服用户面对众多的检索工具的无从选择和为求查全而在多个搜索引擎上重复检索的繁琐。
类型:
- 搜索引擎元目录:将主要的搜索引擎集中起来,按类型或按功能组织成目录,引导用户使用。集中罗列,单独检索;检索工具的检索工具。
- 元搜索引擎(并发式搜索引擎),将多个搜索引擎集成在一起,提供一个统一的检索界面。并行检索,结果综合。
较有代表性的搜索引擎元目录
iTools,
CUSI,
较有代表性的元搜索引擎
Dogpile,
Metacrawler,
Metafind,
Savvysearch,
CNET’s
万纬搜索,
SearchX ,
专业学科性网络检索工具——学科信息门户
为帮助从事专业研究或学习的人们在网络上更准确地查找专业信息资源服务。
人文、社会科学综合,如:
Social Science Information Gateway - SOSIG 社会科学信息网关,人工选择,高质量学术站点。既可浏览目录,也可进行关键词检索。
专业学科性网络检索工具(2)
自然科学与工程技术综合,如:
SciCentral,
EELS(Engineering Electronic Library, Sweden)
其他学科,如:
教育:GEM-The Gateway to Education Materials, Peterson’s , Education World等;
法律:LawRunner, Findlaw, Infolaw等
医学:Healthgate, OMNI-Organizing Medical Networked Information, Achoo等等。
网络检索工具的比较与评价
数据库的范围、规模及更新周期:其信息收选原则、标引方式、收录资源类型(Web、FTP、Usenet等)、数量、范围(地域、文种等)、时间、更新。
检索性能:所提供的检索深度(简单、高级、提要、全文)、检索功能,检索响应时间、检索结果提供方式。
用户负担:界面友好性,是否提供使用指南、帮助或提示信息等。
网络信息检索技巧
建立网络信息空间的检索思维和认识:
- 不要完全相信任何一个搜索引擎,(有报道称:十大网络检索工具所标引的信息量不超过网络信息总量的15%;还有文章称:覆盖率最高的网络检索工具也只收录了所有网络信息的20% - 30%),应该选用多个以查全。
- 不存在完善的检索策略;
选择合适的网络检索工具;
提高检索的精度、准确性:选专指度高的词、词组、特定概念,避免普通词、泛概念;使用带双引号的短语检索;使用限定条件;利用进阶、精炼检索。
扩大检索范围:使用同义词、近义词,使用多个搜索引擎或元搜索引擎,使用自动扩检功能(More like this)
加快检索速度,降低检索耗费:直接利用相关站点及特色服务等。
第6章 信息检索服务
信息检索与咨询服务方式
信息咨询服务
定题服务
科技查新服务
检索培训服务
数字化参考咨询服务
文献传递服务
信息咨询服务
解答用户的日常咨询。
咨询服务方式: 口头、书面、电话、网络咨询 。
定题服务
SDI服务, 有针对性、连续性、主动性的服务。
服务方式: 灵活性、多样性; 网络环境下的“推送(push)服务”,个性化的“定制(customized)服务”等可视为SDI发展的新形式。
科技查新服务
针对某一特定的研究课题,全面、系统地查阅国内外公开发表的相关文献;采取对比分析的方法对科研立项、科研成果、或新产品等的新颖性、先进性进行判定,给出客观、合理的说明或结论。
检索培训服务
最初主要是围绕文献及文献检索工具的使用而开展的培训,称书目指导(Bibliographic Instruction),现已发展为为培养用户的信息素质(Information Literacy)而开展的教育、培训活动。
数字化参考咨询服务(digital reference)
“Building the Virtual Reference Desk in a 24/7 World”
指用户通过网络通讯方式(e-mail、chat、Web)等提交查询并获得答案的参考咨询方式。
美国有%的学术图书馆设立了网站并有%开展了digital reference service。
现正致力于创建通用技术和质量标准,开发软件以建立实时和分时的参考服务。
文献传递服务
随着信息量的大幅度增长,一馆一地的资源不可能完全满足用户的需求,因此根据查询得到的文献信息线索,进行地区或全球合作获取原始文献信息也是信息检索咨询服务中不可或缺的组成部分。
文献信息服务机构通过区域性、专业性等协作网可以相互传递文献,共享其资源,最大限度满足用户的需求,提供真正的“一站式”服务。
谢 谢!