LOGO
DOI标准&中文DOI在图
书馆的应用探讨
中文DOI运营管理中心
万方数据技术研究院
北京万方数据股份有限公司
主要内容
2
中文DOI在图书馆的应用方案4
DOI是什么31
中文DOI发展介绍33
国内外DOI应用情况
35 中文DOI应用演示
DOI是什么
Digital Object Identifier:数字对象唯一标识->对象的数字化唯
一标识符;
起源:DOI是由美国出版协会(AAP)在1998年创立的非赢
利组织IDF(国际DOI基金会)管理和运行的
被誉为互联网上的条形码
为互联网上的数字化内容提供永久的唯一标识——命名
提供到数字内容的链接,并且这种链接是牢固的、持久的——解析链接
贯穿数字内容的出版、发行、流通、交易、长期保存——管理
DOI也是一个系统
一个完整的唯一标识符管理、技术、标准体系
由IDF,CNRI(全美研究创新研究所),以及全球各个注册机
构(RA),等运行
提供完整的唯一标识符注册、解析及增值服务
DOI早已成为国际出版界事实标准,并于2010年3月通过投
票进入ISO标准最后阶段,预计年底或明年初正式发布
DOI—唯一标识
可以赋予任意种类、任意格式的对象
text, music, film, video, photographs, software,
database record, certificate…
可以针对任意层次的颗粒度或者特征
完整的书/单独章节,完整的乐曲集/单独音轨, 完整的
软件/单独程序, 产品/部件…
可兼容、包含其它编码方案,如UPC, ISBN,
ISSN,甚至身份证号…
永久性:一旦分配,永远不变
为什么唯一标识如此重要?
© 2000 CONTENT
DIRECTIONS, INC.
条形码
财务系统
库存统计
补货订单
经销商
生产商
收货
商店
结算记
录
公司总部
条形码:不仅仅是为结算提供方便
财务系统
库存统计
补货订单
经销商
生产商
收货
商店
商品的唯一标识符贯穿整个,
供应链,包括:
- 结账/支付
- 销售追踪
- 财务报告
- 货物运输
- 在商店或区域中销售
- 等等
结算记
录
公司总部
条形码:不仅仅是为结算提供方便
因此,在现实世界中,唯一标识符可以
实现各种自动化过程(销售、分销、运输等)
促进库存控制,财务跟踪,报告等
在网络世界中,内容资源没有物理的库存,运输
或物流,但是
也存在一个完全相似的,甚至更复杂的事务链或者一
系列系统,通过相互交互促进销售、分销、版权保护、
重利用等
与其它计算机系统一样,这些系统需要唯一的ID,来
标识相关的对象
与其它计算机系统一样,这些系统在相互通信时,需
要以可靠、便宜的方式统一地共享这些ID,
现实世界与网络世界
© 2000 CONTENT
DIRECTIONS, INC.
Online pub players mess
客户/最终用户的服务 客户/最终用户
内容资源的创作/支持服务内容资源的分销和销售
Authors /
Creators
Typesetters
Printers/
Manufacturers
Content
Management
Systems
Editorial / Content
Prep Systems
Web
Publishing
Systems
Content
Hosting
Providers
DRM
Services
Rights
Clearinghouses
E-Commerce
Vendors/ Service
Providers
Online
Bookstores
Content
Distributors/
Aggregators/
Syndicators
Individuals
Corporations
Libraries
Universities
Subscription
Agents
Abstracting and
Indexing (A&I)
Services
Search
Engines
Search
Technology
Providers
Library
Automation
System
Vendors
PublishersPublishers
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI DOI DOI
DOI DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI解析—下一代链接技术
中央目录提供标识符与相关位置或服务之间的重定向
与DNS相似:一个单一的逻辑目录,但是在物理上是分布
存储的
通过简单的更新就可以修复所有无效的链接
可以任意加入新的解析地址
一对多的链接(多重解析)
所有链接都是动态的、最新的
可以是本地化的链接(如在图书馆内部应用环境),也可
以是全局链接(通过网络)
内容
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
404
File not found
内容
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
内容
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
DOI
directory
DOI
directory
DOI
directory
DOI
directory
DOI
directory
出版商
DOI
directory
DOI
directory
DOI
directory
DOI
directory
Internet
DOI系统的组成
Data Model
Internet
Resolution
Numbering
scheme Policies
DOI is the combination
of these four components
doi>
DOI标识符的构成
DOI由两部分组成——前缀和后缀,中间由
一条斜线分割
例如: DOI:
前缀 后缀
前缀:
• 10:DOI在解析系统中的应用代号,是固定的
• 1016:由IDF的代理机构统一分配给DOI注册者的
后缀:注册者(出版商)赋予的数字对象的内
部唯一编码
DOI组织、运营机制
IDF(国际DOI基金会):
DOI管理机构(Registration Authority/maintenance agency )
由美国出版协会成立的非赢利机构
制定和维护DOI标准
IDF通过各RA (Registration Agencies )推广DOI应用
各RA可发展自己的应用领域和商业模式
可使用各自的商标发展自己的社区
6家RA
CrossRef(学术期刊协会,2000家以上的出版机构)
欧共体出版物办公室(EC 文档)
MEDRA(多语言欧洲DOI注册代理)
. Bowker (书目数据 - ISBN)
德国国家科技图书馆(科学数据)
万方数据公司
DOI利益链条——各方的共赢
出版商的共赢
RA和IDF的共赢
RA之间的沟通与协作
出版界与数字图书馆界的共赢
用统一标准取代多边协议
Publisher A
Publisher C
Publisher D
Publisher A
Publisher B
Publisher C
Publisher D
Publisher E
Publisher F
Publisher B Publisher E
Publisher F
DOI系统图书馆 A
图书馆 A
DOI解析系统—Handle System
作用:从DOI链接到对象信息
一个DOI可能有多个解析数据:
多个位置
元数据
服务
用户定义的扩展
Handle system
1995年,由“互联网之父”、TCP/IP协议联合发明人——Bob Kahn提
出,美国CNRI(全美研究创新研究所)开发
全局性的、分布式的互联网命名机制,促进对象之间的互操作
国际化:符合URI规范、基于UTF-8
IETF RFCs 3650, 3651, 3652
与DNS相比,将命名与内容分开,提供更好的可扩展性、更高的安全性
等
主要内容
2
中文DOI在图书馆的应用方案4
DOI是什么31
中文DOI发展介绍33
国外DOI应用情况
35 中文DOI应用演示
DOI的应用领域
引文链接:CrossRef
科学数据的引用项目: DataCite
目标:解决科学数据的重复利用问题,促进科学数据共享
超越了传统出版领域,并向传统出版业务深度渗透
种类包括期刊、书、学位论文、会议论文、标准、技术报告、科
学数据…
已与ISBN国际机构达成协议,将DOI用于ISBN-A业务
应用扩展
对数字内容使用的跟踪和审查
数字内容交易的商业模式及安全性
多媒体数据的加密
身份识别
DRM系统中的密钥管理
数字权利的描述和转移
前缀拥前缀拥
有者有者
1.信息资源拥有者申请前缀
DOI & 元数据
2.建立DOI与元数据
DOIDOI
注册机注册机
构构
3.注册服务
Handle System
(DOI 目录)
DOI Handle Data
进入DOI目录库
DOI注册应用流程
DOI
元数据
Metadata
进入DOI元数据库
其它数据服务
Added-value
Indexes 索引
Filters 过滤
Queries 查询4.增值服务
DOI全文链接工作过程
网上期刊文摘
读者
DOI 解析系统
网上期刊全文
1. 读者找到二次文献
2. 读者点击文章的DOI
3. 返回URL
4. 读者得到全文内容
DOI引文链接工作过程
网上期刊1
读者
DOI 解析系统
网上期刊 2
1. 读者找到文章
2. 读者点击文章引文的DOI
3. 返回URL
4. 读者得到引文内容
CrossRef——DOI引文链接服务
组织机构
运行:由12家成员组成的PILA (Publishers International Linking
Association)组建
参与
• Members
• 出版商和学会:4000余家
• 图书馆:1600余家
• Affiliates
运营状况
注册DOI数量:4300万
IDF最大的RA
90%以上的西文科技刊物已通过其注册DOI
注册资源:期刊22000种,DOI3750万个;图书DOI 268万;会
议论文、学位论文、标准、政府文件…
新服务:CrossCheck,ORCID,CrossMark
DOI/OpenURL图书馆本地化链接方案
DataCite——科学数据DOI
目标:科学数据(scientific primary data )DOI注册,促进科学数据
的传播与共享( make these data citable as a unique piece of work
and not only a part of a publication)
促进科学数据在互联网环境下的访问
促进科学数据的合法引用
支持科学数据的存档、重新利用
是数字图书馆的重要应用领域
发展历程
2009年以前由German Research Foundation (DFG)资助, TIB (German
National Library of Science and Technology)运行,TIB成为世界第一个提供科学
数据DOI注册的RA
2009年12月DataCite宣布成立,成员包括欧、美、澳洲的十二个科学图书馆、学
院、国家数据服务中心等
中信所计划作为Associated Members加入
已注册科学数据有关的DOI 80余万个,并扩展到多个领域
地球科学、气候、钻探、地理信息、会议录、医学案例、科学电影剪辑、
专家意见…
主要内容
2
中文DOI在图书馆的应用方案4
DOI是什么31
中文DOI发展介绍33
国外DOI应用情况
35 中文DOI应用演示
国内DOI发展情况
国内大型的数字期刊生产商等都不同程度使用了唯一标
识符,并对期刊、论文、报纸等各种数字资源都进行了
标识,但在应用唯一标识符方面仍处于初级阶段(内部
系统\应用层次低\无解析功能)
2002年,科技部数字图书馆标准规范项目资助“数字资
源唯一标识符现状与发展”研究
2007年以前,国内英文期刊:通过CrossRef加入DOI
2007年3月,IDF正式授权中国科技信息研究所&万方数
据公司,成立中文DOI注册机构(RA),推动DOI在国内的
规模化、标准化、公益化应用发展
中文DOI背景情况
开始于2007年
2006年开始论证、准备
2007年3月获得国际DOI基金会(IDF)正式批准,ISTIC和
Wanfang Data联合成立DOI注册机构(RA),负责中文领域DOI
注册和服务
公益化性质
ISTIC, 政府背景
万方数据:服务与运行
基于DOI服务,促进中文资源的链接与共享
• 重点开展中文期刊链接服务、科学数据共享等DOI应用
• 建设中文DOI门户网站与网络服务系统
• 运行、推广中文DOI注册、解析和增值服务
• 开展建立中国数字对象唯一标识符体系的研究
中文DOI服务现状
总数超过137万,从2009年开始居全球RA中的第二位
(IDF Status Report, March 2009)
1,360,000期刊DOIs
• 300余种精品科技期刊
• 1200余种万方服务的期刊,从2009年开始由万方支付注册费
科学数据DOI 15,000个
• 国家自然科技e平台
• 环境生态数据
期刊论文、科学数据有关图、表
其它(未来发展)
• 学位论文
• 会议论文…
中文DOI注册与服务系统
中文DOI二期系统网站首页
为各类用户提供的服务
DOI最终用户
典型用户:科研工作者、读者
信息资源拥有者
典型用户:出版社、编辑部
信息服务提供者
典型用户:图书馆、信息服务商
其他合作机构
集成商、开发商等
为DOI最终用户提供的服务
DOI解析:点击DOI号,链接到内容
多向解析
浏览网站,了解中文DOI的各方面情况、了
解DOI的概念和技术、标准
使用免费的元数据查询功能,撰写论文时用
标准格式引用参考文献
了解论文被引情况
了解中文DOI注册、使用的统计情况
为信息资源拥有者提供服务
注册DOI,为期刊论文创建永久的链入链接 (绿色为规划的功能)
批量注册,使用XML文件
在线填表注册,填写论文元数据,少量数据手工注册、注册体验
客户端注册工具,填写、转换EXCEL表格,数据检验、注册
注册DOI多向解析
注册引文元数据,自动匹配引文的DOI号
查找DOI号,为文章的引文建立链出链接
免费查找一篇文章的DOI号
批量查询大量文章的DOI号、完整的二次文献数据
实时查询少量文章的DOI号、完整的二次文献数据
将全文注册DOI、为引文查找DOI等步骤融入电子产品生产或在线出版过程
OpenURL查询接口:查询单条论文的DOI或元数据
批量注册的机器接口
批量查询的机器接口
了解资源的DOI注册、使用的详细和统计情况
DOI注册整体情况
期刊注册情况:期刊列表、期刊注册的DOI数量与年期
获得注册资源被引情况
对于信息资源服务提供者
使用中文DOI系统批量查询文章的DOI号或
元数据,用于丰富、扩展和集成资源
通过OpenURL接口实时查询DOI/元数据
通过DOI/OpenURL实现本地化链接
了解DOI注册、使用的详细和统计情况
对于其他合作机构
进行技术合作,扩展双方的服务
中文DOI标准规范
系统接口开发
• 自动化注册接口
• 自动化查询接口
标准的元数据资源
DOI研究与合作
科技部国际科技合作
2007-2010年,中国数字对象唯一标识符体系的研究与建立
万方数据公司牵头,与美国CNRI合作研究,中信所等单位参加
基于国内版权保护环境和Handle系统的安全特性,研究与实验基
于DOI/Handle的开放式权益管理框架
新闻出版总署
2008年,行业标准预研
2010年,《新闻出版数字资源唯一标识符》行业标准制定
国家工程,数字复合出版,出版资源唯一标识符管理与服务
国家工程,数字版权保护,数字版权登记体系
DOI/Handle在图书馆的应用研究
数字对象(DO)与数字图书馆
R. Kahn, & R. Wilensky, "A Framework for Distributed
Digital Object Services", 1995
——引自
上海图书
馆赵亮老
师:“数
字图书馆
与元数据
”讲义
Handle系统与数字图书馆
1994,由美国DARPA资助的DLI(“数字图书馆启动”) ,属于数
字图书馆的通用体系结构,为DO提供持久的唯一标识符
1995,美国国会图书馆(LOC)的国 家 数 字 图 书 馆 计 划
(NDLP),为电子化的馆藏提供持久访问机制
目前
出版:DOI
内部文件管理:Los Alamos National Laboratory
互联网数字权益管理 ,如cIDF
安全的DNS和IP电话 ,与CNNIC合作研究
网格计算,主要用于癌症研究,数据共享
P2P计算及资源共享(UNM)
机构数字仓储系统Dspace,MIT&HP
内容管理系统F’edom(f’lexible Extensible Digital object and Repository
Architecture),Virginia&Conell
Handle Resolution
is a collection of
handle services,
each of which
consists of one or
more replicated sites,
Site 1 Site 2
Site 1
Site 2
Site 3…... Site n
Client
The Handle System
LHS
LHS LHS
LHS
GHR
each of which may
have one or more
servers.
URL4
#1 #2 #n#4#3
#1 #2
...
数字图书馆合作研究
NSF项目申请
合作方:美国CNRI, LOC,中国ISTIC, NSTL
合作目标
设计、开发一个概念性演示
演示ISTIC、NSTL和美国国会图书馆如何合作建立先进的服务模型,
在科研资源共享方面进行合作
合作研究内容
活动文档管理框架
基于handles建立支持活动文档共享与使用的数据模型,对科研
人员的科技文献、科研数据、研究模型等数字内容进行集成标识
和管理
基于SOA建立支持数据服务的自动发现、调用和集成的服务模型,
使其他研究者能够通过唯一标识符访问这些数字内容,并对原始
研究者的研究成果进行全面研究或重新利用
在中、美两国的数字图书馆分别建立中、英文研究资源仓储,
实现包括论文、数据集、研究模型在内的多语言数字对象的存
储,以及跨多个仓储的数字对象检索、解析和访问、自动执行
等
主要内容
2
中文DOI在图书馆的应用方案4
DOI是什么31
中文DOI发展介绍33
国外DOI应用情况
35 中文DOI应用演示
图书馆应用DOI
利用DOI进行资源整合化建设
NSTL西文引文DOI匹配实验(2007年11月)
基于DOI的资源整合化建设方案设计
特色资源注册DOI
基于DOA和handle系统建立数字图书馆
NSTL西文引文DOI匹配实验
背景情况
NSTL 的现状及需求
• 中国最大的基于网络环境的科技外文文献信息服务机构
• 依靠传统的馆藏建设方式难以在有限经费条件下可靠满足用户需要
• 需要形成整合建设的机制
– 根据用户需要的程度和满足途径的效率与效益
– 充分、合理利用各种资源建设的途径,特别是网络数字信息资源等非传
统途径
– 经济、方便、可靠地保障“文献供应”
实验情况
实验目的及方案
实验结果分析
西文引文DOI匹配实验方案
实验目的
从NSTL西文引文链接起步,探索基于DOI的NSTL
资源整合化建设的技术路线,满足NSTL文献资源整
合化建设的技术需求
实验方案设计
使用NSTL西文引文数据样本,从CrossRef查询引文
数据的DOI号
从查询结果分析和评估基于DOI的资源链接对于
NSTL文献链接、文献资源整合化建设的价值
研究基于DOI的NSTL文献资源整合方案实施的可能
性、具体的实施方法等
实验结果分析
实验结果统计情况
共提交NSTL英文引文数据39223条,匹配到DOI号的共28024
条,DOI匹配率约为%
经过抽样对比和统计分析,DOI匹配的准确率基本为100%
未匹配到DOI的原因分析
引文数据正确,但引文未注册DOI,或未在CrossRef注册
• 经过粗略统计,这种情况在引文样本数据中大约有100多个
刊,4000余条引文,引文数量占样本总数的10%以上,占
未匹配总数的36%
引文数据不准确或不完整,引文虽然可能在CrossRef注册了
DOI,但未匹配上
• 引文类型不匹配
• 引文数据缺少作者或卷、期、页信息
• 由于作者提供的引文数据不准确或在加工过程中产生的误
差等,都可能影响查询效果
基于DOI的资源整合化建设方案
整合引文、全文资源,扩大资源覆盖范围,提供
增值服务
整合应用,规范对外接口,给用户更好的应用体
验
规范数据加工,提高资源加工质量,降低成本
实现基于DOI的本地化链接方案,给用户提供合
适的拷贝
通过引文DOI的匹配和标识,实现到出版商二次文献及全文资源的
可靠链接,在不增加成本的情况下扩大资源覆盖范围
在原文二次文献页面中列出参考文献信息及参考文献的DOI号,就可
以通过DOI标识,在NSTL70%左右的引文中简单、便利、可靠地实
现图书馆到出版商二次文献及全文资源的动态链接
通过DOI号整合图书馆内部资源,如引文全文在图书馆资源内部的
匹配等
• 通过查询或加工获取原文及引文的DOI后,只要通过DOI号就可将引
文和全文在图书馆内部匹配起来,既简单又准确
• 根据实验结果进行保守的测算,这可以解决NSTL50%-70%内部资
源准确链接问题
• 可以在引文信息中增加图书馆内部的全文链接(见图绿色部分)
图书馆内部资源经过统一整合后
开展文献的评价等增值服务
详细分析用户行为,逐步实现基于用户需求的资源建设
基于DOI整合引文、全文资源
整合接口,提高质量
整合应用及接口
通过DOI号提供与外部资源或外部应用的接口,
可以简化外部接口,提升对外服务的质量和速度
在图书馆服务系统中,提供通过DOI号查询论文
全文的功能,可提高文献检索服务的速度和准确
度
提高资源加工质量
通过DOI查询,规范图书馆论文二次文献加工、
引文加工
• 通过DOI匹配结果,提高数据的完整性并纠正错误数据
• 对于DOI匹配结果进行进一步的细致分析,可以发现更
多数据加工问题,并采取措施予以纠正
合适的拷贝问题
如何获得合适的拷贝?
图书馆获取资源的途径越来越多元化
如何在多种信息源并存的情况下,将用户对资源
的请求自动链接到有权访问的(或已经由图书馆
购买访问权的)资源上?
在图书馆资源整合化建设中必须解决好链接的本
地化问题
基于DOI/OpenURL的本地链接方案
基于OpenURL的DOI/CrossRef链接本地化解决
方案,能够以较低成本实现链接的本地化
本地拷贝
带有
CrossRef
/中文DOI
链接的论文
客户端
图书馆链接服务器
图书馆
扩展DOI/OpenURL的本地化链接方案
重定位到图书馆
本地链接服务器
理解OpenURL
CrossRef/中文DOI
元数据?
元数据
如何实施?
事实是:只有10%的科技期刊没有加入DOI,因
此,图书馆如何更好地利用DOI?
• 将DOI作为必要字段加入资源加工过程;
• 利用DOI元数据(中文、英文)进行半自动化的数字
化加工实验;
• 利用中、西文DOI注册数据进行图书馆引文匹配工作,
以有效地扩大引文分析范围;
• 在图书馆的服务系统中实现基于DOI的资源相互链接,
以及通过DOI与中、西文原始资源的链接;
• 开展基于DOI/OpenURL的本地化链接实验
主要内容
2
中文DOI在图书馆的应用方案4
DOI是什么31
中文DOI发展介绍33
国外DOI应用情况
35 中文DOI应用演示
DOI应用场景演示
DOI全球解析(中文DOI、CROSSREF)
万方医学网DOI解析、引文链接
科学数据解析和链接
引文DOI查询
简单查询
高级查询:登录、王震,北京大学
OpenURL查询
中文期刊DOI应用实例(二)
万方知识服务平台 万方医学网
编辑部网站
中文期刊DOI应用实例(三)
DOI期刊论文多重解析
DOI搜索与解析
在搜索引擎中搜索DOI号
在DOI系统中或浏览器中解析DOI号
欢迎联系
,
谢谢
请指正!