【doi号是什么】基础概念与作用
什么是DOI?它代表什么?
DOI 是 “Digital Object Identifier” 的缩写,意为“数字对象标识符”。你可以把它理解为互联网上数字出版物的“身份证号码”。它是一串由数字和字母组成的唯一字符串,被用来永久性地、唯一地标识网络上的数字资源,最常见的是学术期刊文章、图书章节、会议论文、数据集等。
与传统的网址(URL)不同,DOI不是指向数字资源当前存放的“位置”(网址可能随时改变),而是指向数字资源的“本身”。它的核心作用是提供一个持久的链接,无论该资源被移动到哪个服务器上,只要它的DOI信息在系统中被更新,通过DOI就总能找到该资源。
因此,DOI是确保学术及专业内容在网络环境中可被长期、可靠地定位和引用的关键工具。
DOI号看起来是什么样子?
一个典型的DOI号通常以 “10.” 开头,后面跟着一个斜杠(/),斜杠前面是前缀(Prefix),斜杠后面是后缀(Suffix)。
示例:
10.1016/j.neuron.2018.04.003
10.1109/JSAC.2019.2901964
10.1007/978-3-030-01553-5_12
这里的:
10. 是DOI系统的固定起始码。
10.XXXX 是注册机构(通常是出版机构、大学或数据中心等)的前缀,由DOI注册机构(如Crossref, DataCite)分配,用于唯一标识内容的发布者。
/YYYYYY 是后缀,由注册机构(发布者)自己为每个具体的数字对象分配,必须在该机构的前缀下是唯一的。后缀的格式多种多样,可以是文章的内部编号、出版年、刊物代码等任意组合。
为什么DOI号如此重要?
解决链接失效问题(“死链接”)
这是DOI最重要的价值之一。传统的网址(URL)可能会因为网站迁移、页面更新、服务器改变等原因而失效,变成无法访问的“死链接”。这对于需要长期引用的学术文献和重要专业资料来说是致命的问题。
DOI通过一个由注册机构维护的系统来解决这个问题。DOI指向的是内容本身,而不是其当前的网址。如果内容的网址改变了,发布者只需要在DOI注册系统中更新该DOI对应的网址信息。这样,用户无论何时使用该DOI,DOI解析系统都能将其导向该内容最新的存放位置。这保证了引用的稳定性和内容的持久可访问性。
提供稳定、可靠的引用方式
在学术研究和专业交流中,准确引用参考文献至关重要。DOI为引用提供了极大的便利和可靠性。在论文、报告、书籍中包含DOI,读者就可以方便快捷地找到原文,无需担心链接失效。
许多学术数据库和引用管理软件都支持直接使用DOI来查找和管理文献信息,提高了引用的效率和准确性。
在哪里可以找到一篇文献的DOI号?
在阅读或查找数字出版物时,DOI号通常会出现在几个显眼的位置:
在文献或章节的出版页面上
当你在线访问一篇期刊文章、图书章节或会议论文的网页时,DOI号通常会非常醒目地显示在页面的顶部、底部,或者作者信息、摘要附近。许多出版商会将其标注为 “DOI:” 或提供一个直接可点击的链接,例如 “https://doi.org/10.xxxx/yyyy”。
在PDF文档内部
下载的PDF格式文献通常也会在文件内部包含DOI信息。它可能出现在:
- 第一页或封面页: 在标题下方、作者信息附近或页脚。
- 页眉或页脚: 在每一页或特定页面的页眉或页脚部分。
- 最后一页: 在文献的最后,可能作为附加信息或版权信息的一部分。
在引用信息中
当你从学术数据库(如PubMed, IEEE Xplore, ScienceDirect等)或引用管理软件(如EndNote, Zotero, Mendeley)中获取文献的引用信息时,DOI通常是标准信息字段之一,会包含在导出的引用格式中。
通过DOI解析服务查找(如果已知其他信息)
如果你只有文献的其他信息(如作者、标题、期刊名称、年份等),可以使用一些DOI注册机构提供的服务来尝试查找其DOI。例如,Crossref的免费文本查询工具可以根据文献元数据来查找对应的DOI。但这需要该文献确实已经被注册了DOI。
如何使用DOI号访问文献或引用?
通过DOI解析服务访问内容
使用DOI来访问数字资源最简单且标准的方法是将其转化为一个网址。你只需要在任何浏览器中输入以下格式的网址:
https://doi.org/
后面紧跟着完整的DOI号
例如,如果DOI是 10.1016/j.neuron.2018.04.003
,你就在浏览器地址栏输入 https://doi.org/10.1016/j.neuron.2018.04.003
并回车。
这个地址会将你导向DOI解析系统,该系统会查找这个DOI当前对应的最新网址,然后自动将你的浏览器重定向到该资源的存放页面(通常是出版商网站上的文章页面)。
提示: 许多现代文献阅读软件、浏览器插件甚至网站会自动识别页面上的DOI号并将其转化为可点击的链接。
在引用中包含DOI号
在撰写论文、报告或其他出版物时,在参考文献列表中包含DOI号已经成为标准做法,特别是在引用学术期刊文章和电子书时。不同的引用格式(如APA, MLA, Chicago, IEEE等)对DOI的格式有不同的要求,但通常会以 “DOI:” 开头,后面跟着完整的DOI号,或者直接使用其链接形式。
示例(常见格式):
Author, A. A., & Author, B. B. (Year). Title of article. *Title of Journal, Volume*(Issue), pages. DOI: 10.xxxx/yyyy
或者
Author, A. A., & Author, B. B. (Year). Title of article. *Title of Journal, Volume*(Issue), pages. https://doi.org/10.xxxx/yyyy
请参考你所遵循的具体引用风格指南来确定如何在参考文献列表中正确地格式化DOI。
哪些类型的“数字对象”通常有DOI号?
DOI系统设计用来标识任何类型的数字或实体对象。但在学术和专业出版领域,DOI主要用于以下类型的数字资源:
- 学术期刊文章: 这是最常见应用DOI的内容类型。
- 书籍及书的章节: 整本书可以有一个DOI,每个独立的章节也可以有自己的DOI。
- 会议论文集及单篇会议论文: 重要的学术会议发表的论文通常会获得DOI。
- 研究数据集: 存储在数据仓库中的研究数据也越来越广泛地使用DOI,以便引用和重用。
- 技术报告和工作论文: 由机构发布的报告有时也会获得DOI。
- 学位论文或博士论文: 有些大学或机构会为公开发表的学位论文分配DOI。
- 软件: 用于研究或与出版物相关的软件代码库有时也会获得DOI。
- 预印本(Preprints): 在正式同行评审发表前上传到预印本服务器的文章通常会获得DOI。
- 多媒体对象: 如视频、音频等,如果它们是某个出版物的重要组成部分或本身就是可引用的研究产出。
简单来说,任何需要被稳定引用和定位的数字内容,都可以通过注册获得一个DOI。
DOI号的结构是什么?
如前所述,DOI号的基本结构是 10.前缀/后缀
:
前缀(Prefix)
前缀以 10.
开头,是国际DOI基金会通过指定的注册机构(如Crossref, DataCite,等)分配给内容注册者的唯一标识码。这个注册者通常是出版机构、大学部门、研究机构、政府机构等。前缀的作用是表明哪个机构负责管理和维护这个DOI所指向的内容及其元数据。例如,许多施普林格(Springer)出版的文献前缀是 10.1007
。
后缀(Suffix)
后缀是位于斜杠(/)后面的一部分,由拥有该前缀的注册机构(出版者)自己创建和管理。后缀的设计由注册机构决定,只要在其前缀下能唯一标识每一个具体的数字对象即可。后缀可以包含字母、数字和符号,长度不固定,常见的设计可能包含出版年份、刊物缩写、卷期号、页码、文章的内部编号等。后缀是用来区分同一注册机构发布的各个不同数字对象的。
前缀和后缀由一个斜杠(/)分隔开。
出版机构或作者如何为内容获取DOI号?
要为自己发布的内容分配DOI,通常需要通过成为一个被国际DOI基金会认可的DOI注册机构(Registration Agency, RA)的成员。最主要的学术出版领域的注册机构包括 Crossref (主要面向期刊、图书、会议论文等) 和 DataCite (主要面向研究数据集等)。
获取DOI的流程通常如下:
- 成为注册机构的成员: 出版社、机构或数据中心需要向某个注册机构提交申请并成为其成员。这通常需要支付会员费用。
- 分配DOI: 成员机构根据其内部系统为每一项需要标识的数字内容生成一个唯一的后缀,并将其与该机构的前缀组合形成完整的DOI。
- 注册DOI和元数据: 成员机构需要将分配好的DOI以及与该内容相关的元数据(如标题、作者、出版日期、出版商、以及最重要的——该内容当前的URL)提交给注册机构的数据库进行注册。这一步通常需要为每个注册的DOI支付少量费用(这就是“多少”这个疑问词在费用上的体现)。
- 维护信息: 如果内容的URL发生变化,成员机构有责任及时在注册机构的系统中更新该DOI对应的URL信息,以确保DOI的持久可用性。
对于绝大多数个人作者而言,你不需要直接获取DOI。如果你在期刊上发表文章,DOI由出版期刊的出版社负责注册;如果你出版书籍,由出版社负责;如果你在机构数据仓库存入数据集,由数据仓库负责。只有当你作为出版者或数据发布者(例如,机构库、自己搭建的开放获取期刊)时,才需要考虑成为注册机构成员并自行分配和注册DOI。
DOI号是如何工作的?解析过程简介
DOI的工作原理主要依赖于一个分布式的解析系统。
当用户在浏览器中输入形如 https://doi.org/10.xxxx/yyyy
的DOI链接并访问时:
- 用户的请求首先被发送到国际DOI基金会或其指定的主要DOI解析服务器(如dx.doi.org)。
- 解析服务器接收到完整的DOI号(
10.xxxx/yyyy
)。 - 解析服务器根据DOI中的前缀(
10.xxxx
),查找该DOI是由哪个具体的注册机构(例如Crossref或DataCite的成员机构)负责管理的。 - 解析服务器将请求转发到管理该DOI的注册机构的系统,或者直接查询注册机构提供的数据库,获取该DOI当前对应的最新URL。
- 获取到最新URL后,解析服务器会将用户的浏览器重定向到这个最新的URL地址。
- 最终,用户的浏览器加载并显示数字内容所在的页面。
这个过程对于用户是透明的,看起来就像直接点击了一个链接。关键在于,DOI解析系统扮演了“地址簿”的角色,无论数字对象的实际网络地址如何变化,DOI这个“身份号码”不变,并且系统中的记录会随之更新,从而保证了链接的持久性。