DOI基础知识

DOI基础知识

DOI(数字对象标识符)是一个唯一的字符串,用于标识文档、文章、研究报告等数字内容,并提供一个持久的链接到这些内容。DOI系统是由国际DOI基金会(IDF)管理的,旨在解决数字内容在互联网上的持久化访问问题。一个DOI标识符通常由以下几个部分构成:

  1. 前缀:前缀是DOI名称的第一部分,通常由一个反向的域名组成,表示分配DOI的组织。前缀是由DOI注册机构分配给出版商或数据提供者的,以确保全球唯一性。前缀通常以"10."开始,后面跟着一系列的数字,如"10.1000"。
  2. 斜杠(/):斜杠是固定的分隔符,用于分隔前缀和后缀。
  3. 后缀:后缀是DOI名称的第二部分,由分配DOI的出版商或数据提供者指定,用于唯一标识一个特定的文档或对象。后缀的内容和格式没有统一的规定,可以包含字母、数字、点、斜杠等字符,出版商通常会使用一种内部系统来生成后缀,以确保其在自己的DOI前缀下是唯一的。

一个典型的DOI看起来像这样:10.1000/182,其中"10.1000"是前缀,"182"是后缀。

DOI不仅标识了文档本身,而且通常链接到文档的元数据和(或)全文,使得用户可以通过DOI直接访问到文档的详细信息或下载页面。这使得DOI成为学术出版界广泛使用的一个重要工具,特别是在引用文献和获取数字资源时。

在DOI系统中,允许使用的字符有一定的限制。根据国际DOI基金会(IDF)的规定,DOI字符串可以包含以下字符:

  1. 数字(0-9):用于构成DOI的大部分,包括前缀和后缀中的数字部分。

  2. 字母(a-z,A-Z):大小写字母均可使用,且在DOI中是大小写敏感的。

  3. 特殊字符:特定的符号也可以被包含在DOI中,这些特殊字符包括:

    • 斜杠(/):用于分隔DOI的前缀和后缀。
    • 点(.):常用于后缀中,作为分隔符或部分标识符的组成。
    • 破折号(-):也常用于后缀中,作为分隔符或部分标识符的组成。
    • 下划线(_):可以用于后缀中,作为标识符的一部分。

除了上述字符外,大多数其他特殊字符,如空格( )、逗号(,)、冒号(:)、问号(?)、井号(#)、等号(=)等,在标准DOI字符串中是不允许的。然而,DOI可以通过URL编码来包含一些特殊字符,因为DOI常常作为URL的一部分来提供访问链接。在这种情况下,特殊字符需要被适当地编码,例如,空格可能被编码为%20

需要注意的是,尽管DOI标准允许大小写字母,但在实际使用中,DOI系统通常对待DOI为大小写不敏感。这意味着,无论是在引用、检索还是以URL形式访问DOI时,大多数情况下大小写的变化不会影响到DOI的解析和访问。然而,在记录和传播DOI时,保持原始的大小写是一个好习惯,以确保一致性和准确性。