保存赤字?超200万篇数字学术文章已从互联网上彻底消失

发布时间:2024-03-08
关键词:数字保存 数字基础设施 数字对象标识符 学术交流
数字保存是指一系列必要的确保数字资源可持续利用的管理活动,按照保存期限可划分为:短期保存、中期保存、长期保存。就数字学术文献而言,往往采取长期保存,以确保知识的传承。然而,数字时代的学术记录归档,面临着一系列的争议和挑战。

2024124日,《图书馆学与学术交流杂志》(Journal of Librarianship and Scholarly Communication)刊登《数字学术期刊保存欠佳——基于700万篇文献的研究》(Digital Scholarly Journals Are Poorly Preserved: A Study of 7 Million Articles)一文,作者马丁·保罗·伊夫(Martin Paul Eve)是伦敦大学伯贝克学院(Birkbeck College, University Of London)文学、技术与出版系(Literature, Technology and Publishing)教授。

image.png

文章调查了7,438,037篇标有数字对象标识符(Digital Object Unique IdentifierDOI)的文献,发现有2,056,492 (27.64%)篇文献未保存至数字存档系统中,仅58%的文章引用了存储在一个及以上的存档系统中的文献,另有14%的文献因发表时间太近、非期刊文献或没有可识别来源而未被纳入研究范围。文献在线保存系统面临挑战,其发展速度无法与研究产出的迅猛增长相匹配。

伊夫将这一现象称为:保存赤字(preservation deficit)。对此,《自然》(Nature)杂志于202434日在新闻栏目发布《数字百万计的研究论文面临从互联网上消失的风险》(Millions of research papers at risk of disappearing from the Internet)一文,称当下的数字保存工作跟不上新兴学术知识生产的步伐,数以百万计的研究论文面临从互联网上消失的风险。

image.png

对于研究成果的认知信任,源于能够检查、验证参考资料或科学资料。伊夫认为:“我们整个科学和研究的认知体系都依赖于环环相扣的脚注。如果你无法亲自验证别人在其他场合的言论,那你只能选择盲目地信赖那些你自己都不会再阅读的文献了。”正如美国学术史学家安东尼·格拉夫顿(Anthony Grafton)在有关脚注的研究中表示:“文化偶然性和极易出错的脚注为我们提供了唯一的保证,即关于过去的陈述来自可识别的来源。这也是我们必须信任它们的唯一依据。”

在数字时代,为确保数字学术成果的持久性和可发现性,这种“验证生态系统”显得极为重要。例如统一资源定位符(Uniform Resource LocatorURL)、DOI,能够提供稳定、持久的学术文献访问链接。
文章还分析了国家保存文化、数字基础设施组织Crossref成员规模和收入情况等内容。

数字存储面临挑战

伊夫表示,该研究存在局限性——仅跟踪了带有DOI的文献,且未检测带有DOI的文献是否存储在机构知识库中。
对此,数字保存联盟(Digital Preservation CoalitionDPC)董事总经理威廉·基尔布赖德(William Kilbride)表示:“了解电子期刊面临的数字保存挑战究竟处于何种程度一直很困难。”DPC曾推出《数字保存手册》(Digital Preservation Handbook),提供有关数字保存领域相关政策、标准、技术、工具及最佳实践等的调查研究及总结分析。
芬兰汉肯经济学院(Hanken School of Economics)从事学术出版研究的米凯尔·拉克索(Mikael Laakso)表示:“许多人盲目地认为,有了DOI,文献就会永远存在,但这并不意味着链接永远有效。”2021年,拉克索和同事报告发现,2000年至2019年间,已有170多种开放获取期刊从互联网上消失。
纽约数字存档服务商Portico董事总经理凯特·维滕伯格(Kate Wittenberg)曾言:“小型出版商保存文章的风险高于大型出版商。数字存档涉及基础设施、技术和专业知识等成本,小型出版商往往无力承担。”
伊夫在文章中提出了改善保存赤字现象的8条措施,包括:

(1)DOI注册机构将其合同措辞从“尽力而为”升级为定义最低保存要求,并指定经过认证的数字存档系统。对此,还需要定期审查。

(2)DOI注册机构执行保存条款,对相关行为予以制裁。

(3)DOI注册机构升级DOI存储模式,将保存作为发布的强制要求。

(4)DOI注册机构联合其他组织(如图书馆)定期审查保存声明的准确性。

(5)图书馆团体联合如开放获取学术出版协会(Open Access Scholarly Publishing AssociationOASPA)、开放获取期刊目录(Directory of Open Access JournalsDOAJ)、图书馆出版联盟(Library Publishing Coalition)等组织面向出版商加强有关数字保存的教育与推广活动,例如面向新成员举办网络研讨会。

(6)DOI注册机构直接除名保存情况排名较低的成员,但要谨慎处理大规模的成员。

(7)DOI注册机构在保存期刊欠佳的国家或地区开展全国性的宣传推广。

(8)DOI注册机构引入自动化选择加入系统,通过DOI注册机制保存数字内容。

改善保存赤字现象,任重道远。但伊夫呼吁,我们真正应该考虑的是科学研究生态系统的长期可持续性,而非如何从论文发表中获益。在你去世的100年后,还有人能看到你曾经努力研究过的东西吗?

新闻内容来自以下网站,不代表GoOA头条立场:

Nature:https://www.nature.com/articles/d41586-024-00616-5