数字保存是指一系列必要的确保数字资源可持续利用的管理活动,按照保存期限可划分为:短期保存、中期保存、长期保存。就数字学术文献而言,往往采取长期保存,以确保知识的传承。然而,数字时代的学术记录归档,面临着一系列的争议和挑战。2024年1月24日,《图书馆学与学术交流杂志》(Journal of Librarianship and Scholarly Communication)刊登《数字学术期刊保存欠佳——基于700万篇文献的研究》(Digital Scholarly Journals Are Poorly Preserved: A Study of 7 Million Articles)一文,作者马丁·保罗·伊夫(Martin Paul Eve)是伦敦大学伯贝克学院(Birkbeck College, University Of London)文学、技术与出版系(Literature, Technology and Publishing)教授。文章调查了7,438,037篇标有数字对象标识符(Digital Object Unique Identifier, DOI)的文献,发现有2,056,492 (27.64%)篇文献未保存至数字存档系统中,仅58%的文章引用了存储在一个及以上的存档系统中的文献,另有14%的文献因发表时间太近、非期刊文献或没有可识别来源而未被纳入研究范围。文献在线保存系统面临挑战,其发展速度无法与研究产出的迅猛增长相匹配。伊夫将这一现象称为:保存赤字(preservation deficit)。对此,《自然》(Nature)杂志于2024年3月4日在新闻栏目发布《数字百万计的研究论文面临从互联网上消失的风险》(Millions of research papers at risk of disappearing from the Internet)一文,称当下的数字保存工作跟不上新兴学术知识生产的步伐,数以百万计的研究论文面临从互联网上消失的风险。对于研究成果的认知信任,源于能够检查、验证参考资料或科学资料。伊夫认为:“我们整个科学和研究的认知体系都依赖于环环相扣的脚注。如果你无法亲自验证别人在其他场合的言论,那你只能选择盲目地信赖那些你自己都不会再阅读的文献了。”正如美国学术史学家安东尼·格拉夫顿(Anthony Grafton)在有关脚注的研究中表示:“文化偶然性和极易出错的脚注为我们提供了唯一的保证,即关于过去的陈述来自可识别的来源。这也是我们必须信任它们的唯一依据。”在数字时代,为确保数字学术成果的持久性和可发现性,这种“验证生态系统”显得极为重要。例如统一资源定位符(Uniform Resource Locator, URL)、DOI,能够提供稳定、持久的学术文献访问链接。文章还分析了国家保存文化、数字基础设施组织Crossref成员规模和收入情况等内容。数字存储面临挑战
伊夫表示,该研究存在局限性——仅跟踪了带有DOI的文献,且未检测带有DOI的文献是否存储在机构知识库中。对此,数字保存联盟(Digital Preservation Coalition, DPC)董事总经理威廉·基尔布赖德(William Kilbride)表示:“了解电子期刊面临的数字保存挑战究竟处于何种程度一直很困难。”DPC曾推出《数字保存手册》(Digital Preservation Handbook),提供有关数字保存领域相关政策、标准、技术、工具及最佳实践等的调查研究及总结分析。芬兰汉肯经济学院(Hanken School of Economics)从事学术出版研究的米凯尔·拉克索(Mikael Laakso)表示:“许多人盲目地认为,有了DOI,文献就会永远存在,但这并不意味着链接永远有效。”2021年,拉克索和同事报告发现,2000年至2019年间,已有170多种开放获取期刊从互联网上消失。纽约数字存档服务商Portico董事总经理凯特·维滕伯格(Kate Wittenberg)曾言:“小型出版商保存文章的风险高于大型出版商。数字存档涉及基础设施、技术和专业知识等成本,小型出版商往往无力承担。”伊夫在文章中提出了改善保存赤字现象的8条措施,包括:(1)DOI注册机构将其合同措辞从“尽力而为”升级为定义最低保存要求,并指定经过认证的数字存档系统。对此,还需要定期审查。
(2)DOI注册机构执行保存条款,对相关行为予以制裁。
(3)DOI注册机构升级DOI存储模式,将保存作为发布的强制要求。
(4)DOI注册机构联合其他组织(如图书馆)定期审查保存声明的准确性。
(5)图书馆团体联合如开放获取学术出版协会(Open Access Scholarly Publishing Association, OASPA)、开放获取期刊目录(Directory of Open Access Journals, DOAJ)、图书馆出版联盟(Library Publishing Coalition)等组织面向出版商加强有关数字保存的教育与推广活动,例如面向新成员举办网络研讨会。
(6)DOI注册机构直接除名保存情况排名较低的成员,但要谨慎处理大规模的成员。
(7)DOI注册机构在保存期刊欠佳的国家或地区开展全国性的宣传推广。
(8)DOI注册机构引入自动化选择加入系统,通过DOI注册机制保存数字内容。
改善保存赤字现象,任重道远。但伊夫呼吁,我们真正应该考虑的是科学研究生态系统的长期可持续性,而非如何从论文发表中获益。在你去世的100年后,还有人能看到你曾经努力研究过的东西吗?新闻内容来自以下网站,不代表GoOA头条立场:
Nature:https://www.nature.com/articles/d41586-024-00616-5