超過200萬篇研究論文已經(jīng)從互聯(lián)網(wǎng)上消失了

圖片來自“Slave Societies Digital Archive”(數(shù)字檔案)官網(wǎng)。

據(jù)《自然》(Nature)雜志官網(wǎng)報道,一項針對超過七百萬份數(shù)字出版物的研究表明,超過四分之一的學(xué)術(shù)論文未被妥善存檔和保存,研究結(jié)果表明,當(dāng)下的數(shù)字保存工作未能跟上不斷增長的學(xué)術(shù)研究產(chǎn)量。

該研究發(fā)表于今年1月24日的《圖書館學(xué)和學(xué)術(shù)交流期刊》(Journal of Librarianship and Scholarly Communication),研究作者、倫敦伯克貝克大學(xué)文學(xué)、科技和出版研究員馬丁·伊夫(Martin Eve)解釋道,這個研究的認(rèn)識論都依賴于腳注鏈,“如果您無法核實(shí)其他人所說的話,那么您就只能盲目地相信您自己無法再閱讀的證據(jù)?!?/p>

馬丁·伊夫檢查了7438037份帶有數(shù)字對象標(biāo)識符的作品是否被存檔。數(shù)字對象標(biāo)識符是一套識別數(shù)字資源的機(jī)制,由一系列數(shù)字、字母和符號組成,用于識別和鏈接特定出版物(例如學(xué)術(shù)論文和官方報告)。一個數(shù)字化對象的DOI是唯一的,一經(jīng)產(chǎn)生就永久不變,不隨其所標(biāo)識的數(shù)字化對象的版權(quán)所有者或存儲地址等屬性的變更而改變。

研究樣本來自于每個注冊成員組織的最多1000個DOI的隨機(jī)選擇。研究結(jié)果顯示,其中28%的作品(超過200萬篇文章)沒有出現(xiàn)在主要數(shù)字檔案庫中,盡管它們有活躍的DOI。只有58%的DOI引用了至少一個存檔庫中的作品,其余14%的作品因發(fā)布時間太近、不是期刊文章或沒有可識別的來源而被排除在外。

圖片來源于《自然》雜志官網(wǎng)。

伊夫同樣指出了這項研究的局限性,這項研究只追蹤了帶有DOI的文章,并且沒有搜索每個數(shù)字存儲庫中的文章。例如,研究沒有檢查帶有DOI的物品是否存儲在機(jī)構(gòu)存儲庫中。

盡管如此,數(shù)據(jù)保存專家肯定了這份研究的價值。“許多人盲目地認(rèn)為,只要你擁有DOI,你的研究論文就會永遠(yuǎn)存在。但這并不意味著鏈接將永遠(yuǎn)有效”,芬蘭漢肯商學(xué)院的米凱爾·拉克索(Mikael Laakso)說道。拉克索和他的同事在2021年發(fā)布報告稱,2000年至2019年期間,超過170本開放獲取期刊已經(jīng)從互聯(lián)網(wǎng)上消失。

還有專家指出,小型出版商比大型出版商更容易因無法保存文章而面臨風(fēng)險。因為數(shù)據(jù)存儲需要成本,許多小型組織也無法獲取存檔涉及的基礎(chǔ)設(shè)施、技術(shù)和專業(yè)知識等資源。

馬丁·伊夫指出了一些改善研究論文的數(shù)據(jù)存儲現(xiàn)狀的方案,包括加強(qiáng)DOI注冊機(jī)構(gòu)的要求,以及提升出版商和研究人員對該問題的認(rèn)識?!懊總€人都在考慮他們可能從在某個地方發(fā)表論文中獲得的直接利益,但我們真的應(yīng)該考慮研究生態(tài)系統(tǒng)的長期可持續(xù)性。在你去世100年后,人們還能夠訪問你曾經(jīng)努力研究過的東西嗎?”

參考資料:

(1)More than 2 million research papers have disappeared from the Internet

https://www.nature.com/articles/d41586-024-00616-5

編譯/李永博

編輯/羅東

校對/朱名恬

標(biāo)題:超過200萬篇研究論文已經(jīng)從互聯(lián)網(wǎng)上消失了

地址:http://www.17168cn.cn/baike/136349.html