人民網
人民網>>教育

借AI“慧眼”鑒別可疑論文圖片

2024年03月21日08:36 | 來源:科技日報
小字號

原標題:借AI“慧眼”鑒別可疑論文圖片

學術期刊工作人員正在核查分析蛋白質和DNA的可疑圖片。圖片來源:《自然》網站

今年1月,英國分子生物學家肖爾托·戴維發表文章,指控美國哈佛大學醫學院附屬丹娜-法伯癌症研究所科學家通過修改圖片偽造數據。隨后該研究所正式宣布撤回6篇論文,並糾正了另外31篇論文的數據。吹哨人戴維聲稱,這些造假論文發表於1999年至2017年,其中一些論文刊發於《細胞》和《科學》等頂級科學期刊。戴維使用人工智能(AI)圖片分析軟件和手動檢測發現了論文中的問題。

《自然》網站在近日的報道中指出,上述事件只是冰山一角,對學術論文中出現可疑圖片的指控還有很多。面對學術偵探和公眾的審查,學術期刊正在積極部署AI工具,以檢測出可疑圖片。

可疑圖片層出不窮

可疑圖片包括在多個圖中使用同樣的數據,圖片部分或全部重復,以及拼接圖片等。有些可疑圖片是論文作者有意為之,誤導讀者﹔有些是作者為了讓圖片變得更加美觀而作出些許改變。專家表示,不管基於何種理由,可疑圖片都損害了科學的完整性和嚴謹性。

專門關注學術不端和期刊撤稿的學術打假網站“撤稿觀察”維護的數據庫列出了51000多份需要撤回、更正的記錄。

美國科學圖片審查員伊麗莎白·比克及其同事對此開展了量化分析。他們研究了1995年至2014年間發表的20000多篇論文中的圖片,結果發現近4%的論文包含可疑圖片。這項研究還顯示,從2003年開始,論文中圖片重復出現的現象有上升趨勢,可能是因為數字攝影技術使修改圖片變得更容易。

比克指出,與幾十年前相比,現在發表的論文數量與日俱增,論文中出現圖片的數量也水漲船高,可疑圖片也會有增無減。美國科學公共圖書館出版倫理團隊成員蕾妮·霍赫則認為,可疑圖片問題的高報告率也可能源於“全球對誠信問題的認識提高,舉報行為增多”。

丹娜-法伯癌症研究所正在開展后續調查,該機構研究誠信官員巴勒特·羅林斯表示,盡快糾正錯誤至關重要,這是具有強大研究誠信的機構的常見做法。不過,她也補充道,論文中出現圖片重復或不一致並不能証明作者有意欺騙。

AI或充當“火眼金睛”

為減少可疑圖片發表,包括《細胞科學》《公共科學圖書館·生物學》《公共科學圖書館·綜合》在內的一些期刊,要求作者除了提交裁剪或處理后的圖片外,還要提交原始圖片。

許多出版機構計劃將ImageTwin、ImaCheck和Proofig等AI工具,納入出版前檢查中。《科學》雜志宣布使用Proofig篩選所有投稿。該雜志主編霍頓·索普表示,Proofig發現了一些問題,編輯因此否決了某些論文的發表,通常作者也對論文中的錯誤被識別出來表示感謝。

《自然》報道稱,即使圖片已經被旋轉、拉伸、裁剪,或改變了顏色,這些AI系統都可以快速檢測出同一篇論文中的重復圖片。當然,不同系統各有不同優勢。

比克解釋稱,Proofig可以發現哪些圖片是通過剪切或縫合拼接而來﹔ImageTwin則使用戶能將某篇論文中的圖片與其他論文的大型數據集進行交叉檢查。而一些出版商也在開發自己的AI圖片分析軟件。

研究表明,AI工具標記的許多錯誤也有點“無辜”。Proofig對2021年和2022年初提交給美國癌症研究協會9家期刊的1300多篇論文開展了分析,發現15%的論文可能存在圖片重復問題。論文作者的回復表明,207次圖片重復中,28%是作者有意為之,例如使用同一張圖片說明多個論點﹔而另外63%是無意的錯誤。

協同作戰不可或缺

這些科技期刊用戶報告稱,AI系統肯定能更快、更容易發現某些類型的圖片問題。但比克認為,這些AI系統不太擅長發現更復雜的操作,比如AI生成的虛假圖片。英國生物學-生化與分子生物學類期刊《恩博報告》主編伯恩德·普爾弗也認為,這些AI工具有助於檢測出低級別的誠信違規行為,但更多更嚴重的問題可能會急劇增加,目前的方法或許很快會過時。

《自然》指出,要想檢測出可疑圖片,在專家團隊的專業素養、技術工具,以及提高警惕性等方面要協同發揮作用。普爾弗表示,隨著圖片處理變得越來越復雜,查找可疑圖片將變得越來越困難。

那麼,從長遠來看,如何最好地解決圖片濫用問題呢?

比克表示,科學家需要更多地關注嚴謹性和數據的可重復性,對學術不端可能帶來的影響和后果要保持敬畏之心。(記者 劉 霞)

(責編:李昉、李依環)

分享讓更多人看到

返回頂部