每5天就發表一篇論文的科學家們

每5天就發表一篇論文的科學家們

來自專欄 Nature自然科研15 人贊了文章

導語:為了揭示論文署名上常見的不確定性,John P. A. Ioannidis、Richard Klavans和Kevin W. Boyack找出了近年來最高產的科學家。

論文的署名是學術界的貨幣——有些研究者堪比印鈔機。我們在Scopus資料庫中搜索在2000年-2016年間任何一個自然年裡發表論文超過72篇(相當於每五天一篇)的作者——如此高產令人難以置信。

我們儘可能地將論文限定為「完全論文」——期刊論文、會議論文、實質性評論和綜述,而不包括社論和讀者來信等,結果搜到了9000多人。我們希望這樣做能幫助理解科研署名的含義。

插圖:David Parkins

要提前說明一下:我們沒有證據證明以上作者有任何不當行為。一些大型研究所里的科學家是有可能有這麼多的署名論文的。我們的發現表明,某些領域或研究團隊對論文署名已經有了可操作的定義。

絕大多數高產作者(7888名,佔86%)發表的是物理論文。在高能物理和粒子物理領域,有一些項目是由超過一千人的大型國際團隊進行的。所有成員都會署名為作者,表示他們是團隊的一員,但並不意味著他們撰寫或修改了論文。因此,我們排除掉了物理領域的作者。

在剩餘的作者里,有909人有著像中國人或韓國人的名字。因為Scopus無法精準區分這兩種名字,因此有可能錯把幾個不同人的論文歸入一起了。

如果僅限於2016年的話(這一年對中國人和韓國人名字的辨識演算法改進了),有至少12名,也可能是20名以上的高產作者來自中國,在當年居於所有國家之首。我們認為這可能和中國對發表論文給予現金獎勵的政策有關,也可能有某種腐敗。

考慮到人名辨識所存在的問題,我們在後續的分析里也排除掉了這些人。除此之外,我們還排除了團隊署名、錯誤(例如期刊新聞誤被分類為完全論文)、重複的論文條目、或是被誤歸入會議組織者名下的會議論文。

這樣就剩下265名作者。在排除掉各種不適用情況之後,高產作者的數目從2001年到2014年增加了20倍,之後就沒有繼續增長(見圖「高產作者數量激增」)。與此同時,論文作者的總數只增加了2.5倍。

來源:J. P. A. Ioannidis, R. Klavans & K. W. Boyack

我們給所有265名作者發了電子郵件,詢問他們為何能如此高產。最後收到了81份回復,回答的主要內容不外乎刻苦工作、熱愛科研、指導大量青年科學家、帶領研究團隊甚至多個研究團隊、廣泛合作、同時進行多個領域或核心服務的研究、能夠獲取大量合適的資源或數據、大型項目的累積、慷慨或樂於分享等個人性格、成長經歷、以及每天只睡幾個小時

一半高產作者都來自醫學和生命科學領域(醫學101人,健康科學11人,腦科學17人,生物學6人,傳染病學3人)。如果不算會議論文的話,將近三分之二(86/131)都屬於這一領域。在這265人里,有154名作者在至少兩個自然年裡每五天發表一篇論文;69人在至少四個自然年裡每五天發表一篇論文。一篇論文包含10-100名作者很常見,特別是在醫學和生命科學領域。但是粒子物理領域這種論文署名超過100人的情況就不常見了。

保持最高產記錄的是材料科學家井上明久(Akihisa Inoue)。他曾任日本東北大學校長,是多所知名學術機構的成員。他在2000年-2016年間有12年達到了我們的高產標準。從1976年起,他的名字出現在了2566篇Scopus收錄的完全論文中。他因為自我重複發表過往研究而撤回7篇論文。我們又用谷歌搜索了排名在他之後的20名高產作者的撤回記錄,只有一人(Jeroen Bax)撤回了一篇論文。

這265名高產 作者來自37個國家,排名第一的是美國(50人),其次是德國(28人)和日本(27人)。美國所佔的比例(19%)大致等同於美國所發表的科研論文數比例,而德國和日本高於其所發表論文佔比。馬來西亞(13人)和沙烏地阿拉伯(7人)的高產作者佔比異常的高——這兩個國家都對發表論文給予現金獎勵。

在某些研究機構,高產作者比較集中,他們通常是同一個項目里的成員。例如,荷蘭鹿特丹伊拉斯姆斯大學有9名高產 作者,比其它任何研究機構都多。其中7人共同署名的大多數是關於鹿特丹項目(Rotterdam study)及其後續第R代項目(Generation R study)的論文。鹿特丹項目是一個接近30年之久的流行病學研究,而第R代項目跟蹤了數千名年齡較大的成年人的多個健康參數,並發表了數千篇論文。

5名來自哈佛大學的高產作者也經常共同發表隊列研究相關的論文。有11名所屬機構不同的高產作者都屬於同一個大型隊列研究項目組:歐洲癌症與營養前瞻性調查(European Prospective Investigation on Cancer and Nutrition)。其它大型流行病學研究也榜上有名。心臟病學和晶體學領域也有很多高產作者。

生物和醫學領域裡的高產作者展現出了和粒子物理與高能物理領域不同的模式。在瑞士日內瓦的歐洲粒子物理學實驗室CERN里有數千科學家共同工作,有數百到上千作者署名的論文是非常常見的。在晶體學領域,論文只有不多的幾個作者署名。在流行病學和心臟病學領域,長長的作者列表只出現在某些似乎有此傳統的研究團隊里。

這就引出了一個問題,即署名到底意味著什麼。例如,美國國立衛生研究院就規定了做了哪些工作後有資格在論文上署名:積極指導,設計並做實驗,除「非常基礎的」工作之外的數據收集和分析,以及起草論文。申請資金或遠程指導不算在內。最近有一項問卷調查了分處各個地區和學科領域的6000餘名作者,其中大多數人認為起草論文、解讀結果和分析數據應當有署名資格,但依據地區和學科不同,觀點也有所不同。

署名標準

可能最為廣泛接受的署名條件是國際醫學期刊編輯委員會於1988年訂立的溫哥華標準。其中指出作者必須做了以下全部四件事才可以署名:參與設計實驗、開展實驗或分析結果;幫助撰寫或修改論文;審核出版時的論文版本;為論文內容負責。

國際醫學期刊編輯委員會認為監督、指導或申請資金並不夠署名資格。我們觀察到一些作者在成為正教授、院長或正教授兼院長後才變得高產的。很常見,或者說可能是意料之中的現象是,科學家在大型研究中心擔任領導職務後產量就變高了。例如,臨床心臟病學家在擔任領導職務之後發表的論文更多了(儘管還有繁重的臨床和行政管理任務)。

有時產量增長非常驚人:有些心臟病學家在效率最高的時候一年發表的論文數是35歲-42歲時平均一年發表論文數的10-80倍。而卸任之後論文數量又會大幅降低。二十年前的另一項研究注意到了類似的模式。

一個意外的發現是,很多高產作者將許多論文發表在了同一本期刊上,比較明顯的有《結晶學報,E輯:結構報告網路版》(2014年重啟為《E輯:晶體通訊》,並在IuCrData上發布簡短的結構數據報告)和《結晶學期刊-新晶體結構》。

有三名作者分別在前一本期刊上發表了600多篇論文(Hoong-Kun Fun、Seik Weng Ng和Edward Tiekink);也有三名作者分別在後一本期刊上發表了400多篇論文(Karl Peters、Eva Maria Peters和Edward Tiekink)。還有三名作者(Anne Marie Api、Charlene Letizia和Sneha Bhatia)在《食品與化學毒理學》增刊上發表了很多篇關於香味材料的綜述。

Scopus所收錄的期刊通常被認為是高質量期刊。高產作者的引用數通常很高,但不同作者間相差很大。中位數是每個作者被引19805次(最少380次,最多200439次)。2000-2016年高產作者的完全論文中位數是677篇。在所有高產作者里,署名最末的有42.5%,第一作者的佔7.1%,單獨署名的佔1.4%。署名居中的(即:非第一、最末或單獨署名)有51%,但是不同作者之間從最少的2.1%到最多的98.5%都有。

無可否認,我們為識別高產作者所做的工作還顯粗糙。但其主要目的是提出更高層次的問題,即署名意味著什麼。

無可避免的是,署名是否合理與何為合理對每個作者和每篇論文都有所不同,而不同領域裡的標準也不一樣。很可能有人通過作弊、脅迫或人情獲得署名。我們不可能在數據中評估這些情況。我們也沒有閱讀論文的貢獻聲明——未包括在Scopus資料庫內。無論如何,即使是貢獻聲明也可能有人作弊,或者不甚準確。

目前而言,還需要進一步的工作來使這些數據達到最佳的標準化水平。例如,根據學科、研究方向或特定的研究團隊進行調整。

作者怎麼說

為了更好地理解署名規範,我們向2016年的81名高產作者發送了電子郵件問卷,詢問他們是否符合所有四條溫哥華標準。在作答的27人里,大多數說自己不符合(見「問卷調查」)。幾乎所有回答者都來自於美國或歐洲的研究機構。唯二來自於其它地區的作答者都說自己在大多數論文里都不符合溫哥華標準。問卷可能低估了不符合溫哥華標準的佔比。

問卷調查

問題:你有多少署名論文滿足醫學領域的四條署名標準?

2016年的81位高產作者中有三分之一的人作了回答。在這27人里,19人承認他們逾25%的論文至少不滿足其中一條標準。11人說他們逾25%的論文至少不滿足其中兩條或更多的標準。

? 標準一:對研究的設想或設計做出了重要貢獻;或是收集、分析或解讀了論文中的數據(27人里有9人承認僅有不到75%的論文滿足這一標準)。

? 標準二:起草論文,或對其中的重要知識內容進行了關鍵修訂(27人里有9人承認僅有不到75%的論文滿足這一標準)。

? 標準三:審核最終發表的論文版本(27人里有3人承認僅有不到75%的論文滿足這一標準)。

? 標準四:同意為論文的所有內容負責(27人里有14人承認僅有不到75%的論文滿足這一標準)。

不是所有作者都審核了自己論文的最終版本,但是都認為這麼做是署名所必須的條件。59%的回答者(27人中有16人)說自己在2016年發表的論文里,自己的貢獻比其他署名作者貢獻都高的論文佔25%以上。

問題:用你自己的話說,你認為署名的標準應該為何?

對於這個問題的回答基本可以總結為「做出重要貢獻」,但是也反映出了關於署名權歸屬的不滿之處。一位科學家說:「我個人不會把這些論文認為是『我的論文』,也不會寫到我的簡歷里,因為『署名作者』和『團隊全員署名』之間還是有區別的。」另一位作者指出,署名經常和資歷掛鉤。也有作者認為應當有更清楚的區分:「我認為署名應該分等級——而不是通過署名順序默認出的等級!」

一個有趣的觀察方向是,標註貢獻的新方式對署名標準會有什麼樣的影響,例如數據引用或正式的作者貢獻分類。署名標準在同一領域內甚至同一團隊內都會有區別。例如,傳染病學和心臟病學的一些團隊顯然在署名上就更大方,其他團隊就採用更嚴格(可能也更合適)的署名標準。

對於同樣的任務和貢獻,某個隊列研究可能會給20人署名權,而另一項研究就只給3個人,甚至一個人都不給。例如,全基因組研究通常會包含幾十名作者。但有一個驚人的反例,最近有一篇全基因組論文只有一個作者看起來這名研究員做的工作量放到其他團隊發表的類似論文里能讓十幾個人拿到署名權。一些證據顯示,平均每篇論文的作者數量出現增長,其中體現的並不是團隊里需要更多科學家做工作,更多的只是「不發表就出局」的壓力所致。

常用的引用數和影響力指標都應當做出相應的調整。例如,如果增加更多作者會使每個作者的貢獻度縮水,那麼不必要的多人署名就會減少。我們發現,在似是通過共同署名獲得好處的30名高產作者里,有6名心臟病學家和24名流行病學家(其中包括研究群體遺傳學的)。(這些科學家的H指數相對於按共同署名調整過的H_m指數的比值較高。)

總體而言,這些高產作者可能包括了一些最為活躍和優秀的科學家。但是,這種發表論文的模式也可能反映了學科中的特殊規範,甚至更為嚴重的現象。對署名權的定義過松,以及將對研究者的評價簡化為數論文都會影響到論文的署名。我們仍然需要根據各學科的規範,具體考察每個科學家的總出版產出。當然了,最有效的還是去讀讀這些論文,理解作者到底做了什麼。?

Nature|doi:10.1038/d41586-018-06185-8

Thousands of scientists publish a paper every five days?

www.nature.com圖標

原文發布在2018年9月12日的《自然》評論上,作者:John P. A. Ioannidis(斯坦福大學醫學教授), Richard Klavans & Kevin W. Boyack( SciTech Strategies公司研究者)


版權聲明:

本文由施普林格·自然上海辦公室負責翻譯。中文內容僅供參考,一切內容以英文原版為準。歡迎轉發至朋友圈,如需轉載,請郵件Chinapress@nature.com。未經授權的翻譯是侵權行為,版權方將保留追究法律責任的權利。

? 2018 Springer Nature Limited. All Rights Reserved


推薦閱讀:

2018谷歌學術期刊&出版物排名公布:CVPR擠進前20
期刊投稿前的小技巧
期刊影響因子介紹及查詢
SCI論文全攻略之審稿回復實例
期刊的分類方法

TAG:論文 | 發表 | 學術期刊 |