中外學術界都有哪些基本的制度、流程和手段,來預防和處理研究中的不可重複和數據造假?

韓春雨事件前兩日以撤稿告一段落(如何看待韓春雨於 2017 年 8 月 2 日在《自然-生物技術》正式撤稿論文《NgAgo基因編輯》?)

面對學術研究中的結果不可重複和數據造假問題,學術界的「自凈手段」,通常都有哪些?根據國際慣例,從發現可疑的研究,到最終調查清楚並妥善處置,一線的科研工作者、學術出版機構、學校和研究所等主管部門、媒體和公眾,分別都可以做哪些工作,扮演怎樣的角色?這樣的分工和角色,會不會因為學科和國家不同而存在差異?


謝 @Yui Yoshioka 邀。

不同學科情況不同,我不敢多說啥,我單獨說說我所在的領域,有機光電材料。我們這個領域,我覺得,應該是一個很好造假的領域,並且從我的實際體驗上看,並沒有什麼反制措施。

我們這個領域包含了材料(有機化學相關)和器件(電器工程相關)的工作。

我嘗試說一下我們這個領域造假的可行選項。

材料造假的話,我舉個例子,材料純度可以造假。在有機化學領域裡,想確定化合物結構和純度,有高分辨,氫譜,碳譜和元素分析等多種選項,而元素分析對純度的要求,比核磁要高。那麼其實我只要達到核磁所需要求,核磁譜圖上沒有雜峰就可以了,元素分析的數據,我完全可以捏造,因為提交文章的時候根本不需要檢測機構的官方報告,完全可以自行編兩個數字寫上去。再過分一點,哪怕連核磁都過不了,核磁譜圖上的雜峰我都可以視而不見,甚至偽造核磁數據,因為文章里是可以不放核磁圖的,用文字表達核磁峰的位置即可過關。也就是說,我完全可以捏造化合物純度和結構的表徵數據。

器件表徵也好說,檢測數據里的電流值,也是可以隨意修改的,一方面不需要原始數據,另一方面,就算他要原始數據,我也完全可以自己編。只要合理捏造,我完全可以把器件的效率改得比實際的要高出很多,還有器件壽命之類的更是完全可以瞎寫。有的器件效率相關的數據,我只需要給出一個數值,別的數據根本不用給,造起假來幾乎完全不費腦子。

理論上說,只要我高興並且膽子夠大,我完全可以通過瞎編的方式,把大部分文章所需數據編出來。

重複實驗也不見得能揭穿造假。比如我做出了跟已發表文章一模一樣的化合物,並且以此完成了器件製備,做出來的器件性能完全可以有很大的差距。裡面可能有一些獨特的小技巧沒有在文章當中表現出來。有一些實驗室的器件性能高得令人髮指,除了他們造假和實驗室有獨特器件製備技巧等可能性以外,不同牌子不同廠家提供的原料,比如矽片,質量和厚度等都可能有差距,都可能帶來實驗結果的區別。所以你不能說數據的區別就一定數據造假。所以人家真要造假,我認為是沒有反制措施的,除非你搞得跟韓春雨那麼大件事,大家一起重複實驗並抓著你的文章懟,然後沒有一個人能做出來接近你的器件性能。

另外我記得有個例子,是JACS造假沒人發現,直到自己實驗室重複實驗做不出來才主動撤稿的,造假人的博士學位被撤銷,這個好像是發生在一位有機所的老師的課題組裡,挺出名的。

我這裡還有一個例子,我自己的,就有時候重複不出來實驗,我並不知道人家是刻意造假還是寫漏了(這個例子我傾向於是寫漏)。

那次我重複chemistry materials上的一步反應,上面的反應步驟,是架個反應,然後洗一洗,高產率得到純產物。我一看步驟心裡就覺得奇怪,這個產物不用過柱子處理嗎?但想了想,算了,先按著他做吧。做出來結果得不到純產物。當時周末跟老闆寫工作報告的時候提到了這事,我說我下周過柱子提純一下。老闆看到工作報告,懟我說這肯定要過個柱子啊,你都做了這麼久合成了,連這都不知道嗎?我說我就是看文章這麼寫想試試,我當時也覺得該過柱子啊。後來過柱子,拿到了純的產物。有趣的是,我後來查完全一模一樣的的反應,查到了其他好幾篇文章,這幾篇文章在寫這個反應的時候,都引用了我最開始說的那篇chemistry materials的文章,但是他們在引用完以後,都補了一步過柱子…………

另外審稿的時候都是以一切數據真實為基礎的。看到數據超出想像就認為人家在造假,那這稿子真沒法審了。懷疑數據的時候,最多懷疑這個數據測量過程或者別人的分析思路之類的有問題,但你不能輕易懷疑人家數據造假。連抓造假都不好弄,就更別提要預防了。


簡單的很……只要永久逐出學術圈,甚至相關人士都會受到牽連,就夠了。你知道在美國拿到教職有多難,就沒有人會冒著風險試著干這些勾當。畢竟發篇nature又如何,名校教職應該都經常發。你claim做出來諾獎級別的東西要是假的那總是瞞不過去的。總之風險和收益完全不對等。

中國的學術圈真的是非常奇怪,世界上能作參考的的確不多。


強答。

其實學術界還是窮,工業界從硬體上有很多的辦法從源頭來防止造假。

LIMS+E-Note(電子實驗記錄本)

實驗計劃通過E-note下達,操作人員執行,實驗的設計與執行是分離的,所有儀器的原始數據(包括天平、色譜質譜等)都直接寫入伺服器資料庫,用戶讀寫全部會在伺服器端留下記錄,靠這個系統就可以杜絕絕大多數的造假可能。

中科院系統也不是沒有制度上的要求,

例如每周對實驗記錄本進行核查,

原則上所有的論文發表之前都要填寫申請,申請後會有一個對原始數據進行檢查的程序,

但問題是還是窮啊,所有的管理流程都需要有人,有工時來執行的。

現在的實際就是都走個流程,過個形式而已,絕大多數情況原始數據不會真的進行檢查,全靠個人自覺。


生物界

一句話:你如果認認真真的造假,沒有任何有效制度處理

世界上造假被發現基本屬於兩種情況:

1,造假造的不認真:PS圖,舊圖新用,試驗記錄忘了寫等等

2,牛皮吹破天,吹到侮辱常識:比如日本人小保方晴子和韓國人黃禹錫


韓春雨會被拉出來打,一方面是大家對河北科大水平的天然質疑,另一方面,以一個外行的理解,韓報道的是一種基礎工具,國外團隊想重複結果,想查驗真偽事小,學會這種厲害的工具為己所用事大。也就是說,像生物領域,影響因子動輒破10,一篇論文出來,短期內會有不下三四組人馬來follow你的研究,有馬腳就容易露出來。

其實查一下歷史就知道,學術造假被揭露最多的就是生物化學領域,影響因子高,跟進研究迅速,反造假能力強悍。然而,工程領域還有大量一兩分的SCI,意味著一篇論文在兩年內只有一兩次引用,而且,這可憐的一兩次極有可能是關係組的關係引用,或看起來題目相近就直接盲狙的引用。原因也很簡單,工程技術已經是科技的最末端分支了,每個組做的東西都不一樣,相互之間去follow的意願很低。沒有follow,造假根本就沒有被發現的可能,沒人會冒著得罪人的風險去建一套自己根本用不到的系統去驗證別人的一個工程研究真或假,吃太飽。

實際上,低分工程類SCI才是造假的最大溫床,但是,連想重複你研究的人都沒有,造假根本豪無風險,或者說,大家對3分以下期刊的"合理造假"算是基本接受,只要你能用一套邏輯話術說服審稿人,哪怕論文里方法模擬實驗其實是在講三件不同的事。


說實話,明星科學家都是少數。多數人作假,其實就是為了混口飯吃。學術界競爭如此激烈,遵循winner takes all的遊戲規則,所以剩下大部分人互相為了一口飯互相廝殺。拿不到funding,拿不到日漸縮小規模的tenure,一生被毀,找不到decent alternatives繼續混下去,家庭也跟著解體。

所以與其加大力度防止人作假,不如花力氣改善科研人員的待遇來得更有建設性一點。


可以參考「小保方事件」的發展。知乎上應該有一堆相關的帖子。當時日本各種媒體鋪天蓋地全是這事件的報道。

在日本學界造假的成本很大。以這個事件為例,小保方的直繫上司因為壓力自殺,小保方本人博士學位被取消,研究的工作也被迫辭去。

和稀泥的態度不僅不適合搞科研,也不適合維護健康的科研環境。


歷史都可以造假,一個普通的科研職業就妄想沒有任何造假?

Naive!

或者你說,有哪個行業不存在造假現象?


地質行業。我覺得輕鬆可以編故事,,,

只是想編的出彩太難了


通常情況下,論文都是要求結果能夠重複的,不能復現的過程有可能存在隨機因素,即便是形成成果、發表也不太具有說服力。從這個角度講,韓春雨的研究在未形成「可信性」和「確定性」結論即付諸發表是不合適的,毫無疑問,主動撤稿才是應有的態度。


推薦閱讀:

怎樣看待方舟子和他主持的新語絲對中國科研發展的利弊?
如何優雅地學習線性代數?
學術性的文章該去哪發表?
發表人生中第一篇論文是什麼體驗?
想發電子通信類的論文,請問SCI、EI、IEEE是什麼關係?國際會議、期刊、快報又有什麼區別?

TAG:科研 | 學術 | 學術倫理 | 學術不端 |