隨著審核難度提高,數學論文的正確性會不會越來越靠自覺?

最近因為research,讀了一個美國Prof(如果沒記錯是休斯頓大學)和他的學生合寫的paper,發在MathSciNet收錄的期刊(具體名字忘了)。裡面核心定理的證明完全是錯的。論文證明了A=f(n)(n^2量級)這個公式,然而我發現了三個反例,一個A&>f(n),一個A&

其實我可以接受數學論文的證明有bug,因為誰都會犯錯。但是這篇文章的證明是完全沒有道理的,我在閱讀原文的證明時發現論證的關鍵點全部用「可以得到,容易算出」這種話帶過。我想大概這篇paper一開始的寫作初衷就是矇混過關。

當然很可能這篇文章是那個Prof的學生為了畢業亂寫的,然後Prof並沒有認真檢查,審稿人沒有嚴格的follow計算過程導致的。其實可以理解,如果不是完全做相同領域的審稿人,完整的檢查論文的每一步計算太浪費時間。不過現在數學論文的正確性真的要憑作者的良心和自覺了嗎?


謝邀。

「證明沒有道理」這句話簡直說到我心坎里去了。最近在讀我老闆以前的學生的thesis,裡面有些論證我覺得很莫名其妙。最嚴重的一個地方是這句話:「there is no representation neither of O(2) nor Pin(2) on O(3) with isotropy SO(2).」 我就想怎麼會沒有這樣的表示嘛,取O(2)在 mathbb{R}^3 的標準表示就行了嘛。。前幾天見老闆也問了這篇thesis裡面的問題,他當時也表示沒看懂,要回去仔細看一下。

其實吧,我不知道是微分幾何這個學科的特色還是怎麼樣,很多地方的證明我感覺都是hand waving;可能是因為論證過程太繁瑣了,又經常是分類討論,所以作者懶得把細節寫出來。微分幾何裡面一些計算很複雜的論文非常難讀,而且其實你也不太確定作者到底有沒有算對,因為如果你不是審稿人又只對他們證明的結論感興趣的話,基本很少自己去驗算一遍的。。所以微分幾何也包括一般的數學論文被挑出錯的幾率還是不小的。比如我在Bredon的書里看到這麼一段話:「In the differentiable case, 10.1 is generally not true and one must be careful to consider how a tubular neighborhood of the fixed point set is attached. Because of this, some of the theorems stated in Hsiang and Hsiang [4] are false, as was pointed out to us by W.-C. Hsiang.」

其實數學界現在的情況是這樣子:不同領域不同方向的人各自為政,大家不一定會關心自己以外的領域的工作到底是對是錯。比如我現在考慮的哪些問題,什麼帶某種對稱性的給定維數的正曲率流形有多少種,這種問題在微分幾何內部關心的人不對,證對了證錯了又如何呢。。當然如果是大家都知道的大問題,比如ABC猜想,那有人宣稱證明了肯定那個community的人會仔細審核仔細檢驗——所以望月新一的論文到現在都過不了審,因為他寫得又長又techinical又讓大家都看不懂。數論界的人都關心ABC猜想,而且都想知道望月的技術能不能用在別的問題上,所以他們會格外仔細。而一般的小問題,如果證明短還好,如果證明冗長繁複但是結論又並不是很振奮人心的話,大家可能就真的不在乎了。。真是證明有gap那日後再說再修正或者再撤稿吧,反正撤稿這種事情其實並不少見的。。大家不要只關注top journal,大部分論文都不是發在四大這種頂刊上面,下面的期刊出錯的撤稿的真不少見;至於arXiv這種不怎麼審稿的預印本網站,那就真得多一個心眼了。。真要解決問題我覺得可能真得靠上面有人提到的 計算機程序來進行形式化驗證,雖然我覺得這個也不好做,因為把數學論文形式化其實也是很麻煩的事情。


先抖個機靈,放個圖,來源網路,圖侵刪

說回正題,我覺得自覺、誠信是很重要,但更關鍵是學者之間的交流(QA),甚至是對不端行為的舉報。

不少搞學術的人都是很功利的,國內外都是。為了多發論文,不惜造假、抄襲。。我覺得可能這就是人的本性吧。。。從哲學層面上,人都是自私的。所以想依靠自覺,是不太現實的

另外一方面,一篇數學論文,哪怕作者認真寫,也難免有錯漏。課題越難,越容易錯。並且有時候,審核人不是相關方面的權威專家,審核容易出錯,把一篇錯誤明顯的論文放過去了。因此,論文發表後的學術交流更加重要。越是重磅的論文(例如Riemann猜想的證明),越是需要討論和質疑。不過當然如果有一些比較噁心的造假抄襲行為,就應該直接舉報了。

論文審核是最大限度保障論文準確性的是第一層防線,學者之間的交流是第二層防線。第二層防線更加重要。引用某個回答裡面說的,學術界是傳播和討論學術成果的,並不保證成果一定準確。


問題比較大,占坑。

具體這篇文章,它的錯誤可能是由於作者的不認真,不嚴謹乃至矇混造成的。但是,假定作者主觀上完全不想留下任何的瑕疵、bug,請問我們是不是就一定可以完全的相信其正確性?這是值得深思的問題。

現在數學(或者其它形式科學、自然科學)分支越來越細,實際上一個小領域,往往只有很少的一些人懂(除非是數學分析這種比較基礎的課程),這就導致實際上有能力審查的人的絕對數量,其實是比較小的。另外,具體個人審查也是會有錯誤的,不能保證百分之百沒有錯誤。這種公開發了的論文,含有錯誤而沒有被發現,有時候會引起災難的後果――有可能有這種情況:後來某個人的重大問題關鍵依賴於此結論,到時詳細審查時才發現這個錯誤,這個後來者的工作就白做了。歷史上,參見張益唐博士論文,就是類似的情況。

另外經過多人審查的論文、書籍,也不一定就真的沒有錯誤。我就曾經發現上學時候的數學分析教材有錯的地方。

論文有沒法查出來的錯誤,原因之一是:論文不夠形式化,或者說不夠充分的形式化,無法讓程序來驗證。

未來的數學研究,我設想應該是這樣的:每一篇論文的核心推導步驟,必須有基於某個邏輯系統的形式化證明,只有當此證明經過多個廣泛接受的多個proof asdistant驗證過之後,此論文才算完成,它的結論才被大家所普遍接受。(當然,核心證明,沒有形式化,不等於說該文無意義,只是說此論文只是半成品而已)。

為了這一點,計算機程序方面的挑戰與工作量也是有不少的。


無意識的錯誤,在論文中很正常。被發現了,會努力修正,發個Errata。

故意隱瞞的錯誤,已經發表了,不要臉你能怎麼辦?胡編亂造的論文我也遇到過,而且還有後續結果發表。

有次審稿,發現一個錯誤,修回又改了個錯的。最後發沒發出來我也不知道,反正我的意見是修回。

個人認為雜誌級別和審稿態度正相關。然而,計算過程實在無能為力。

許多文獻大家只是引用結果,複雜的證明過程,應該沒什麼人讀過。所以,還是要靠作者的良心和運氣。


既然題主能發現作者的錯誤,說明學術論文的交流功能就達成了,可見學術界依然存在。


我的觀點是:發表論文是為了傳播學術成果,並不能保證「成果」一定經得起考驗。在拿他人成果作為自己的研究基礎之前,小心驗證其對錯,是基本要求。


取消論文發表機制,所有文章扔到arxiv這種地方大家自由討論,金子自然淘出來,以發論文為驅動的研究也就吃不上飯。歷史上大科學家作出成果來不是為了發表論文的,甚至根本就沒有發表,後人覺得研究有意義會花時間去整理這些人研究筆記里零零碎碎的東西。比如戴克斯特拉所有論文都是鉛筆手寫,沒有引用沒有背景介紹,只給幾個學術界朋友看看就收起來了,東西真正有價值的話所有形式主義的東西都是次要的。科學本來就應該是小眾的東西,現在搞的和大鍊鋼鐵一樣是走錯路了。


我覺得有必要對論文中出現的錯誤做一個分類,可以分成以下三種:

1. 常見的格式,語法,計算,引用錯誤

2. 方向性錯誤,比如把一個不怎麼的東西吹得天花亂墜,把根本沒意義的問題包裝成看起來像一個新問題,文章的結論錯誤違反基本科學定律

3. 學術造假

一般來講,我審稿子如果2,3不出現問題,我不會據掉,即使文章中其他錯誤遍地都是。相反如果出現2類錯誤,文章再工整仔細,語言再流暢我都不會同意接受。文章的學術意義是有沒有提出或者解決一個新問題,而不是像中國學生考試大家比正確率。一類錯誤對初學者影響計較大,但是對經驗者來講,這些問題往往一目了然,現在學術界典型的問題就是混進了太多的初學者,這些人對文章方向性的問題不敏感,審稿時候反覆糾結一類問題,反而因為自身的水平沒法察覺更大的問題,感覺這個應該和中國的考試教育有關。所以現在很多時候不但是作者有問題,審稿人本身可能問題更大。兩邊都有大概率出問題的情況下開放討論提高透明度是唯一的方法。

學術界變成現在這個樣子也就是最近三十年的事,大量發展中國家出現了大量以移民為目的的留學生,發達國家本身由於片面追求大學入學率多出太多不應該有的發考題,兩者同時改變了學術界的遠有面貌。現在知乎上到處都是烏煙瘴氣的「教你如何寫論文前言」,側面說明學術界問題的嚴重,不會寫前言的問題無非兩種,要麼你根本不知道自己在做些什麼,要不然就是你知道自己在製造垃圾,但是不太清楚怎麼去吹牛逼包裝問題。兩者都是比文章中出現計算/語法錯位嚴重數百倍的問題。很久以前的學術界不是這個樣子的,比如50年以前的英國皇家學會會志,幾乎每篇文章都非常有意義,解決了了不得的問題。現在你讀一下午頂級期刊,發現好幾百篇文章基本都是吹牛逼,讀的頭昏腦脹完全是浪費時間。


我覺得會,這學期上代數編碼的討論班 讀了不少文章,因為是應用數學的文章不是像教科書上那種循規蹈矩的推導,作者自己會定義一大堆的本文的「專屬名詞」,「專屬引理」,跳很多步,看的人云里霧裡的,有時候論文里甚至都沒有對這些名詞做出解釋,有次遇到一個莫名其妙的映射,作者只是說根據此映射,我們可以balbalab.....我看不懂就請教了導師,結果他也沒看懂,所以這些細節對於審稿人的挑戰也很大,很多時候審稿人是根據經驗來驗證結論,但是細節出錯可能就很難看出來了。據導師八卦,本方向以前有個神人專門寫文給別人的論文「挑錯」,結果很多雜誌都拒絕出版,英語學術圈已經將此人拉入黑名單,目前去日本學術圈混了,發日文雜誌....


不會,有些數學論文里的gap作者自己未必能知道&<(`^′)&> 。


是的。我看過有sci算的是錯的。審稿人不會費勁給你再算一遍,只會看大體流程。


如果還這麼審,而不通過其他方式去改變的話,按概率來算,數學的大廈終究會從某層開始崩塌。
主要存在兩個問題
1、一些分支研究的人太少,數學知識無法傳遞(失傳),對與不對僅僅由這幾個人決定(容易出錯)
2、數學問題越來越複雜,需要的知識基礎越來越龐大,往往一個問題就需要一個人一生去解決,甚至幾代人去解決,數學的發展越來越困難,即使發展了,也極少有後人能懂了。

這些問題的出現是首先因為數學實在發展的太久了,而且是無數先賢的智慧結晶,它會越來越難理解。而輔助的數學工具又無法再改善目前的現狀。

其次,實際上數學語言從來都不規範,每個定理都沒有固定的統一的形式化模式(比如這個一個定理的引用,因為×××,所以×××,而這個×××裡面的東西除了變數,其餘都是不準變更的),而大家都是你有你的表達方式,他有他的表達方式。最重要的,人類語言本身就不符合公理體系,因此通過人類語言去表達的數學也必然會出現不符合公理體系的問題。

然後,很多細小的邏輯問題連大師都可能犯錯,每一步都要斟酌邏輯關係(步驟太多)。

然而程序化又很困難,因為現在的有些定理和定義不是程序化的或者說即使是程序化計算機也無法使用的。比如極限的定義里,你要證2x/x在0處的極限是2都很困難,因為人知道答案是2再去驗證,而計算機無法從所有的實數已中找到2這個數,再根據定義去驗證。

一個更加科學的、統一的數學體系應當建立,也必將建立。


組合數學 博三 方向圖論

過去幾年內交了好幾篇 也申了好幾篇,在審稿意見中最常見的話就是 「我沒一步步檢查證明,但我覺得是對的。」可能這個方向比較特殊吧,只要給出圖,基本一眼就能看出對錯了。至於細節上的計算,即使算錯了關係也不大。

不過我也發現過已經發表的論文和完成答辯的博士論文裡面的計算錯誤,不過講真都不是大問題,能構造出來才是關鍵。

還有,即使有錯,也不太可能是作者故意,或者是有什麼學術不端的貓膩。畢竟有些細節上的計算不是每次都能一遍算對的。


確實有不少有問題的。後續發展分兩種情況:一種是文章很一般,沒什麼人看,所以也就不了了之;另一種是文章很重要,看的人很多,所以問題很快會被人發現,但這類錯誤通常都不會影響最終結論,原作者也不一定會改,尤其當原作者是著名數學家的時候。不過,如果是根本問題,原作者還是要改的。

所以我的結論是,文章千古事,最終審判權還是在歷史的手裡,好的寫進教科書,壞的丟進垃圾桶。


太可怕了。曝光/舉報學術不端才行。學術規範的建立,一部分靠自覺,另一部分靠舉報。舉報後一個人的學術生涯就可以結束了,因為他的信譽喪失了。

不是學數學的,不好意思實名,因故匿名。舉報很重要,因為生物行業就是這麼做的,沒有一個外人事先知道實驗是不是造假。否則也就不會出小保方晴子那樣的事了。小保方晴子一直到別人重複不出來,舉報,才被調查。

如果這個是博士論文,舉報後,他的學位應該也可以撤銷了。只是不知道指導老師會如何處理。

指導老師沒時間審稿人沒時間根本不是借口。如果博士生造假導致每一個環節都放過他,首先指導老師肯定有其他問題,發表機構肯定也有問題,這個很可能不是孤例。應該舉報使得有關人員接受調查,讓第三方(比如校方、學會)介入解決它。


重要的結果自然會有人來仔細讀仔細check every details。如果不那麼重要的結果,為什麼要在意它的對錯呢?證明那些不怎麼重要結果的文章本來就不值得好的數學家花時間去讀,更不用說驗證了。


推薦閱讀:

如何選擇合適的paper?
Springer Nature 宣布撤回 64 篇論文是怎麼回事?為什麼同行評審報告能被偽造?
Paperpass和維普哪個查重更靠譜?
如何有針對地高效地閱讀一篇學術論文?
發表頂級論文是怎樣一種體驗?

TAG:數學 | 科研 | 學術論文 |