論文被scoop(搶先發表)是怎樣一種體驗?

同病相憐者有嗎?後來呢?


我有一次被 100% scoop 的經歷,好在不是論文,但這次經歷讓我感觸很深。

2015 年下半年,有一件事牽動著所有留美中國學生的心 —— STEM OPT 延長的聽證。簡要敘述一下事件的前因後果:OPT 是留學生畢業後在美國開始工作時所需的簽證狀態,在此期間可以排隊抽籤以換成 H-1B 工作簽證,若抽不中,則 OPT 到期後只能回國。OPT 的時長,對於一般的專業來說是 12 個月(只有 1 次抽籤機會),對於 STEM(科學、技術、工程、數學)專業來說是 29 個月(有 2~3 次抽籤機會)。2015 年,有人舉報國土安全局實施 OPT 政策的流程不合法,缺少聽證的程序,國土安全局被勒令補充聽證。聽證在 2015 年 10~11 月舉行,趁此機會,國土安全局也提議把 STEM 專業 OPT 的時間由 29 個月延長至 36 個月(有 3 次抽籤機會)。

所謂聽證,就是開了一個網站,大家可以上去寫評論支持或反對,聽證得到的民意對於 STEM OPT 是將延長至 36 個月還是縮短至 12 個月有重要影響。顯然,STEM 專業的留學生們是全力支持延長的;但不少美國人發表了反對意見,認為留學生們搶佔了他們的工作機會;也有少部分非 STEM 專業的留學生反對延長,不患寡而患不均嘛。當時留學生對聽證的關注程度,不亞於今年的美國大選。

但是,聽證網站上只接受文字評論,並不像淘寶那樣還有「打星」的功能;一條評論是支持還是反對 STEM OPT 延長,必須要閱讀文字才能知道。於是我便有了一個想法,想通過自然語言處理(NLP)的手段,統計一下網站上的上千條評論中,到底有多少支持,多少反對。為了更全面地揭示評論的分布,我還想統計一下支持與反對的勢力隨時間的變化,以及各個族裔的不同態度——怎麼才能看出一條評論是來自哪個族裔呢?評論都是實名的,中、美、印等族裔的姓名特點還是很鮮明的嘛!

於是 11 月的某一個星期,我使用 Stanford 的情感分析工具包,開始了上面這個小項目。不幸的是,Stanford 的情感分析工具包是在「影評」上訓練出來的,而影評跟聽證評論所用的辭彙偏差很大,我沒能做出理想的結果。與此同時,CMU 的另一位同學,利用手工選取關鍵詞的方法,成功地完成了我想做的每一項任務。他寫出的報告在這裡:OPT Extension的Comment都在說什麼? - 美國天空的新月 - 知乎專欄,其內容跟我的設想 100% 重合。看完後我的感受只有一個字:。這件事印證了 LTI 流傳著的一句名言 ——「fancy 的 model 不 work」—— 有很多時候,反倒是最笨拙的模型,才最適合手頭的任務。

當然,上面只是一個小小的課外項目,並不是博士論文,所以被 scoop 了也沒有感覺多麼慘痛。在論文方面,我也有過一次被近似 scoop 的經歷 —— 2014 年的 SLT(spoken language technologies)會議,我投的論文被拒了,但有一篇跟我的論文內容高度相似的論文被接受了。這當然不是抄襲,只是巧合。後來我那篇論文又輾轉投了 4 次稿,均被拒,最後感覺其內容明顯落後於時代了,就不了了之了。當然這也只是一篇普通論文,勝敗乃兵家常事嘛。

我現在正在做的博士課題,芬蘭有一個組也在做,而且他們在這個課題上比我有更悠久的經驗。這對於我來說是一個激勵:要想不被 scoop,就必須抓緊出成果,才能在這個課題上立足並佔有一席之地。


Scoop這種事情,感覺也分「良性」的和「惡性的」. 所謂「良性」Scoop,就是說兩個組(幾乎)獨立地沿著某個思路做東西,一方先做好,發了. 另一個組也只能感嘆技不如人. 「惡性」 Scoop就是一個組從另一個組那裡竊取idea,搶先發出文章.

我自己沒有被Scoop的經歷,但是知道一些惡性Scoop的例子. 聽的是某失意發考題的酒後之言...為了避免被他的同行猜到,這裡就不透露任何他/她的個人信息了. 以A代替.

大概的故事劇情:這個發考題A曾經想到了一個很新穎的範式,安排組裡學生初步做了預實驗,結果喜人。正好有一個大會議在前,就把這個範式以及預實驗結果放到了會議演講的最後。不料此事引起了某大研究組的注意,回去之後立馬開始安排做實驗。大組運作效率高,硬是搶在A之前把實驗做完,把文章寫完發出來了.

A吃了大虧,但也沒處爭辯 - 因為大研究組只是用了他提出範式的核心內容,許多細節完全不同;會議上的演講說出來也沒什麼力度,人家可以說,受此演講「啟發」;大研究組勢力範圍大,也沒人閑的沒事去得罪他們...

他的sub field偏實驗,所以有時候一個精巧的範式就決定了出品的等級. 感嘆一下academia欺凌的可怕.


匿名因為不知道對方實驗室有沒有在使知乎的。

背景,國外實驗室小PhD一枚,被Scoop的是我師姐。
非常惡性的Scoop,之前來我實驗室短期交換的博後偷了我師姐文章的idea回去,三四個月內先後發了兩篇文章,加起來影響因子都近50了(生物期刊有一篇還是CNS那級別,你們懂)。師姐那時候五年級PhD了面臨著畢業+找工作,想想這打擊有多大吧。

那時候我還在那個實驗室輪轉,雖然和我沒什麼關係,但是Scoop她課題的那個實驗室老闆和博後都是中國人,搞得我特別尷尬,那時候英語也不是那麼太流利連安慰都不知道該怎麼說。倒是師姐對我一點隔閡都沒有,我後來進了實驗室順著她的課題往後做也各種傾力幫助,非常感動。

另外,現在師姐終於要投自己文章了,延遲了一年畢業。不知道以後影響會怎麼樣。但是那篇文章很棒,我也真心希望師姐日後的發展能夠順利不要再有這麼大波折了。

學術界本身存在競爭是正常的,我也不止一次看到CNS同一期連著兩篇結果相同過程方法幾乎沒有太多重疊的文章。話說回來良性競爭我認,想法不如人速度不如人而已。這樣惡性的事件,哎。。。只能以後自己盡量多個心眼了。


知道論文被搶先發表的第一時間心裡必然是拔涼拔涼的

知道的方式有很多種, 最悲慘莫過於從審稿人那裡得知

後續的情緒有很多種, 最開心莫過於下了全文發現有明顯的差別

成文時多一篇參考文獻罷了

再補點乾貨. 如同論文被scoop(搶先發表)是怎樣一種體驗? - 漆松的回答以及大部人的回答, scoop有良性和惡性之分, 我來補個醫學類的惡性的scoop.

認識的一個年輕的研究員A跟他的BOSS一起做了很多論文的工作, 同時也邀請了加拿大某大學的一名副教授C加入工作.

儘管C在論文里沒有多大的貢獻, 但是作為Co-author, 他是可以獲得論文初稿, 也可以獲得A與他的BOSS以及其他Co-author對論文的討論.

C私下偷偷利用郵件里的初稿以及討論思路寫了一篇思路一樣的文章進行投稿, 就在A定完稿準備投柳葉刀的時候, C的文章已然發表在BMJ上.

由於有了思路相似的文章, A的文章甚至也沒法發表在四大刊的子刊.

當A的BOSS質問C的時候, C表示非常抱歉, 但是自己學校系主任知道這篇文章後, 要求他發表, 而他無法拒絕...所以公然剽竊了這篇文章搶先發表.

A也有點累感不愛, 也不想去爭執, 只有盡量讓自己原始文章發到一個比較高IF的雜誌...

這些是我從A的BOSS里聽來的. 大家邀請Co-author的時候真的是要帶眼識人啊...


我男朋友 上個月把他嘔心瀝血寫完的一篇文章投到了一個影響因子很高的雜誌上 本來他和他導師對這篇文章是很有信心的 因為他們在投稿前 還事先給3,4個領域內的學術大牛看過 反饋都不錯
結果 被秒拒了
從點擊submit按鈕到收到被拒郵件 不到一個小時
編輯還發過來了另一篇論文的鏈接 這篇論文和我男友的那一篇的idea幾乎一模一樣!
而且才剛剛發表不到一個星期!
我想我男朋友的內心是崩潰的。。。
但是又能怎樣呢
因為是異地戀 所以我也不知道他那幾天具體是個什麼狀態
他只是說 他想休息幾天 這幾天不想工作了
作為學霸 他這種行為異常詭異

後來隔了一天 他就重整旗鼓 繼續去修改他的論文了
雖然idea很像 但是兩篇文章用的數據畢竟不一樣 雖然不可能發表在頂級雜誌上了 但是通過略微改變數據分析方式 增加一些另一篇文章結果中所沒有覆蓋到角度 我男朋友的文章還是可以投到另外一些雜誌上的。。。

其實 只要文章寫得好 有乾貨 總是會被發表的 但是作為苦逼的博士生 想要按時畢業的話 就要不停地追趕時間 重新做數據分析 再修改文章 就很花費時間
而且 他們學校變態地要求發三篇文章才能畢業。。。喪心病狂。。。


非本人經歷 是和我關係特別好的一名老師的真實經歷 寫出來和大家分享一下
老師當時研二快結束的時候準備發文章 當時實驗已經做的差不多 發的文章也就4左右的影響因子 就像大多數的搬磚工一樣 小小的文章女生混個畢業已經非常知足 然而幾乎就在馬上投稿的時候 被愛爾蘭的某實驗室發表 90%的相似度 對方發的也不高 也是在4左右的影響因子 結果我老師跳河的心都有了 抱著媽媽哭了一夜雙眼第二天都快失明了 然後找了導師做出了一個決定 讀博
老師讀博的時候還是做原來課題 由表層做到了機理部分 最後博士延期一年 發了頂級雜誌的子刊 留了校 現在成為了一名副教授啦 前幾個月老師去歐洲有一個會議 意外的碰見了愛爾蘭實驗室當初那篇文章的作者A A見到我老師特別的開心 特別崇拜 因為我老師發了那篇文章後 A的導師就一直批評A為什麼想不到這樣子做當初為什麼不能發的更高影響因子吧啦吧啦吧啦 回國後到現在了他們還一直用郵件聯繫著 我老師為A提供了好多方法和思路 曾經的對手竟然成了朋友

可是誰曾想過A當初是讓我老師置之死地的人
可是也是A的出現讓我的老師變得更加優秀


遇到過這樣一件事情。
一個phd在科研期間獨立搞出來一個結果,然後去找老闆,被老闆告知不要發表,也不要發arxiv,讓其繼續往下深入做。隔了一年,老闆的另外一個學生髮表了一篇一模一樣的內容,到最後那個phd還要引用另外一個學生的文章。


If you see new work that seems to be doing exactly what you"re working on, don"t panic. It"s common for graduate students to see a related piece of work and think that their topic is ruined. If this happens to you, reread the paper several times to get a good understanding of what they"ve really been accomplished. Show the paper to your advisor or someone else who"s familiar with your topic and whose opinions you respect. Introduce yourself to the author at a conference or by e-mail, and tell them about your work. By starting a dialogue, you will usually find that their work isn"t quite the same, and that there are still directions open to you. You may even end up collaborating with them. Good researchers welcome the opportunity to interact and collaborate with someone who"s interested in the same problems they are.

----《How to be a good graduate student》 Marie Desjardins


很不爽。但在學界,大家都不是傻子。你能想到了,別人很多肯定都能想到,到頭來就是比效率比工作強度了。。。


研二時候東西已經做出來了,老闆重度拖延症活活拖了一年讓uc berkeley一個組發出來了。領域還是老闆本行,全世界也就四五個組做,人家只是玩票。

後果就是我徹底滾粗學術圈了……辣雞遊戲毀我人蔘


真實經歷。
投的一篇期刊文章,總共三個審稿人,其中兩個第一審小修同意錄用。只有一個審稿人,提了幾個不痛不癢的問題,然後一直要求修改,總共改了3輪,歷時9個多月。
改第二輪時突然對我方法中的幾處細節提出無厘頭質疑,建議(要求)我修改。我提供了原始代碼並對比了他建議方法的劣勢。
第三輪時候建議(要求)我引用三篇文章,我一看,其中兩篇均出自同一實驗室同一導師,另一篇合作作者亦是此實驗室的人,於是秒懂。關鍵是這三篇文章與我文章的內容關係不大而且文章水平說實在的真的很呵呵。無奈當時已精疲力盡於是引了其中一篇。
第二天中午收到回復,文章錄用。

你以為這就結束了嗎?
一個月後CVPR結果出來,發現有一篇文章的方法與我原始內容幾乎完全一致,改了個名字,做了些包裝,連公式都幾乎一模一樣。而此時我的文章還未見刊。

不想指名道姓了,國內top5某大學某實驗室你們真牛逼。全世界我就服你們。


10月4日更新

是鄙人才疏學淺了,在科研的深坑裡走的還不夠遠,沒想到這種 「背靠背」 在學術圈並不是一種罕見現象……不知道這本期刊的審稿人在peer review 期間是否對此有所操控,如果不是巧合的海,那其中的過程真是細思恐極。大家權當是個背靠背的例子看吧!

-------------------------------------------------
不是博士生,沒有論文被scoop的經歷,如果有的話應該是很吃鱉的感覺……但是可以給大家看一個讓我一直很驚詫的例子。

看到題主的所在大學和項目,發現您和我前老闆是校友。這兩篇paper算勉強和您的領域沾邊吧。這是我們前幾個月組會的時候journal club討論過的論文, 截圖如下:

對原文感興趣的,鏈接在此:

Table of contents : Nature Genetics

這是發表在2016年1月份Nature genetics 的文章,發現了么?同一本雜誌同一期發表,頁碼都挨在一起,兩篇有關ruff 的,並且都是genetics underpinning reproductive strategy的文章,連這期雜誌的封面都是這種流蘇鷸。仔細看的話,兩篇文章分別在2015年7月1日和5日被收到,10月1日和16日被採用,然後就發在了同一期……而且兩組作者的掛靠單位沒有任何重疊,看起來就是毫無關係的兩組人……

所以題主不要擔心,別說是不同物種,哪怕就是同一物種,同一題材,相差五天交到同一篇雜誌,只要模型選得夠好,課題立意定得夠強,都能發!


對不起,我從來不會有這種事情發生。我做的項目都是極其開創性的。我的成果不發表或者泄露出去,別人根本不會想到。

我做實驗第一原則就是不跟風,跟著人家走還想超越別人。too simple


之前關注了這個問題,現在也來強答一發吧。

最近剛有一次被scoop的體驗,也是深度學習/計算機視覺相關的。其實就是暑假倒騰了一段時間cyclegan,加各種task loss end to end發現在實際應用效果挺好的。但是我和mentor都覺得這個也就是一個extension估計很難投頂會,所以一直在想有什麼東西能夠創新的。我後來覺得要從模型本身下手也就是要完全拋棄cyclegan,直到有一天靈感來了想了一個類似autoencoder的結構不過是one-way的。第二天mentor跟我視頻,說他有個挺有意思的idea,一說也是類似autoencoder的cyclegan,但是基於cogan而且可以做成two-way的。我一聽就覺得很巧,而且idea很有趣,於是兩個人都很開心地打算加班加點把實驗做了 cvpr投了。

然後接下來一個星期我就把代碼寫了參數調的七七八八至少視覺效果上比cyclegan有好沒差了。其實這也是得益於之前的積累因為搗鼓cyclegan還用tf重寫了代碼所以對裡面的細節也很熟悉。正準備把結果給mentor說一說商量一下取個什麼**GAN的名字再把paper寫了,mentor給我發了封郵件說bad news: scooped。我一看,是今年nips的paper,和我們idea 99%是一樣的。雖然真正從有idea到做完實驗到發現scooped只有一個星期也沒什麼太大的浪費,但是當下心裡很是非常沮喪。

說說我的感覺吧,其實雖然我做research不怎麼樣,但是什麼樣的paper能中什麼conference還是有點X數的。之前發的幾篇頂會結果出來前都沒太在意因為知道應該會是poster。我的經驗是一篇paper雖然最好要簡單,但是至少有一兩個不是那麼顯而易見的點(需要一點tweak才能想到)這樣中頂會的概率比較大。而這一兩個點是需要大量積累(做一個問題做很長時間比如說這次搗鼓cyclegan,之前搗鼓context encoder)而且要靠運氣才能想到的,所以也不是很容易。這次這個idea雖然可能不會有cyclegan的impact,但是我覺得中頂會的實力還是有的,所以被scoop了還是非常可惜。

另外夾帶點私貨就說我對research其實沒什麼太強的opinion。我跟有的朋友說我在做gan,有的會說不是那麼useful或者太empirical。我覺得大家做research已經不容易了,其實大部分paper最大的作用就是對author的career的作用,投個頂會去開會旅遊開心就好,根本沒必要要求每篇paper都ground breaking。之前看起來useful的sift,hog,dpm現在不也都沒什麼用了所以要登月到底是在爬樹還是在造火箭在登上月亮之前誰也不知道。deep learning也不一定就說是真正的火箭。所以我一向是寧多勿缺,自己paper有一兩個不明顯的tweak能中個poster也很開心了。其他的就可遇而不可求。

之前基友經常跟我說被scoop我就會開玩笑說誰叫你選了一條research這麼不rewarding的career path,但是這次我也免不了找advisor哭訴了一下(其實內心os是嘿你看我也是自己做的不如你就讓我把這個寫成thesis吧)。不過我覺得抵抗research無聊的最有效的辦法還是去吃好吃的然後買買買慰勞自己這不買了個watch3然後立馬又活蹦亂跳了嘛~

Update: 把代碼開源了:leehomyc/Img2Img-Translation-Networks 也算一點微小的貢獻吧。


我今年被良性scoop過。上半年自己獨立做了一個project,我自己感覺方法挺新穎的,也已經跑出很好的結果了,結果跑出結果後我自己做其他project去了,一直沒時間寫文章,上個月準備起個草稿投今年CVPR的時候發現有人在arxiv上面掛出來一篇思路,方法和結果幾乎一模一樣的文章。

教訓:
1,沒事不要摸魚
2,有什麼事文章寫出來趕緊掛arxiv了再說


有了想法趕快做,做出來結果了趕快寫文章,寫出來文章了趕快投出去,投稿感覺不順利的話,就抓緊時間掛到arXiv吧


Scoop這種事,好想@牛頓萊布尼茲,牛頓胡克


暫時沒有碰上scoop,但是曾經聽以前的一個老師提起過他碰上的另一種很心酸的情況。他當年投了一篇到science去(老師本人是搞海洋和地質的,具體他當時那篇文章做的是什麼我不記得了),然後被拒了,再然後他就聽說美國人的一篇跟他幾乎一樣的paper被science給要了。從那以後他簡直對那篇文的作者和science一生黑,一直抱怨連個同時發表的機會也不給他……


一篇 Review paper 磨磨蹭蹭花了兩年寫出來,在自己複審過程中發現一篇類似的review paper 提前發表了。

裡面的具體討論的主題,圖表的排列方式都極其類似。。。

馬上把論文交給導師看一下,導師也感慨:討論的幾個重要主題幾乎相似,還有,那個圖表類型實在是太像了,格式排列都像!!!

這篇論文第二作者是美國能源實驗室的,以前導師也在那邊工作過。不得不感嘆:老美的學術格式不變,都是批量生產!!!我後期修改圖表都是按照導師建議修改的。。。

我最近也在發表自己的review文章,搞得我一下緊張了,一心做自己的論文,這篇論文就不看了。

反正呢,同樣的主題,不同的人必然會有不同觀點。。。我寫的風格也截然不同,照樣投出去發表!!!

ps:本來之前也投了同樣的journal,後來人家說 review paper 作者必須是expert 才能發表,我一phd 就放棄投這家 journal。。。


大四狗
就在剛才,一個同類型的idea被scoop了……

現在還在備研階段……文章初稿已經完成了……知道這個消息的這一刻我哭了出來……怎麼辦……我還大四,內心很不是滋味,就像一場大雨澆頭而下……木訥獃滯……


推薦閱讀:

怎麼集中精力寫論文?
搜索學術論文有哪些高效或獨特的技巧?
如何更好地閱讀英文論文?
中文生物學期刊存在的意義是什麼?
如何開始一篇學術論文的寫作?

TAG:科研 | 博士 | 論文 | X是種怎樣的體驗 |