作為入行數年的專業科研工作者,你每周看幾篇 paper ?
我挺想了解做科研的各位在看paper上是一個怎樣的節奏。
一般每周看多少篇?
粗讀、精讀的情況是怎樣的?回答時請說明自己是在哪個領域,謝謝。
背景:人工智慧,強化學習
追求數目沒有意義。讀文章一般兩個目的:
1. 看大家在做什麼,找方向。
這時候一般讀讀Abstract和Introduction,對領域有初步了解,知道它主要關於什麼,搞清一些概念的含義和聯繫。這時候不懂沒關係,多看幾篇文章就懂了。一般聰明的人這一步可以做得很快。
2. 搞清細節
找一個自己感興趣的方向精讀,把裡面的課題思路和推理細節搞明白,並且還要順藤摸瓜找到其它大量的相關文獻繼續讀下去。標準是在腦里能有對這個領域有清楚的脈絡,能做到獨立完成大部分推導和證明。一個靠譜的檢查方法是給同組的人或者導師做個講座,看他們能聽懂不。很多時候自己以為懂了,其實和別人一說馬上就露出馬腳。同時討論也可以激發新思路,說不定就能找到下一篇文章的出發點。這一步往往會花費一個科研人員大量時間,也是業餘和職業科研的關鍵區別所在。
總之分配給每篇文章的時間天差地別。爛文幾秒鐘就可以放棄,而經典文章還需要每過一陣子回頭再去看一看想一想。至於如何評判文章質量,那就得要靠長年科研積累出來的品味了。
接下來的兩個階段就不是光看論文可以看出來的。
3. 寫代碼實現別人的工作,並且改進
每篇文章都會有意或者無意抬高自己貶低別人,都存在一些有意或者無意隱藏的細節,這些不親手做是看不到的。所以得要動手花時間去實現別人的方法,想方設法達到別人的效果,然後反過來再看看文章。時間長了馬上就會學到故意隱藏的蛛絲馬跡,理解別人留白的道理。光看文章的話,這類經驗的積累要慢很多。一般說的「紙上談兵」就是指這一步沒做。
我在15年1月剛去Facebook AI Research的時候,在深度學習上還沒有實際操作經驗。交給我的第一件事情是復現VGG在ImageNet上的性能,那時還沒有BatchNorm,跑5個有2個能開始收斂的就不錯了,最後花了幾周搞定了。整個過程讓我學到不少經驗。
4. 總結經驗,融會貫通,找到並且遵循自己的方法論
重複3很多次之後,可能會覺得自己比較有經驗了。別人問起的時候也能侃侃而談,但說的往往是一些分散且孤立的經驗。並且你會發現自己很容易遺忘這些經驗,這個並不是因為記憶力不好,而是因為思路不系統。這個就需要反覆思考反覆提煉,從而形成自己的方法論。有了方法論之後,心裡就有大方向而不會隨便亂試亂撞,效率就會高很多,並且能在一個科研方向上挖很深堅持很久,而不是哪個課題熱做哪個。在指導別人的時候也可以做到有的放矢。在這個基礎上再看文獻,往往就會讀懂很多一開始讀不懂的東西。比如說為什麼作者要強調A而否認B,那是因為他相信A後面的哲學和方法論。
如果你發現自己提煉不了,或者本來知識就是凌亂的,那麼要麼就是(1)境界未到,要麼就是(2)領域還沒有成熟,目前的知識點只是零碎的拼湊。(1)要靠自己練,(2)則預示著大機遇,一個研究者牛不牛就看他是不是可以在別人都放棄的地方找到新的規律。
一般完成1是新聞及科普的水平,2到3是博士生低年級至高年級的水平,精通3到初入4是博後的水平,精通4則是研究員和教授的水準。另外,從1到4並沒有特別固定的順序,可能你在某個領域是4,另一個領域還只是1或2的程度;或者你在4中獲得的經驗能反過來幫助1和2(這個很常見);或者一上來就可以跳過2做3,然後等3有了結果之後再去補2,等等。當然,一步跳到4那是民科的水平。
專業:基礎數學。
方向:特殊函數
時長:通常情況下,除非有其它事情需要處理,我每天都會看論文,而看論文的時間基本保持在 4-6 個小時。這裡的論文單指研究論文,綜述和其它介紹性論文的閱讀不佔用此時間。
效率:3-5 頁的短文,我基本上花一天時間就可以全部看完並做好筆記。如果某位作者的證明太過簡略或者證明本身有瑕疵,那麼可能會延長的兩天。5 頁以上的論文,就其結構而言通常就包含多個定理,或者定理的證明需要多個引理,所以有必要分成幾天來完成。
策略:我看文章之前會首先做一個調查。比如我對論文 F 感興趣,但是論文 F 是論文 E 的推廣,那麼我就去找論文 E。快速瀏覽論文 E 後,我知道 E 的原始想法是來源於論文 D。那麼,我就再去找論文 D。而論文 D 又是受了某位作者論文 A, B, C 的影響,但不是其直接的應用。這種情況下,我一般的策略就是按照 D, E, F 的順序來閱讀。
早期的論文相對更晚時間的論文所用到的理論知識會少很多,也會更加具體,容易理解。如果直接看論文 F,因為他是前人定理推廣的推廣,一來可能會很抽象,而來可能會加入許多其它的技巧反而掩蓋了原始的想法,有時候為了顯示其工作的高大上,可能故意把問題放到一個極為抽象的框架中,故意掩蓋其問題本身的形態。這樣無疑給閱讀增添了挫敗感,也會極大地拉長閱讀所需要的時間。
但是這種策略的問題在於:
為了使每篇論文的閱讀體驗都比較好,需要額外多看一些帶有重複性質的老舊文獻,總體上真實的效率也許並不高。就像剛才,為了看 F 最後把 D, E, F 都看了(捂臉)。
附:
從2011年9月讀碩士開始到現在,我精讀過的論文有 430 篇左右。感覺還是不太夠呢 。。。
放個(整齊的)圖 O(∩_∩)O
尋找課題的時候,和確認開始課題時,需要尋找興趣點和學習計算技術,會下一堆文章讀,但大多可能不會那麼仔細,一般就看核心的計算技術部分,無聊時讀讀introduction。(尋找課題時基本上只讀abstract)。在課題如火如荼的進行中時,幾乎是不讀文獻的,直到手裡的思路和工具實在無法將工作進行下去時,又回到上述步驟尋找靈感和有效技術。比較仔細的大量閱讀還是集中在工作做出來後寫文章期間。這時候的操作,是不怎麼讀正文的具體細節,而是刷abstract, introduction和conclusion,以求搞清楚別人的動機和結論以及結論適用條件。這是為了寫好自己文章的introduction。
謝邀。
專業: 應用數學。
方向:抽象發展方程、數學物理、偏微分方程反問題、最優化控制。
實際上吧,我現在很長時間沒看論文了,最近兩個月主要在寫論文。一般來說,我一般會在下面情況下開始看paper:第一,一個項目定好題目後,我會開始搜集paper以調查「研究現狀」和「常用的工具」。第二,寫論文的過程中對某個技術細節產生了疑問,我會搜集論文來看這個細節是如何處理的。第三,一個項目完成後,開始寫作的時候,我會搜集一些論文,這樣方便寫作論文綜述。
其餘的工作的時候我主要在「沉浸在數學問題之中」,努力做到「sleep on it」,雖然記憶中我大部分靈感是在洗澡的時候產生的,當然了,不排除是因為洗澡產生才讓我記住了。老實說,我做數學主要的時間還是做問題而不是看論文。當然了,其實很難計算我到底花了多少時間看,因為我會時不時的查閱論文,零散性地查找。
好了,談一談我看論文的安排:在上面三種情況下我看論文的速度是不一樣的,而且速度從來不是我的要求,需要精讀的就精讀,我可以為了看懂一篇論文花上兩個月的時間。這種情況往往是因為這個論文使用了我從未見過的思路,甚至是基礎工具我都沒掌握。比如,我當初為了做一個問題,找到了幾篇文章,這幾篇的思路都基於semi-classical analysis,雖然它和調和分析中偽微分運算元很像,但是還是略有不同的,於是我找了點相關的書 ,花了1個多月學習了這個工具,學完這個,寫了100多頁note。然後,我回頭看那個論文大概也就花了幾天的時間,之後用兩周時間內相關的論文我看了3、4篇。所以,同學們,如果你看見一個論文,你讀個一兩頁就一臉懵逼,那麼最大的可能性是你的「理論基礎不夠」,趕緊去補充吧。沒必要為了速度而放棄質量。略讀的前提是你「熟悉細節」,知道哪裡是關鍵,哪裡是routine。 我上面提到第一和第二種情況我主要是精讀,第三種情況一般是略讀,甚至只看個introduction。 好的導師最棒的一點就是告訴你應該精讀哪些東西,略讀哪些東西。實際上,數學一個小方向上的套路是相似的,只要讀完一個比較高質量的文章後其他文章讀起來就不難了。
作為個人來說,你在讀論文前最好要搞清楚你的目的是什麼?最好在幾分鐘內判斷一下這個論文需要精讀還是略讀。事實上,好的論文一大標誌就是可以讓讀者在讀完在introduction的時候(甚至abstract)的時候就知道自己是否需要精讀。
我一般是在開始一項研究之前、寫論文之前、參加會議之後大量讀論文。
開始研究之前是為了了解研究現狀和已有的方法;
寫論文之前是為了在論文中綜述研究現狀;
參加會議之後是為了了解新的研究動態。
在做實驗的過程中,則很少讀論文。
讀論文一般是粗讀、通讀。語音識別領域的兩個頂級會議 ICASSP、Interspeech 的論文都是 4 頁,現在讀得熟練了,讀一篇需要 1 小時左右,一天可以讀 3~5 篇(再多就累了)。
在粗讀、通讀的過程中,如果發現對自己的研究有用的部分,則會慢下來細讀。如果發現沒意思,則會跳過某些部分,尤其是實驗設置和實驗結果的詳細分析,只看粗略的結果。
有機化學偏光電材料
分不同層次吧,因為有目的的查文獻或者找東西的話看文文章的數量和方法就會有很大的不同,所以談談日常看文獻吧。
所謂日常看文獻其實也就是最新,分為三個層次吧
1. 掃一眼關注的雜誌最新文獻的標題,掃一眼訂閱的關鍵字,大概每天幾十篇到上百篇不等吧
2. 略跟我的興趣點貼合的文章就看看abstract 大概會有一二十篇
3. 相關性很高或者很感興趣的文章,下下來仔細讀一讀,歸檔。每天的數量不定,一周加起來大概也是一二十篇左右
謝謝 @劉銳 @keri sky @西蒙 的邀請。
這個題目很不好回答,主要問題在於,什麼叫做「看」呢?只看標題和摘要算不算看? 看了標題和摘要之後繼續看了簡介和模型部分算不算看?是不是只有跟著paper算一遍才算看?
我的專業是經濟學,談談自己的習慣吧。
在讀書的時候,我自己建了一個雜誌的目錄,把這個目錄下所有雜誌的網站上都註冊了一遍,這樣只要一有更新就會提醒,並且發來一篇目錄到我的信箱,然後我會把最新一期雜誌所有的文章都過一遍,少部分直接忽略,絕大部分還是都會看的,如果是理論主要是看introduction和model setting的部分,看完了基本上就知道主要的權衡怎麼回事了;而如果是實證,就看introduction和數據分析部分。
這個雜誌列表包括(亮點自尋):
American Economic Review (高級腦洞文大全)
Journal of Political Economy(看看他們是怎麼把死人說活的)
Quarterly Journal of Economics (本來不想看的,反正文章少,時常也有一些有意思的東西)
Review of Economic Studies (理由和上面略同)
Journal of Finance (金融類的腦洞)
Journal of Financial Economics (稍微嚴肅一點的金融)
Rand Journal of Economics (了解公司在競爭中是多麼的腹黑)
International Journal of Industrial Organisation (弱化版的Rand)
Journal of Economics and Management Strategies (想知道勾心鬥角的感覺么?)
Journal of Economic Theory (比較hardcore的腦洞)
後來入職了有更多的研究經費了,我就逐漸的訂閱了紙質版,最先訂閱的三本是AER,RJE和JEMS,可以期待多工作幾年之後,書櫃都擺滿的感覺。
上面的這些閱讀,可以說功利性——或者說目的性不算太強,純粹就是為了好玩而看,過程也很輕鬆,主要是看文章的想法,不追究細節,一本雜誌兩個小時基本就看完了,上面這些很多都是雙月刊,乃至於季刊,所以這種閱讀每個月佔用的時間大約也就是二十個小時左右,一周大約20篇。有一些內容我覺得有意思的,也會分享到知乎答案、專欄和想法里。
而如果是要自己寫的時候,那就是另外一個場景:好幾個PDF文件翻來覆去的看,有目的性的去看對方是怎麼組織語言的,是怎麼解釋自己的setting的,又是怎麼做好防禦的掩蓋自己的弱點的……這種功利性的閱讀就很慢了,一個上午,或者一個下午能看完一篇文章中自己需要的部分都是幸事,這個可能就是所謂的精讀了。精讀消耗的精力和時間都很多,主要取決於項目進度,不規律,不能按周來計算,從白手起家,到形成最初的working paper,大約精讀的文章在7-8篇左右。
需要解決問題的時候一般一天就能看掉20篇。沒什麼問題的時候一周也不會讀很多。
自己寫introduction的時候一周下來100篇吧。當然不是全部看,多數是看abstract和introduction 以及少量的與自己文章相關的discussion。
生物工程專業,研究方向微生物/生物物理。
讀paper這種事情,根據不同讀的方式,算出來的結果有天壤之別。我用RSS訂閱幾個相關的文獻網站(Nature, Science, Cell, Current Biology, PNAS, Nature Communications, Nature Microbiology, Nature Biotechnology, Molecular Systems Biology, mBio等等等等),算下來每周有幾百篇更新。但大多數看個題目就可以跳過,有大約十幾篇可能會點進去看摘要,其中大概有三五篇會正經看一眼figure。要說正經全篇讀完的話,每周可能還不到一篇。
讀paper這種事情本來就是熟能生巧。我第一年的時候RSS訂閱文獻也就一百篇左右,每周要花整整一下午才能搞定。現在訂閱量翻了至少三四倍,每天茶餘飯後看上十幾二十分鐘就可以過完。這也是靠大量的閱讀積累出來的,對語言和邏輯的熟悉程度增加了,速度自然上去。
順便插一嘴,不要用英語不好來給自己找借口。除了專業辭彙外,大部分paper的辭彙量也就托福水平,一定到不了GRE水平。難點在邏輯以及對知識背景的熟悉度。我低年級時,感覺美國同事看paper一個個都比我快好多;現在突然發現自己的閱讀速度已經比不少低年級的native speakers要快了——當然,看小說和新聞的速度和他們還是沒法比。
我一直做的是,大型工程輿論評價,最近一年也做了一些關於氣候變化輿論評價的工作。
雖然我用的工具看起來比較前沿(在社科領域),都是自然語言處理的技術,比如情感分析,主題模型。
但事實上,我並不看nlp的論文,而只是看社會科學裡面應用這些工具的論文,找到特定的套路。
之後技術的具體實現用的是現成的程序包。至於這些程序包怎麼用,主要就是看github和csdn了。
其他文章,一般是看著玩兒的。
光看是沒有用的,你得和人討論一下這篇文獻。然後你就會知道,看了簡直跟沒看一樣。
忘記說了,我是搞地質的。只看title和toc的大約300左右吧
abstract和掃一遍圖的大概數十篇
精讀細節的不超過3篇
計算材料學,正常情況下0,天天搬磚已經夠累了讀不動文獻。。。
自己寫文章的時候一天看上百篇,學習別人的文章結構和遣詞造句
機器學習人工智慧相關,一周看的數量不定,有好的就多看看,不然就草草了事。其實看的時候你是有感覺的,當一篇文章讀起來行雲流水一般,你就應該認真看。
看下周是不是deadline,從零到五十不等。
精讀的話,超不過五篇。
我是社科的。方向:量子信息。
師兄給我們做了個包,用RSS工具每天推送,個把月沒看,1000+。
師兄建議我們每天都把推送的論文過一遍,與自己研究方向相關的還要下下來或者打出來細讀。
所以,看論文不該是以周來計算的,而該以天。只有每天都刷一遍推送的論文,才能對自己的研究領域的前沿保持精確的把握,才能避免做重複的工作。
每天至少刷一遍RSS推送,是一名科研人員的基本素養。
二年級了,習慣養成中。
本人北科大材料博士在讀,說說我的看法(本回答僅代表本人觀點,不一定全部適用)
人狀態不同,目的不同,看文章的速度也不同,從頭開始說吧。
Part 1
剛開始,啥也不會,剛接觸這個領域
可以看一到兩篇中文的綜述,初步了解這個領域,然後就看英文的,只看英文的
英文是全球通用語言,大家做出的最新成果,都想給全球的科研人員看,你看哪個大佬發文章想發中文的?
那時候看文獻不要著急,不要全篇精讀,你讀不懂的,什麼XPS、EDS、HAADF,看了半天你都不知道是啥,就看著圖形還挺好看。
剛開始就看摘要引言跟結論,看看為什麼要做這個題目,你怎麼引到這個題目。
其實這個就像是研究生的開題,開題其實也就是彙報你的引言。
根據英文水平來看你的所需要看的文章,開始一天可能只能看一篇,甚至三天一篇,那你就需要多看。好記性不如爛筆頭?我覺得多看就夠了,也不用記,不是考試了,也沒說讓你背單詞,你就看見能認識就行,又不是不讓用有道是不是。
一個專業的辭彙量有限,你看二十篇,發現還是要大量藉助於有道,那就看五十篇,一百篇,總能看懂。
這需要花費一學期左右的時間。所以,研一的時候不要玩,真的,不想混文憑就好好學。
Part 2
初步了解之後,看文獻已經不成問題,這時候看摘要引言結論估計一個小時看完。
這時候就該接入一點實驗了,我認為工科生還是要注重實驗,光坐著,我感覺好沒意思啊!
有了實驗,才能看懂文章里到底說的什麼,不然只是個概念。
這時,邊做實驗邊看文獻,就看自己在做的測試,大概三天看一篇?估計還是好多單詞不認識,多看。
這部分又需要花費一學期左右的時間。按照我們學校的規定,第一年結束就要開題了,根據這些儲備,完全足夠開題。
Part 3
實驗文章都進入正規,接下來就該做一些其他測試,基本上把本領域要做的基礎測試都得有一遍吧。順便通讀文章,遇到好的就精讀。
這裡插播一句,我推薦使用OneNote做筆記,在哪都能看,而且搜索很好用,還可以搜索圖片上的文字。這一步從Part 1就要開始。有的人喜歡截圖,有的人喜歡翻譯,有的人喜歡關鍵詞,這就看個人了。
這時候基本上一天能有一篇吧。
Part 4
接下來基本上屬於寫文章發文章了,寫到哪看到哪。
熱點繼續追,有好的文章看一看。
一天三五篇沒問題。(不是特別特別細的看,有些看太細沒意義)
精讀的話,至少保證一天一篇。
Part 5
有時候會需要查一些資料,比如說,你突然想到XXX在本領域有沒有做過
如果是查詢,那就快的飛起,一天二三十篇不是問題,也不用太細看吧。
——————————————————————————
話說你們看文獻還觀察這一周看了幾篇?
自己別荒廢,看多少是多少就行
別刻意。
ML/DM
第一遍通讀。通常情況下,相關領域的文章一天能看10~20篇,一周大概一百篇左右,了解每篇文章的核心思想,具體根據文獻質量、有無打擾、精神狀況、心情、天氣、deadline時間而定。
第二遍精讀。將第一遍讀過是文章進行篩選,選擇幾篇進行反覆咀嚼,提煉出其中的精華部分,考慮可以改進優化的地方。這一遍就要慢很多了,好的文章值得你反覆體會。好讀書不如會讀書,個人體會是讀的再多不能吸收也沒有用。
如果是頂會的文章,演算法乾貨比較多的,需要與原作者交流後精讀,加上親自動手測試,有時候一篇就要折騰一周。
其實每個人基礎不同,總有適合自己的節奏,沒必要照搬別人的方法。有人喜歡循序漸進,有人喜歡直奔主題,只要每天能進步一點就OK。碩士研究方向:機器學習在電氣設計自動化領域的方法和應用(獲得17年物理設計年會的最佳論文獎)
博士潛在研究方向:深度學習在機器人領域的方法和應用
本人現在剛剛博士一年級,碩士讀了兩年,就講講碩士階段的感想吧。
我在CUHK CSE讀碩士,系裡面每個月只給學生500張紙的列印quota,第一年,我每個月除了列印最多幾十頁的課程資料外,其他全部用來列印論文,結果是沒有哪一個月的quota是夠我用的。必須要找office的同學借quota來列印。所以列印出來精讀的論文估計450/10 =~ 45篇,平均一周11篇左右。這還不算在電腦上直接看的以及粗讀的。
但是第一年結束之後,我發現我在導師的指導下,掌握了做研究的基本原理以及閱讀paper的進階技巧。在後面這一年,我可以只看abstract,introduction以及掃一下後面建模的思想,以及模型的大概形式和解法,大概率上我就可以get到這篇論文的精髓了(為什麼說大概率,因為大部分都是」垃圾「論文,創新點沒有太精巧;還有一小部分論文得慢慢啃才啃得下來)。
大量閱讀論文的後果就是融匯貫通,idea手到擒來,做都做不完:),只能分給師弟師妹,sigh...
所以總結下就是說,沒有固定的每周看幾篇paper。對於新手,一周10篇左右精讀會對你的科研能力有較大提升。對於老手,在把本領域最新的有價值的論文掃完之後,再儘可能的多讀其他相關領域的論文,在使自己一直保持節奏不落下的情況下,再穩中求進即可。
讀paper不是為了讀而讀,而是為了掌握該領域最新的思考方法和研究動態!所以更好的辦法是直接跟周圍的PhD多交流,一頓飯交流下來,我感覺就能多精讀1-2篇甚至多篇paper。
我做催化的,看的大概不算多吧,而且這破腦子記憶不好,大部分忘了,少部分記住了要用的時候總是找不到,有了電子筆記稍微好了一丟丟,只有極少數還能記住出處和主要結論。
總的來說 ,如果有一段時間整天做實驗,比如一整天守著個什麼儀器,我就不會看文獻了,一般都是抱著電腦守著儀器上網。如果那天沒有實驗計劃,沒有分析數據計劃,就會比較認真看文獻了。通常關注的那十個左右期刊的每次推送的郵件的標題都還是會快速瀏覽過去的,如果這算「看過」的話,不過主要是尋找哪些可能感興趣。之後就是可能感興趣的文章點開看,看摘要,看結論。要是結論有那麼點意思,翻最主要的圖和對應的那段論述,要是沒意思就停在這裡了。這樣子十來分鐘可以看完一篇文章。還有一類是本研究領域的,但是一眼看上去覺得研究思路和結論沒啥有用的地方,會看看他的性能,然後把重要數據粘貼到我的自建的資料庫里,將來便於分析研究趨勢或者引用文章時候搜索用。這樣子也大概一篇文章十來分鐘。如果是感興趣的文章,會全文閱讀完。但是這裡邊通常又會遇到一些實在不是本領域的,寫得太深看不懂的,看了半小時看不下去停掉的……其他的覺得有意思且看完的,可能看一篇需要一個小時左右?一邊看一邊記筆記吧,我覺得記筆記的過程會有助於理解他說了啥,而且將來找東西翻筆記也比較方便。再有一類,就是看了會令人振奮,像喝了咖啡一樣,一般會看得很詳細,連補充材料都看完,這樣子看一篇可能兩三個小時。而且引用的感興趣的文章也會點開看,這樣子看完大半天就沒了。最後一類是綜述。寫得不太好的綜述一般就在筆記上做個標記,當作資料庫用,將來需要再看。重要的、寫得好的綜述會看完,可能一兩天吧。
總的來說,周末我不怎麼看文獻,只有周一到周五看。假設有兩三個完整工作日在看,這樣子點進去看了結論和主要論述的文章可能有三四十篇吧,仔細看的文章可能有十篇左右,那種令人振奮的文章可能一個月也就一兩篇,仔細看的綜述可能也是一個月一兩篇吧。
鄰座看得比較多,我看見他看文章量應該有我數倍多,記憶力也好,我問啥他都知道,大寫的佩服。我視他為行走的資料庫……
推薦閱讀:
※你在宜家購買過哪些傢具?吸引你購買的原因是什麼?
※老鼠吃了老鼠藥是什麼體驗?
※為什麼破壞公平規則的人會得到多人點贊?
※知乎上有哪些神一樣的評論?
※是什麼原因讓你努力地讀書?