機器學習博士如何系統提高科研水平?

背景:國內985本科數學畢業,英國念了個 AI 的碩士,回國工作兩年後來澳洲一非八大學校讀機器學習 phd。現在讀了小半年,感覺成長很慢,主要是兩方面:

1.知識積累:本校博一沒有基礎課,來了就全靠自己,感覺很不好。。目前上了一些 coursera 的課,以及看了一些各種其他學校的課程 notes,同時相關的資料和書籍,如 PRML等,但仍然感覺很零碎。如何整理知識,使其系統化?

2.科研能力:這才是最頭疼的地方。。發現自己根本不會科研。。paper 讀了一大堆,但是沒有自己的想法。也不知道怎麼找研究方向深入發展。。,詢問師兄和老師,都說自然就會了。。難道是量變到質變?。。

補充:老闆是 cv+統計出身,現在研究的方向是非參貝葉斯(老闆搞這個的),信息幾何(在做 survey,坑太深)

可恥的匿了,上次在小書蟲抱怨了幾句獎學金的事被老闆請去喝茶。。


prml好好看好好做題 讀上三四遍 刷遍題目

既然做non para B的。就從neal teh sudderth e.b.fox等人的phd論文 好好看 每個讀上幾遍 配上其phd期間對應的幾篇paper看 讀的過程要自己整理好一些基礎知識 一方面加深理解 一方面以後phd論文也用得著

phd thesis讀的八九不離十了 follow他們畢業後的論文 精讀每一篇

反覆讀他們最近的論文 刷nips icml還有各cv大會上你感興趣的論文


首先說個題外篇,推薦 Philip Guo 一本書, 關於他的博士經歷:Philip Guo - The Ph.D. Grind,只有一百也多一點, 花一個下午時間,要把它看了。

關於知識積累。我讀博時候做的心臟擴散核磁方面,當是也不知道怎麼積累,找書來看,但事實上,很少能找到什麼書的,找來相關的書,發現也是某某編輯整理的綜述論文集一樣。但這是個好事,說明自己踏進了一個還沒有鋪好路的地方。所以主要還是要看論文的,看多了,自然慢慢有自己的想法,讀得時候也就會有批判眼光了。接觸多了, 也會感覺到哪裡自己還可以繼續走,然後選定一個好的問題/方向。

關於科研。前面有人指出要選定演算法,我更傾向於選定一個問題,最好是你自己發現一個新的問題,迅速給出一個初步的解法,或者針對一個別人提出的問題,你給出一個新的視角。新人積累少,能拼的就是idea,或者說是對問題的看法、視角。

加油!


1.知識積累:本校博一沒有基礎課,來了就全靠自己,感覺很不好。。目前上了一些 coursera 的課,以及看了一些各種其他學校的課程 notes,同時相關的資料和書籍,如 PRML等,但仍然感覺很零碎。如何整理知識,使其系統化?

關於這點,我覺得你需要自己調整好心態。讀博士不是為了全面掌握一本書的知識,而是選擇出一個點,然後突破。我說的不好,你可以看 Matt Might 的這篇blog The illustrated guide to a Ph.D.,我把和你最相關的這幅圖放在下面:

你看到最外面的那個紅色的區域了嗎,那個就是你的知識儲備。機器學習現在已經太廣泛了,你沒法掌握全部的知識,Bishop 寫出來 PRML 都多大了,你讀博士期間也就短短4-5年,不要期望在這麼短時間內掌握別人的畢生所學,然後還在其中一點上還做出來世人未見的成就,這期間你還要抱怨獎學金啊,談個戀愛啊之類的,相信我,你的時間是不夠的。所以,心態放平和。你只需要在你選定的那個點上做突破就夠了。

2.科研能力:這才是最頭疼的地方。。發現自己根本不會科研。。paper 讀了一大堆,但是沒有自己的想法。也不知道怎麼找研究方向深入發展。。,詢問師兄和老師,都說自然就會了。。難道是量變到質變?。。

少年,誰一開始都不會科研的,你不是第一個,也不是最後一個。讀 paper 是必要的,但是單純從 paper 里產生想法是 simple and sometimes naive 的。你想想人家千辛萬苦寫代碼,做實驗,效果不好,改來改去,在強大的 deadline 之下終於作出了可以發表的結果,哪會把這期間的酸楚和工作的不足輕易昭示天下。

我覺得讀 paper 是必須的,這樣可以保持你的知識水平 up to date,至於要產生想法嘛,那就要選定一個演算法,自己 coding,我相信在這期間,你就會有所收穫的,然後再找這個演算法的改進演算法再實現一下,你就又開闊了,這個過程中你對演算法的理解肯定比光看 paper 強。

再有一個,其他回答裡面也提了,多和人交流,多跟老闆出去蹭會議去,哪怕你自己出錢也要去,去會上多和人聊聊天,說不定別人的哪句話就帶出來你的一個靈感呢。


才小半年你著什麼急!...

自己有想法就慢慢鑽,沒想法就多聊天

(不是歧視搞cv的人啊) 但 cv 出身的人大多看中灌水數量... 所以祝好運吧...


推薦閱讀:

人性本惡,機器本善?
集智漫畫:如何教女朋友人工智慧(一)
機器學習基石筆記12:非線性轉換
機器學習預測地震,信得過嗎?
條件隨機場CRF

TAG:數據挖掘 | 計算機 | 機器學習 | 博士 | 出國博士 |