研究生畢業做機器學習數據挖掘程序員發展前景如何?在這方面跟博士競爭差距會有多大?


在機器學習領域混成大神的,我看像netfilx、ebay、阿里、華為、騰訊大神基本上沒有特彆強調到底是研究生還是博士。

一般大神都是在數據、演算法或者系統三塊有所深入研究的人,能夠在數據上有獨特的理解、能夠有辦法抓到人口屬性、好友關係、新聞訂閱、遊戲記錄、購買記錄、搜索日誌、資產信息、歷史信用等;能在演算法上有獨特的理解,實際的業務場景怎麼和GBDT、RF、LR、k-means、apriori聯繫起來,比如netfilx怎麼解決推薦電影的問題,AB TEST是怎麼做的,比如ebay是怎麼做商品的關聯推薦,是層次聚類還是扁平聚類,有什麼區別,比如淘寶是怎麼做展示廣告的推薦,behavior targeting、content targeting和look-alike User Modeling;系統方面比如Realtime feedback-&>Steam Processing-&>Online training-&>Online prediction-&>Realtime feedback這樣的短batch模式以及offline、online、nearline這樣的模式都怎麼玩。

這些都肯定需要很多實踐和經驗。如果你是在研究院長期研究用戶行為、推薦演算法,又在ACM玩的比較溜的話,應該很有前途喲。

就醬紫。


@ctomiao Parrot 謝邀

首先,前景是肯定妥妥的好!

為什麼百度要搞DeepLearning研究院,各大公司都在招DM和ML的人才,就是一個很好的佐證。並且隨著移動互聯網而來的海量數據都是潛在的巨大財富,等著你去發現呢!~

貼幾個拉勾網關於DM的職位薪水:

其次,我是一個本科生做機器學習的程序員。並不是題主期待的研究生和博士生的對比,不過我相信仍然可以提供一個不同的視角。

答主背景介紹:

高中開始接觸信息學奧林匹克競賽(NOI),獲獎後保送到ZJU的求是科學班繼續深造,目前在一家A輪移動醫療公司做Data Mining的Intern。

Coding:3年Pascal,2年C++,2年Java,1年R

我相信國內的研究生和博士生,如果不是跟著大牛教授或者師兄,基本都是處於自學的狀態。所以,在這一點上,我覺得資源還是相對比較公平的。

不過,這個方向需要的是知識的沉澱。因此,可能在這個維度上,博士生會有優勢,並且博士生會有論文要求,也會強制自己去做更深入的研究。

回到我自己,我現在在公司負責針對於特定疾病和癥狀的「方案/保健建議」的數據挖掘工作,涉及到的主要知識有:自然語言處理,樸素貝葉斯,條件隨機場。

我旁邊工位的哥們是武大的研究生,剛畢業,也是做DM的,他之前是公司的CRF的負責人。

但是我發現一個很嚴重的問題是:coding能力很弱,一般只擅長一種語言,如python。

這一點相對於博士來說,如果本身不是很強的話,應該算是比較弱的維度了,因為缺乏經驗和技能,所以可能會被比下去。這也是我之前強調的知識的沉澱和經驗的積累問題。

所以,最關鍵的一點還是靠自己,如果你本身是一個有self-study ability的人,再加上勤奮。我覺得在專業技能上和博士PK是完全沒有問題的(忽略那些牛逼的top Phd)。其次,就是無論你是只看paper的理論黨,還是寫code的實踐派,都應該結合著來,缺一不可。因為這個方向就是需要你有這樣兼而有之的能力嘛~

最後,希望題主能夠拿到自己滿意的offer~


在阿里內部的發展來看,演算法崗位上研究生和博士這個單維度差異與發展前景關係不大, 主要還是看業績的,不過值得注意的是,現在大部分內部公認(公司外知名度大的演算法leader可能部分是關注業務和帶團隊多一點)的演算法牛人確實是博士居多, 演算法類高管更多是海歸的博士或者直接就是米國大學回來的教授。

所以,職業發展的關鍵是演算法類研究生在公司內的崗位是否可以通過日常的工作得到成長,達到甚至超過博士所具備的技能水平。

ps: ACM演算法和機器學習演算法關聯很小,ACM經驗在工程開發類崗位的優勢更明顯。

利益相關:前阿里演算法工程師(阿里雲+天貓),五年陳。


能抓到老鼠的貓就是好貓,能解決業務實際問題的才有更大的發展空間。

公司里做ML,不缺博士,而是缺乏能快速學習、應用現有或前沿方法和實際業務場景結合的人才。動手能力差的博士照樣沒有什麼發展。


研究生做ML可能更偏重於應用,比如你會用一些演算法或者技術來分析數據或者解決實際應用問題!如果你是博士,可能你關注的更深層,比如演算法的優化,還有更深度的學習模型,這就對數學的功底要求比研究生略嚴格!可能博士更容易成為一個牛逼的data scientist


看學術情況和做實驗能力。

我碩士畢業,CCF A,B,C會議各灌一篇,待發的期刊兩篇,差不多可以達到博士標準。現在在NLP領域做程序猿。個人感覺沒什麼區別。

有區別的是,做人處事。


推薦閱讀:

知乎上有哪些關於大數據、推薦系統、機器學習之類的專欄?
文本分類中,CHI演算法、TFIDF演算法、TextRank演算法都應該對應哪個環節?如何選擇?
AlphaGo 的學習決策模型是否能用於股票市場的交易?
用python處理一個1G左右的數據集,運行速度非常慢,怎樣優化?

TAG:程序員 | 數據挖掘 | 機器學習 |