該不該堅持學習Machine Learning?

我不是學霸。在國外普通的一個院校讀了個Master。 做Data Clustering,發了一篇很水的paper,僅僅一篇而已。但是對ML和Data Mining還是很感興趣。可惜年輕時太貪玩,沒有花時間在學習上。

現在工作了,公司蠻大的,但是是做C++開發類的工作。自己一直在Coursera上看Ng的ML,UIUC的Data Mining,以及UWA新開的Machine Learning,還有約翰霍普金斯那套課,跟著課是沒什麼問題。決定開始去Kaggle學習下大牛們如果調參。但說真的,真的不知道真實世界這一行的深淺。

我的問題是,我這種情況該繼續學習ML嗎?還是老老實實做開發,多看看系統設計類的東西。因為
1. 看到很多此行的Phd們的實力與經歷,特別是CMU大牛老師麾下的人,覺得自己差的太多太多。人家只會越來越好,自己真的要走這個行業,起點真的太低了。
2. 興趣是興趣,謀生是謀生,5年後,多少需要在一個領域有些深度才能站得穩,這需要持續的學習。我不是該學不該學,而是究竟該不該放大頭的時間進去?

說的有點亂了。總之就是,學什麼都需要時間,是否該面對現實把時間投入在偏開發類的東西上。就像三井浪費了時間,他永遠不可能超越流川楓了一樣,如果流川不荒廢的話。如此起點,各位的經驗來看,會不會是一廂情願的浪費時間呢?

冒昧邀請幾位回答。正是幾位讓我覺得看到了差距,失去了走這條路的信心。

如果您路過能夠不吝嗇為我指點幾句,不勝感激。


謝邀。我覺得很有必要,而且相信有一天,機器學習演算法會成為和基礎演算法(如查找、排序)同等重要的本科生必修課程。計算機這個學科本質上就是在跟數據打交道。基本的數據處理和分析已經做得非常好了:比如查詢、排序、資料庫操作。那麼接下來的發展方向就是高級數據分析了:從大量數據中找到規律和知識,然後用規律和知識做決策。機器學習正是進行高級數據分析的一個學科方向。上次和騰訊的一個engineer lead交流,他說現在大學本科提供的機器學習教育幾乎為零,而他們對懂機器學習、能分析數據的人才的需求又非常大。如果能在技能列表裡有機器學習這一樣,對於在工業界發展應該是很有優勢的。

再進一步,我們希望機器學習在未來不光是碼農的必備技能,而且會成為普通用戶群的必備技能。想像有一天在EXCEL軟體里,有這樣一些按鈕 「分類」,「聚類」,「話題分析」,使用它們就如同使用 」求和「, 」取平均「,」排序「這些基礎功能一樣簡單、方便,成為人們平時工作的日常操作。


謝邀

一個技能學與不學,肯定有千萬種理由,然而並沒有一種理由叫做『因為趕不上最牛的人,所以不學了』。如果你真有這樣的觀點,為何要繼續『老老實實做開發』呢?別人做開發了幾十年了,你趕的的上最牛的人嗎?為何要『多看看系統設計類的東西』呢?別人系統設計也做了幾十年了,你趕得上最牛的人嗎?既然什麼東西都趕不上最牛的人,還繼續學什麼呢?混吃等死就好了。

然而你並不會這麼想,既然不會這麼想,為什麼會把這個觀點用在『是否要學ML』上呢?

換個角度想想,為什麼覺得『老老實實做開發,多看看系統設計類的東西』聽起來是一個保險的選擇,而『學和ML相關的技術』是冒險的選擇?因為工作環境,周圍所接觸實實在在的人,都是按照這個路子走出來的,因此心中會覺得這樣子理所應當。然而換一個環境,在一個充滿『新技術改變世界』的氛圍中,可能會覺得『學和ML相關的技術』是更保險,甚至唯一的選擇,而『老老實實做開發,多看看系統設計類的東西』反而是需要猶豫的選擇。

我不想說到底應不應該堅持學習某項技術,畢竟每個人有自己的選擇。我只是認為做決定的時候,要多考慮技術本身,歷史的潮流,而不要僅僅因為自己小圈子所帶來的感受。要跳出圈子,不做井底之蛤,看到更大的世界,才能順應時代發展的需求。畢竟

『一個人的命運啊,當然要靠自我奮鬥,但是也要考慮到歷史的行程』

--
陳然_Ran的微博


沒想到被4個小夥伴邀請,我在ML領域不是大牛,指點肯定不夠,就自己的經歷說一下吧。

初次接觸ML是大三的一門選修課《模式識別》,當時覺得挺有意思的,後來參加了全國大學生智能汽車競賽,這是第一次真正機器學習的運用,鼓搗了幾個演算法搞了賽道識別、賽道記憶、epsilon -greedy和fuzzy control,僥倖拿了全國冠軍,覺得研究生一定要搞ML。結果保研的時候懵懵懂懂報了系統結構,搞了三年大數據相關的分散式存儲,也算是和數據沾點邊吧,當時也有過樓主的類似的想法,不過慢慢覺得專業並不限制我的興趣,於是業餘參加了各種ML的比賽,現在回想也挺爽的。

後來畢業第一份工作也是存儲相關,但是中間沒有間斷過對機器學習的愛好,工作上嘗試做一些相關的項目,如推薦和圖片識別;到今年4月換工作的時候也順利拿到國外兩個公司相關崗位的職位和現在公司的職位。

所以,關鍵還是你是否真的喜歡,喜歡的話做起來人也是挺開心的,事情也順利。如果不知道自己喜歡啥,那就用排除法吧,挑最後被排除的那個。零零碎碎說了這麼多,希望對樓主有幫助。另外樓主覺得準備好了,可以申請我們公司開發或ML的職位,我可以幫忙內推,牛人很多,來了大家可以相互學習。加油!


廢話當然得學,二十一世紀是算命科學是世紀,你不會點深度算命出門都不好意思跟別人打招呼。我跟你講,在灣區,要是哪家居民樓樓上掉下來一個花盆,砸了10個人里9個發過cvpr,剩下一個發過尼普斯,你說你就發過uai都不好意思跟別人打招呼。


-
回答問題:


萬事開頭難,認識你自己,謹慎的選擇你的目標;先入門,再深入,不要急於求成。

成功的道路沒有捷徑,與君共勉。

-


告訴你別去做,你也還是會去學,會去關注的,這就是ml的魅力。


不過既然你做過 clustering 的話,Ng 的課程大部分(回歸,擬合和過擬合,基於中心點的分類)應該已經 cover 掉了;除非你在 thesis 中當調包俠。

但是我覺得,除非決心不當調包俠,ML 這種工作其實不適合。畢竟不知道主要方法的代碼和工作原理但是還要硬肛,這樣做能做的有限並且常常會丟人的。


(好消息,好消息)學deep learning, 學caffe, 會跑各種主流convnet,不需要調參,一個月培訓上崗。
目測國內各類IT培訓機構馬上就要開類似課程了。


你上了這幾門公開課了,如果認真做了作業的話,應該說水平已經不錯了,應付工作沒問題。既然已經上了Data mining, 我還推薦你一門斯坦福Koller的概率圖模型。這門課有些難,但從授課和作業設置上來說都比Andrew的更好。
個人感受,大神勿噴。


感覺題主的狀態我也曾經歷或正經歷著,和題主的區別是我也算是走運混進了一個2線互聯網公司的推薦系統研發組,可以在工作中做一些ML相關的活吧,但也正經歷一些技術發展方向的困惑。本來寫了好多自己的經歷,又感覺沒啥用就又刪了,感覺樓主需要明確幾個方面的問題。
1.你是對ml還是dm更感興趣,ml更加關心的是理論而dm更加偏重的對ml演算法的運用以及對業務數據的理解。在工業界真正研究ml演算法的職位很少,自然要求也很高,而大部分演算法工程師的工作主要是處理數據然後用現成的演算法反覆跑實驗,詳細情況可以搜做演算法工程師是什麼樣的工作體驗?要是對ml理論感興趣可以努力去讀個該方向的phd,要是對dm感興趣就去多熟悉現有工具和框架。
2.自己適不適合把這個方向當做職業,這件事情不用空想,去投遞一些相關方向的簡歷,參加些筆試面試就知道了,這也是最便宜的提高自己的方式。
3.實力及智商碾壓這種事在很多事情中都會發生,亦如我在玩德州撲克的時候也曾和許多高手交手感覺完全猜不透他們的想法,而自己的想法好像完全被他們掌握,當時的感覺就是以自己這個智商就完全沒有必要再玩這個遊戲浪費時間了,可後來想想自己玩這個遊戲的目的不一定非要戰勝所有人,從中獲得樂趣、以便宜的方式體驗失敗、了解自己人性的弱點以及通過學習感受自己的進步這些都可以支撐自己繼續玩下去。話題扯得有些遠,不BB了,最後送題主一段話:
當你的才華還撐不起你的野心時,那就應該靜下來學習;當你的能力還駕馭不了你的目標時,那就應該沉下心來歷練;當你對未來迷茫時,那就應該停下來認準目標。學習過、歷練過、努力過、就會明白,自己還真不是那塊料。


用了大概五周的時間,上完了NG上的machine learning一共11周的課程。其實對於我來說,這是自我「堅持」的一個里程碑了。本科的時候,凡是涉及到像資料庫,C++的項目大作業,以及後來的項目涉及到QT,MATLAB,一到卡殼的地方就會做不下去,做不下去就會自我暗示我不可能完成,然後就真的再也干不下去,就全部前功盡棄。而這次,很難得的就自我鼓勵要堅持下去,前面幾次assignments能夠拿到100分算是對自己的一個很大的肯定。雖然80分就可以pass掉,但難得強迫症發作,一定要捉摸出100才罷休。要說對於學ML是有多遠的眼光、有什麼所圖,我倒是沒有想那麼多。但是,感覺對於神經網路以及數據壓縮解壓縮都有了更深一層次的理解了,當然,這都是後話。鼓勵自己學下去的,一方面是興趣,一方面是想證明一下自己不是一直會放棄的人,還有一方面就是NG老師講得真的很有調理,很能吸引我聽下去。大學開始的學習過程讓我覺得,好好學,學到骨髓里,有招化為無招,也許什麼時候就用到了,誰知道呢(?&>ω也希望你能學下去,共勉~


學東西又不是為了和別人比較,你覺得喜歡就做下去嘛。而且多一項技能,能做的有意思東西就可以多一點。

比如我就在最近用 CNN 做了一份生日禮物,把某個人在網易雲音樂的上喜歡的音樂都下載下來,提特徵,揉合成了一首屬於某人的歌,雖然不是十分好聽,但是有意思啊!

其實還用 ml 做的蠻多其他的東西的。
個人感覺其實這樣一個不算太新的地方,能做的東西超級多的。


作為一個做ML系統(applied machine learning)的說兩句,要是做ML系統(server, database, 擼點dsl)的話用到的ml的東西確實不多,一點ML不會也可以去做,不過就是做起來不太爽就是了,感覺可以類比金融行業的碼農。


教練,我想做C++開發,你教我C++,我教你調參好不好
我讓你在kaggle上調的飛起


雖然你還在徘徊,但我心意已決,ML俺正在路上


越來越熱,機會也是坑多蘿蔔少!


ML一切才剛剛開始啊,真的只是個baby。就好像我們小時候去學圍棋,去學象棋,去學英語,去學計算機。我學了這些,然後長大了的今天我來回答你這個問題。當然,機器學習還沒辦法回答你。


機器學習的時代已經到來了


嗯,不該讀的,放棄吧。


ml會變成本科生的基礎課,早入行早得益。


推薦閱讀:

用 Python 進行數據分析,不懂 Python,求合適的 Python 書籍或資料推薦?
如何評價谷歌的「人工智慧先行」(AI First)戰略?
深度機器學習中的batch的大小對學習效果有何影響?
機器學習,在理論和編程方面要如何準備?
分布的相似度(距離)用什麼模型比較好?

TAG:人工智慧 | 數據挖掘 | 機器學習 |