對數據挖掘,機器學習感興趣。沒有演算法基礎影響大不大?

本人普通985大二學生,在努力打基礎的同時,目前感覺對數據挖掘,機器學習比較感興趣,但是並沒有acm基礎,不知道影響大不大,如果需要的話,現在開始acm又是否來的及。(同時對分散式系統也有些興趣??)最近很迷茫 ,所以來知乎上求大神指點。 ------------------------------------------------------------------------------------- 求指點……


這兩者的確沒有必然的關係。但是題主會誤解,我覺得也是很正常的。

我之前也誤解過這兩者之間的關係。因為我發現這個領域一些很優秀的80後中國青年,都有著很強的ACM背景。

譬如上交的戴文淵,05年ACM世界冠軍。大四一開始做機器學習就特別厲害,發頂會論文如同探囊取物,碩士期間和港科的楊強教授發了很多篇很有影響力的論文。碩士畢業後去百度工作,三年不到就升到了T10(當時T10在百度只有幾個人),簡直如同神話一般。

譬如清華的吳佳俊,2009年NOI金牌保送清華,大學也拿過ACM金牌。大四的時候已經發過好幾篇頂會,是CVPR審稿人,拿到了清華特獎 ……

ACM大神做機器學習做的好的例子,還有很多。這讓我誤以為他們是因為OI/ACM的基礎,所以做機器學習才這麼牛逼的。

但後來才慢慢發覺到,他們不是因為有ACM基礎才牛逼,而是本來就這麼牛逼。他們不搞ACM,做其他計算機相關的事情,肯定也可以碾壓同齡人。

雖然ACM基礎對於機器學習不是必要的,但是我覺得下面這幾個素質對於做機器學習還是很有用的:

(1)智商高(或者說邏輯思維能力強)

(2)數學功底深厚

(3)編程能力強

往往ACM大神也符合這三個條件,所以他們搞起機器學習很順。

但是這三點,也並非只有搞ACM才能做到。你可以通過其他方面的訓練,達到同樣的效果。

同樣,你滿足了這三點,別說做機器學習,做其他的CS領域也能風生水起。


為什麼標題問演算法關係大不大,後文又是acm競賽關係大不大?

跟演算法和數據結構關係大,跟acm競賽沒啥關係。

機器學習啊數據挖掘啊啥的確實需要演算法基礎,acm/icpc確實考察演算法,但是難道沒經過這個考察就不會演算法?不是這麼個邏輯啊喂……

難道你沒考過GRE就不能寫英文論文?難道沒考廚師證就不能在家做飯?難道沒考會計師就不能數清錢包里有多少錢?

ACM/ICPC搞得好的基本都靠個人興趣,單純的對演算法競賽的個人興趣,而不是個啥現實需求。至少我認識的能去wf的都是這樣。如果你對ACM/ICPC有興趣,玩玩也無妨,也能鍛煉演算法和數學建模能力;沒啥興趣還不如自己學學演算法做些喜歡的東西靠譜。


不大。


先看這個圖,差什麼補什麼,和acm關係貌似不大,和概率關係倒是很大吧。

大二搞acm有點晚了。

你想搞分散式,先找個nosql資料庫研究研究它的集群再談興趣,搭一個玩玩,看看CAP理論下的涉及的主流資料庫,找一個主流的nosql看看文檔也費不了多少時間。


最基礎的部分包括基本的高等數學,比如分析、代數(尤其是矩陣論)、數值優化演算法、概率論與數理統計等。

更進階的需要掌握實分析(比如測度論)、圖論、時間序列、回歸分析等等。

再深入的你還可以掌握微分方程、流形幾何等等基礎機器學習涉及不到的內容,這個時候你就可以挖別人挖不出來的坑了。

另外雖然嚴格來說不屬於數學,但是演算法的概念和數據結構的相關知識也是一定要掌握的


當然沒聯繫啦


每當看見說對數據挖掘,機器學習感興趣的人我就會說,你真的了解嗎,還是看什麼火,什麼好找工作,就對什麼感興趣啊!前幾年數據挖掘什麼沒火的時候沒看有幾個人說對這感興趣,這幾年火了以後,逢人都說自己對數據挖掘感興趣。


推薦閱讀:

關於L2範數如何避免過擬合?
中國基層編作曲從業人員是否可能被人工智慧取代?
棋盤大小以及所用時長,對 AlphaGo 的獲勝概率有影響嗎?

TAG:機器學習 | ACM競賽 | 大二 |