標籤:

給數學系學弟學妹們的一些話

在專欄里回答一下有關「數據挖掘的未來如何?」、「選擇數據挖掘方向研究生」等等一類的問題。

我不是人生導師,只是通過我的個人經驗給現在迷茫的同學們一點建議。注意哦,僅僅是建議。我的經驗不適用於所有人,就好像我覺得iPhone是最好的手機,但是你覺得大屏幕好,你參照我的建議花了很貴的錢買了5s還簽了兩年合約,然後分分鐘都覺得不爽,這個就不要賴我,只能怪你自己的決定。

就好像當初我誤打誤撞學了「信息與計算科學」專業。

這個專業在我上大學的時候還不多,現在估計很多了,這個專業的畢業生都應該清楚,這是個在「數學系」中學「計算機」的交叉專業。學得好的話,那麼就是一個數學基礎紮實,編程能力強的人見人愛的複合型人才;如果學得不好的話,嗯,跟其他大學生也沒啥差別。有人問,數據挖掘和數學有關係嗎?有!非常有!不過現在想來,沒有我當初在某一個回答下那麼強的關係。比如,在數據挖掘中用到實變、復變、拓撲的機會的確非常少。但是(是的,什麼都會有一個「但是」),學習過這些之後會對理解演算法幫助非常大。數據挖掘是通過演算法對現實世界中的問題進行抽象,並且計算統計出在複雜數據背後的規律,將規則或預知的結果呈現出來。數學本來就是對現實世界的抽象,所以兩者是有很強的聯繫的。而且,在設計數據挖掘演算法的時候,很多時候是看問題的角度。舉個例子吧。平面上有不同顏色的數據點,將這些數據點區分開來,一種是看這些點之間的距離,通過聚類演算法區分;一種是將這些數據點都投影到高維空間中,將高維空間中的線性可分解對應到低維空間中;再有就是看這些數據點的屬性,通過奇異值分解找到起關鍵區分作用的維度,利用這些維度區分......當然方法還有很多很多。如果不知道數學中的歐式距離、核函數、SVD以及相關的知識,那麼在理解演算法過程中就會很困難。

所以,數學系的學弟學妹們,好好上課,不要上課玩手機,不要上課不聽講,吉米多維奇做完了也是可以鍛煉邏輯思維的,概率課你要是不好好上那就是全天下最傻X的學生。

說來有些搞笑,「信息與計算科學」這個專業培養的其實是現在時下最炙手可熱的「數據科學家」。當初 Data Scientist 這個詞還沒有被創造出來,信息與計算科學這個這麼有遠見的專業就有了,當然了,廣大的畢業生除了轉行也就是和計算機專業的畢業生一樣去做 coder。不過,現在,數據科學的確是這個專業的最對口的專業。

所以,數學系的學弟學妹們,好好上課,不要上課玩手機,不要上課不聽講,多鍛煉你們薄弱的編程能力,能把你們學到的數學知識放在數據上用起來的才是真本事。

還有,如果要讀其他專業的碩士博士的話,你們是廣大博導們的最愛。

推薦閱讀:

學術界的同行審閱(Peer Review)是不是精英主義的一種體現?是否有不合理的地方?怎樣改進?
你為什麼玩知乎,而不玩知網?
假設檢驗 P 值小於 0.05 的結果就一定好嗎?
如何高效讀文獻?Science 10 位學者寶貴經驗分享

TAG:科研 |