數學專業的學生如何看待機器學習和大數據這些方向呢?
數學專業的學生如何看待機器學習和大數據這些方向呢?
圖靈獎得主E. W. Dijkstra曾說「計算機科學並不僅是關於計算機, 就像天文學並不僅是關於望遠鏡」. 正如天文學早期的研究關注如何製造望遠鏡, 計算機科學早期研究是在關注如何令計算機運轉. 到了今天, 建造強大的天文望遠鏡雖仍重要, 但天文學更要緊的是「用」望遠鏡來開展研究. 類似地, 計算機科學發展至今, 也該到了從關注「造」計算機進入更關注「用」計算機來認識和改造世界的階段, 其中最重要的無疑是用計算機對數據進行分析, 因為這是計算的主要目的, 而這就離不開機器學習. 十多年前在國內某次重要論壇上筆者剛拋出此觀點就被專家迎頭痛斥, 但今日來看, 甚至很多計算機學科外人士都已對機器學習的重大價值津津樂道, 現在才開設機器學習基礎課似乎已有點嫌晚了.
——周志華所著《機器學習》後記節選 (2016年1月第1版)
------------2016.9.26 謝謝大家的贊同------------
原文主要想表達的是存在遞進關係幾個觀點:1.數學和機器學習/計算機科學是兩個各有其研究重心和目標的科學。一般來說,數學更關注理論研究,關注對現實世界更高層的抽象;機器學習則更關注基於數學理論解決困難的實際問題。2. 數學和機器學習/計算機科學的發展相輔相成。一方面,機器學習/計算機的發展為數學提供了許多新的研究方向;另一方面,機器學習的前沿研究還是要回歸到數學。3. 數學和機器學習領域的學者互相報以偏見的主要原因在於缺乏對對方學科的認知和理解。
另外,提一點個人意見(也許不具有普遍性):總體上來說,數學專業本科生和研究生(尤其是純數學)的就業一直不如計算機專業。近幾年隨著互聯網、大數據、機器學習等新興領域的迅速發展,這種情況有所緩解,許多高水平數學專業畢業生的才華有了更好的用武之地。但是,我想提醒的是,如果不是打算繼續深造,深入基礎科學研究(讀博,或者博士轉數學相關的交叉學科),而是本科和研究生畢業參加就業,且計劃著憑藉自己紮實的數學基礎進入互聯網企業拿高薪,請務必做好準備(行動上和心理上),對計算機科學、軟體開發有充分的涉獵。說得直接一點,互聯網企業更需要的是能動手寫代碼、有一定計算機科學素養和工程能力的畢業生,而對於high-level的數學建模和分析工作,往往都交給高水平的博士研究團隊乃至行業頂尖專家來做。任何時候,我們都不能盲目樂觀。
與大家共勉。
----------以下是2016.9.23原文---------
不直接回答問題,而是舉幾個身邊的例子供大家思考,並給出我自己的觀點。
我是計算機專業的研究生。上個學期選修了數學學院的兩門課:《組合最優化》和《NP複雜性與近似演算法》,因此認識了一些數院的同學,通過他們了解到了一些他們對計算機/機器學習的看法。感受最深的一點是:學數學的同學更注重理論的完備性和邏輯鏈的完整性,即對於在分析過程中出現的任何一些命題,都要能證明它是正確的還是錯誤的,而往往不怎麼重視演算法和數據結構的設計與實現,以及演算法複雜度的分析(大多數數院的學生往往到研究生才會接觸演算法與數據結構,而且往往是作為選修,很少會去編程實現某個演算法);相反,學計算機的同學則對證明的過程不夠重視,喜歡從直覺上去分析一個演算法的正確性,而更重視數據結構的設計和編程實現。因為通常要證明一個演算法的正確性往往是比較困難的,有時需要較深的數學功底(比如,證明演算法正確性最基本的方法——循環不變式,就是類似於數學歸納法的一種證明技巧)。
上面提到的這個現象,我想一個重要的原因也易於分析。畢竟術業有專攻,很少有人能同時精通數學和演算法設計。各自有自己重視的層面。
但是往往學科發展都會出現交叉,學科之間的許多道理都是相通的,學科之間也有相互依附、相互促進的作用。計算機、數據結構、演算法的發展為數學提供了許多新的研究方向,比如計算複雜性理論、近似演算法等等;而數學的發展又為計算機和工程實踐奠定理論基礎。比如,演算法設計的一種常用思想「貪心演算法」
,在數學中就有與之對應的理論「擬陣」,而且該理論還正處於發展和完善的過程中);再比如,圖論中著名的計算最短路徑的Dijkstra演算法和網路最大流/最小割的Ford-Fulkerson演算法,都可以用線性規劃中的對偶單純形理論推導出來並證明其正確性(但是Dijkstra, Ford和Fulkerson前輩在發明這些演算法時應該不是從線性規劃的角度去設計與證明的)。而組合優化理論又催生了運籌學,你說,它到底是數學呢,還是計算機呢,還是管理科學呢?
數學和計算機科學就像一對情侶一樣,相濡以沫,不離不棄。
如果說統計也屬於數學,那麼其實我們現在接觸到的很多機器學習演算法,早在若干年前(具體是多少年前我就不清楚了,至少比「機器學習」這個名詞出現在人們視野中的時間早得多)就出現在了統計理論中。在學習「機器學習」這門課之前,我還想著「啊,機器怎麼學習?像我們人一樣嗎,那可真是有意思,多麼高精尖的技術啊,不知道我能不能學懂呢...」但是開始接觸以後,慢慢發現,它其實就是基於統計和數學優化的一門科學,只不過不像數學看著那麼「純粹」,它的實用性非常強,可以有效地解決現實生活中的很多問題,倒不如說是「數學建模」更適宜些。
機器學習最常用的幾個功能是:對現實世界的事物進行分類或者對事物的發展進行預測,而這些自然的目的「分類」和「預測」等等,最後都能歸結為對一個或多個複雜函數的極值優化問題(比如最大熵模型、隱馬爾科夫模型、條件隨機場),於是到這個時候,數學就可以發揮作用了,許多經典的數學優化理論都可以在這個階段派上用場。但是,亦有許多的優化問題在這一階段是傳統的優化理論所無能為力的,因為這些複雜函數的未知參數的數量常常會達到成百上千的量級(所謂「學習」,就是通過演算法去對這些參數進行估計),解決如此高維的函數極值問題是非常困難的。於是又有許多新的理論誕生了,比如「支持向量機」(SVM)理論,其中的精髓「核函數」就是非常重要的思想。再比如,換個思路,不從函數優化的角度,而考慮現實世界數據的語義特性,從知識表示的角度分析,「知識圖譜表示」就屬於這類方法。
我的「機器學習」的任課教師似乎對數學系的同事們有些偏見。常常在課上調侃數學系的一些老師,說那些老師找到他想做和大數據有關的項目,因為現在這個很熱。他很鬱悶,說「什麼是大數據,計算機科學研究的就是大數據呀,一直都是...」。而他也常常會在課堂上發表言論,指出數學的最優化理論在實際應用中基本沒什麼用,因為「能解決的問題太少了」「現在性能最好的機器學習演算法很多都不是來自於最優化理論」。
這另一個原因你大概也看出來了吧:對對方學科的不了解(尊重),交流得不夠。(一部分)學數學的認為自己是在和上帝對話,容不得半點噪音和不美麗的東西;(一部分)搞計算機、機器學習的認為那些做純理論的都在整些沒用的東西,虛無縹緲,解決不了實際問題。好像兩個有著各自頗為自豪的研究領域的知識分子一樣,見了面不是心平氣和地切磋討論交流思想,而是互相報以偏見,認為對方的研究沒有「價值」。正所謂「本是同根生,相煎何太急」。
如果說數學是純粹的,是一個在理想的、美麗的、毫無污穢和雜訊的世界中盡情徜徉的孩子——永遠有無盡的寶藏和美妙的夢想等著他去發掘;那麼機器學習就可以被視為是在理想和現實之間糾結、徘徊與奮進的少年,有偉大的理想作為後盾和指路明燈,也有現實的複雜不斷考驗和洗滌著心靈。
機器學習早期發展是遵循實用主義糙快猛的路線。基本步驟就是靠直覺構造一個優化目標,然後解這個優化問題。數學工具基本上線性代數和凸優化也就夠用了。再深一點涉及博弈論,隨機過程,微分方程,測度論,實分析,泛函分析,李群等。
這個學科發展很快,長期處於理論跟不上實踐。當前的發展勢頭,已經到了一個工科那點數學不太夠用了的階段。很需要一批數學大牛來披荊斬棘一下。很多這個領域的人認為過多的數學沒必要,其實是因為這些人數學菜。我就看到過用代數幾何的方法(resolution of singularity, blow-up)漂亮的解singular model的問題。可惜很少人follow。 總之很多問題是到了需要引入高級數學工具才能漂亮解決的地步了。比如各種不變性和等價性需要黎曼幾何,各種ill pose singular問題需要代數幾何。
比較極端的數學愛好者是看不起機器學習和什麼大數據的,他們眼中的數學就應該是一個漂亮的理論框架,應用的東西本來就該是「智商不夠」的人學的。事實上,這些人往往也在學習機器學習這類課的時候要比計算機背景的人要快得多,但是因為不關心細節和實現,往往學的不一定紮實。
另一類學數學的學生在數學專業課上並不一定比第一種差,但是他們更現實,知道自己搞偏應用的領域要比搞純數學輕鬆得多。所以願意花更多心思去考慮機器學習中的應用問題,而不僅僅考慮理論模型,尤其是在科研上,數學背景的人比起計算機背景的,會更多思考使用技巧背後的原因。我對機器學習和大數據是有一點點抵觸情緒的。抵觸的原因倒不是覺得這些方向low,而是一種潛意識裡的危機感。
數學、物理類專業的學生轉行就業是一件非常普遍的事情。儘管紮實的數理功底對轉行有一定的幫助,但是要轉型依然有不少要補的東西:要轉IT或金融都要補充相當多的專業知識,好的數理基礎會有助於學習,但是不學依然不會,沒有充足的練習依然不熟練。
但是近幾年機器學習、大數據的火熱,已經被相當多數學、物理類專業的學生視為進入互聯網公司、金融公司的終南捷徑。的確,比起傳統意義上計科或者經管類專業的知識體系,機器學習和大數據的東西要更接近數學、物理專業學生的舒適區:終於不用在一把年紀花下血本去補人家本科基礎課了。不用再和計科專業的人拼代碼能力,不用和經管類專業的人拼實習經歷,一切看起來很完美。
但是一旦這波熱潮過去,又該轉型去哪裡呢?
我的答案針對的是數學物理類專業代碼能力薄弱不足以找到程序員工作而趁著這個東風進入互聯網公司的人,如果他們的能力沒有成長起來足以適應大數據或機器學習以外的開發工作,那隨著熱潮過去出局的可能性是很大的。
數學系的學生來答一發。
就目前純數學找教職的難度,一線城市基本上很難了,二三線四線城市估計好過一點。基本上一個教職扔出來,200個博士競爭。人總是要吃飯的,找不到工作的那199個怎麼辦呢?要麼去博士後,要麼轉行。
有的人說計算機的機器學習遲早也會飽和。當然這個是肯定的。不過我不知道機器學習人才什麼時候飽和,我只知道數學界已經人才飽和。認真做論文的比不上灌水發文章的,努力搞科研的不如拉幫結派的。數學界人才飽和的情況只會越來越重,至少五年內看不到希望。
但是機器學習五年內至少不會人才飽和,只是會淘汰一些技術不過硬的人員。能夠做的就是努力向前,不被社會淘汰出局。再說,你還指望靠一個機器學習技能混一輩子么?人肯定要與時俱進,隨時保持著前進的動力才是關鍵。個人嚮往但迷茫,也有很多朋友煩到爆炸。感覺這兩種態度都挺常見的。(當然,不迷茫的聚聚也是存在的...)
身為數學專業的學生,生活中被動了解到這些東西的機會還是挺少的。然而,考慮到很多人其實在貴系讀得相當心虛,所以對這種東西往往並不會表現得很反感。(畢竟統計or計算方向的同學們多說什麼都挺尷尬的...)
這就是為什麼在這件事情上看起來很溫和的人比實際上很溫和的人多。
樓主本科+碩士都是應用數學,在美國讀碩士後來選了運籌學(優化方向),師從整數優化大濕,現在博士階段跳槽來了海德堡大學,師從TSP先驅之一。但是,由於海德堡交叉學科計算中心交叉的緣故,現主要跟著圖像處理的二老板做計算機視覺方向的應用,因此,對於數據科學,也是半路出家。
關於我怎麼看待大數據和機器學習這個領域,更詳細的回答,可以看我已回答過的這個問題:
想學數據分析需要學哪些課程? - Ruobing Shen 的回答
分割線之前,再補充一點:機器學習,大數據這些新興專業,是隨著工業界與日俱增的需求而隨之出現的。其實任何專業都是這樣一個需求導向的過程,包括微電子系,計算機系,還有什麼房地產學院。。你說幾十年前有這些系么?
自然科學如數學、物理、化學長盛不衰,是有其道理的,這也是為什麼我們初高中我們都在學這些東西。而某些專業,也會隨著市場需求的銳減而減少甚至消失。
這些專業名詞往往是「憑空出現」或者以前沒有的,然而知識是需要積累的,不是憑空出現的,也就證明了如大數據、機器學習這樣的東西,其實是科研圈已經研究或者在用了很多年了,然後為了順應市場需求,學校決定開這個專業,於是一般教授過來拍板,這個專業需要哪些基礎,我們就把這些基礎課放進來,這也是我下面的回答要強調的。
--------------------------------------------------------------------
在這個問題里,我再三強調了數學建模的重要性。
對於懶得點開鏈接的童鞋,樓主特意複製粘帖前半段到這裡,想看後半段的,請follow上面鏈接
簡單的說,原理和基礎都在數學這邊,當然有很多偏應用和軟體使用的課程,這些直接大街上報個培訓班就能學會的毫無技術含量的東西,不在我的討論範圍內。我要討論的,是如何系統的學習,然後自己能編出這些處理大數據的程序或軟體,我想,這才能稱為一個合格的數據科學家。
在介紹乾貨之前,再羅嗦一下解決一個實際大數據問題的一般流程。比如一個生物公司找到我,要求我做一個視頻裡面cell tracking的項目。(一幀既為一張圖片,假設500*500=25w像素,一個video算它1000幀,總共250 million像素,可以算大數據了了吧?)具體流程:數學建模--設計演算法--用任意編程語言編寫演算法(其中會涉及到數據結構,即如何搭建程序使程序更加高效)--導入視頻數據到演算法里得出結果--根據結果的好壞改進演算法甚至模型(如此往複)。這裡我要強調的是數學建模的重要性,為何要數學建模呢?的確很多naive的演算法完全不需要建立在數學模型之上,比如clustering裡面經典的EM演算法,是一個iterative method,基本一眼就能看出演算法的思路然後編程實現,所以稱之為naive。那麼基於數學模型上的演算法有何妙處呢?答案是一個好的數學模型,往往是被研究了幾十甚至幾百年的學科,比如圖論,所以很多性質都已經被研究得很透徹可以直接使用。比如我的這個例子,cell trancking,我可以建立一個network flow的模型(其實也是基於圖論的模型),那麼這個network flow模型,是一個被研究了很久的領域,因此我可以直接使用很多很多已知的好性質來服務我的演算法。另外很多時候,經典的數學模型裡面已有很多經典的演算法,比如network flow基於里的max flow/min cut theorem的演算法,如果能在其基礎上做改進,等於站在巨人的肩膀。因此這就是數學建模的重要之處。
往往同一個問題,從不同的角度去看可以有千百種數學建模方法,而不同的數學模型差別往往巨大,而數學建模又是解決一個實際問題的第一步,在這基礎上才考慮演算法和數據結構設計。因此,數學基礎在我看來是重中之重,也是我推薦學習課程的核心。
好了,下面是乾貨。
1,線性代數(矩陣表示和運算)是基礎中的基礎,和微積分(求導,極限);
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
更新請見上面那個鏈接, 想學數據分析需要學哪些課程? - Ruobing Shen 的回答
歐洲,北美,全球留學及數據科學深度私人定製諮詢 - Ruobing Shen的文章 - 知乎專欄
我是學數學的,也支持大家選擇數學專業,更支持數學專業的人,選擇機器學習或者所謂的大數據方向。我的工作,每天與海量數據打交道,但對外,我從來不說我從事的行業是大數據行業,太LOW,我只專註數據商業變現。
馬雲說,阿里巴巴不說自己是電商公司,是數據公司;劉強東跟著也說,京東不是電商公司,將來要成為數據公司。更有人說,未來所有的公司,都會成為一家數據公司。這也許你不相信,但看你從哪個角度去想。所以,數學專業的學生,選擇數據方向,我是舉雙手贊成的。在這裡,我沒有說選擇機器學習方向,也沒有說選擇計算機方向,因為那都是工具,不是什麼方向。
其實,行業內,大數據商業變現的途徑已經有很多了,比如阿里金融的業務,比如京東白條的業務,比如廣告方向的DSP業務,比如百度和騰訊都有在把自己數據,一步一步變現。這些都是大公司,都有著自己獲取數據的天然優勢。但現在的創業公司,其實在互聯網領域,也都是做著跟數據息息相關的業務,比如打車類產品,比如智能設備領域的產品,最終的核心都是在演算法和數據上。
數據行業現在已經是一個實實在在的朝陽產業。
數學專業的學生,具備從事這個行業的天然優勢,邏輯思維能力強,數學功底好,具備快速學習其他領域知識的能力,如果你要想在數據行業有一番建樹,工具是必備的,數據挖掘,計算機,統計學等知識。也同時,需要關注自己感興趣的領域,比如互聯網,金融等行業。
光有招式還不行,有點內功才能成為武林高手。
傳統的數學就是內功一般的存在,思想深厚,推導演化繁多,但是在實戰中招式不多,進攻不足,防守有餘。
如果選擇進入機器學習大數據等領域有可能飛檐走壁,練就絕世神功。
從這種意義上講,數學是出世的,機器學習等是入世的。要想在江湖上立足,多學一門技能有何不可呢,凡是應該仲裁博取,而不是批評抨擊。
你看各路英雄到最後都是都是心心相惜的。連從局部最優到全局最優思想都沒有,還好意思說自己是學習數學的,嗯哼。
「哼,我們高貴的純數血統才不屑鳥那些東西呢」
說機器學習/大數據水的人可是只看到了最表象的東西,是把自己拉到和CS一樣的數學水平,再用稀爛無比的代碼水平被CS碾壓。而沒有運用上自己學過的專業知識。
機器學習需要的基礎數學水平也就是線性代數和微積分了,如果你試圖用調參和堆層的方式去搞機器學習,完全和CS沒有競爭力嗎。。。你不會Cuda,不會優化代碼,僅用matlab、python能編出什麼玩意兒?能跑ImageNet嗎?
老鄂最近一直在搞他的大數據研究院,在元培和數院弄出了個數據科學專業(本科),叉院也有了大數據專業。他眼中的大數據,應該和某些答主所說的
「大數據……這玩意人家幾十年前玩剩的東西現在揀起來,只能忽悠,過幾年看著他怎麼冷下來的吧。幾個平均、相關、回歸就叫大數據,笑掉大牙,相關性和因果性都不分的人,連學應用數學的人都鄙視。而且,居然連學經濟的小本科們都玩膩了的拷打數據,居然成了商業核心……呵呵」
應該不是一個東西吧。
應用數學方面的人是否應該接觸機器學習?我覺得是應該的,至少應該了解。因為在某些方面,機器學習已經表現出了遠超傳統數學方法的效果,應用數學專業的同學至少應該了解這樣一門技術,說不定哪天就有人從中抽象出一門新的數學了呢。
聽起來很高大上;感興趣;但是其實不知道具體做什麼
據說院里準備開設數據科學專業了…(感覺就是統計專業衍生出來的…)
機器學習不知道,大數據從身邊現象說一說。
- 大數據在一般的上層一本大學內可能還不成氣候。鄙人只是一211工科強校的數學系學渣,本科階段學校無論數學系、計算機學院都沒有開設相關的入門課程;本科生也沒有相關的專業。雖然這和學校本身強勢專業方向有關係,但是也從一定程度上說明,在非985綜合性大學的本科階段內,這個方向普遍開展教育可能是有困難的,何況我們學校計算機專業還應該是在相對靠前的。這也就是說目前這個方向國內需要的還是精英階層的學生(高校研究生和985本科),也間接說明這樣的人才目前是不能大規模培養的。
- 潛在市場存在且很大,但是規模可能還沒有起來。平時關注NBA,也發現在職業體育中大數據的應用都已經在逐漸增加,說明除了一般的金融,電商,高科技產品外,還有很多其他可以開拓的空間(我想像力匱乏、見識少,見諒)。當然這裡只是舉個例子,中國的職業體育發展任重道遠,大數據應用到中國職業體育恐怕更是遙遙無期。規模上其實我並不是很了解情況,這是純粹的主觀臆斷。因為除了那些最大的那些互聯網公司外,其他小型公司和其他行業的公司想擁有屬於自己的數據部門,不僅有技術上的困難,還有資金的問題。長期對於數據分析的投入帶來的回報是否值得?日益龐大的數據,它的安全性和管理怎麼解決?
私以為大數據應該也或許將要成為未來社會的基石之一,就猶如網路一樣。因為現階段已經看到它確實解決了很多的商業問題,為普通人帶來了很多便利,甚至未來在醫學上都有可能會有很大的幫助。現在沒有網路,在城市裡人活著會很痛苦,不僅僅因為便利性,還因為需要獲取信息、社交、娛樂;未來如果一旦大數據廣泛地應用起來,那麼人很有可能也會「上癮」的。
「人們其實不知道他們想要什麼,一旦你給了他們,他們就知道了:『這就是我想要的!』。」——喬幫主。
還有就是人才不知道能不能跟不上市場的需求。
- 行業規則。這個規則我主要是想講法律。我國目前還沒有信息安全方面的法律法規,那麼與機器學習、大數據直接相關的數據,應該如果管理和規範?電信詐騙現在如此之多,一旦大數據市場真的龐大起來,而沒有相關的法律為數據安全性作為保障,那麼海量數據會不會就像空氣一樣流通在我們看不見的地方?然而又不能因噎廢食,放棄大數據。這個平衡點,非常困難。短期內這個應該不會制約技術的發展和市場的擴大,不過長期來看這是一個隱患。
- 未來?!當下是CS的時代,私以為也是一個過渡的時代。隨著80後、90後逐漸成為社會棟樑,網路將徹底普及,不再是21世紀初的狀態。那麼人類社會的下一個狀態是怎麼樣的呢?我想像不出來,但是我相信1. 大數據會是基石2. 機器更加普遍代替人力。那麼基於這兩點,更加遙遠的未來是否會出現大數據自動化處理的情況呢?說得近一點,當數據分析框架和工具被構建的比較完好時,從事這個行業基礎工作的門檻也會越來越低,這都是歷史規律。那麼接下來會發生什麼呢?
一點拙見,歡迎各位行業內人士指點,更歡迎行業外愛好者討論。
數學專業在這個行業就業還是非常好的啊,很多數學和統計專業的最後成為了機器學習的大牛
我學理論數學的,男票是電子工程研究生,接下來的劇情還挺寫實
「咦,男票在學ml耶,聽說好有意思,求帶一個~」
幾乎沒有壓力網上看完Andrew Ng機器學習,做了筆記和理論題,一次性理解率和正確率大概為90%後
「靠要想增加這個技能還得編程,就算不碼Python 也得碼matlab,作為用筆紙學理論數學的小孩踏粗comfort zone好煩, 這個遊戲還是你們玩兒吧.... 咦,男票,聽說凸優化(convex optimization )更理論一點耶....謝謝男票帶我漲姿勢~我繼續去寫證明去~"一群理工科人才流落到一個荒島上
數學家:我可以構建出一個完備的理論體系,在這個世界裡我就是上帝,實際上如果上帝是個優秀的數學家,這個世界完全可以更完美。你們這些搞物理理論的連個統一的模型都拿不出來,真替你們尷尬。
理論物理學家:我可以用經典力學和相對論描述宏觀物質,用量子力學描述微觀。等我在搞一搞弄個大統一場理論包打萬事萬物,時空傳送,曲速引擎理論上那都不在話下。
應用物理學家:頂樓上,等你搞定了我就做實驗幫你驗證再隨便找點那幫弱智工程師讓他們造出來。
應用數學家,演算法研究:我們這麼吊的理論人才竟然要和那幫搞工程的混在一起,好委屈寶寶。
工程師默默地用島上現有的材料造出一把弩
第一滴血!
雙殺!!
三殺!!!
ultra kill!!!!
rampage!!!!!
寫這個段子的目的是為了實名反對所有無意義的鄙視鏈,誠然純數學理論物理的知識要比工程類抽象的多,然而一個理論想要實在的對人類的生活做出一點改變少不了千千萬萬的工程師來處理那無數的工程細節問題。真正讓人信服的是那些理論實踐兼備的牛人,他們才是真正改變世界的人。畢竟真正靠純理論改變認知的人就那麼一小撮,大部分學理論的人還是得靠踏踏實實搬磚賺口飯吃。
最後愛因斯坦同志還是靠光電效應獲得了諾貝爾獎,而且還搞出一種改進的冰箱(雖然沒有成功商業化),所以類似劍宗氣宗的互相鄙視還是少點好,讓我們一起來雙修吧。(??ω??)?
做了三年演算法工程師,即將去中科院讀數學。我對機器學習、大數據這些還算是比較了解的。
應該機器學習和大數據現在在互聯網行業是最熱門的方面,現在所有的互聯網公司,如果不和這兩者扯上關係,都不好意思說自己是互聯網的。
不過,相對於數學專業,這些都用到的基本的大學知識,演算法也是比較成熟的,主要看數據量,數據量越大效果就好。確實能夠使計算機具有以前只有人類才有的能力,比如識別圖像,識別不同的人等等。對公司來說就是商業變現。對大眾來說就是使生活更加方便。
所以,對於數學專業來說,機器學習和大數據是比較容易入門的。
你可以看看現在的大數據和雲計算這方面的知識。
背景:本科是數學專業,研究生轉統計,後來工作的時候直接去做了Data Scientist,從基礎的analyst到ML演算法。
就我自己來說,我從本科時候就是對偏應用方向感興趣,計算數學/凸優化/Operation Research/Game Theory,都是本科就開始接觸的內容。對於機器學習和大數據,唯一令我不太高興的點就是證明邏輯不太嚴謹,尤其是非統計類衍生出來的演算法,但是在工作中,解決問題的方法才是好方法╮(╯▽╰)╭,是的,工作中我會精分。
學數學的在這方面的優勢就是學機器學習不論理論還是後邊實踐,學起來非常快(數學背景的人如果對這個方向感興趣,完全可以自學),但是編程是大傢伙兒的痛點。
另,純數的美無法抗拒,但每次你要應用的時候看著一堆假設條件沒法滿足也很蛋痛。
以上。
機器學習的方向是啥?我一個學數論的對這個完全不了解。哦,統計模型的計算機解法么?不感興趣……
推薦閱讀: