機器學習領域是否已經達到飽和?

縱觀知乎,很多人都在做機器學習的相關研究,請問現在機器學習領域是否飽和了呢?以及市場上真的需要如此多的機器學習的人才?機器學習未來是否會成為第二個泡沫?


這個話題很有意思,我想從個人和公司兩個方面談點自己粗淺的感受。

先說個人:
機器學習人才大致可以分為兩類:一類是研究型人才,側重在發明演算法; 另一類為應用型人才,著重於使用演算法。

研究型人才自不必說,這個領域的很多博士被瘋搶,就能看出端倪,至少遠沒有到飽和的地步。其實不止機器學習,任何領域的創新型人才,恐怕都是很搶手的。

絕大部分人恐怕屬於應用型人才,當然,這裡應用其實就是指垂直領域的綜合性應用,而不是mnist這類samples。如果只是調用機器學習的包(比如sklearn)做一些簡單的例子; 或者在caffe或tensorflow跑幾個例子,設計(修改)一下網路,調整一下超參數,拿數據訓練及測試一下,這類人才將來肯定會飽和的。工作量不大,又沒有太多創新的話,可替代性就高了。

那麼哪種人才不容易被淘汰呢?以我個人的經驗看,大致有這麼三種:
1.一種是具有一定的機器學習基礎,又對某個領域具有深刻認識的人才。這類人在某個行業紮根很深很久,熟知其痛點和需求,尤其清楚有哪些坑。既可以在公司里做產品經理,時機成熟也可以創業,可謂進可攻退可守。
2.另一種是技術基礎紮實,學習能力強,具有一定的理論基礎。尤其是演算法實現能力強,甚至可以對框架進行優化,而且速度快的人,老闆最喜歡了。你可以打聽一下,有多少公司在討(zhuang)論(bi)AI,但就是不知道怎麼做。數一數,恐怕有一大堆吧。
3.第三種是產品開發型人才,這類人可能不一定很懂演算法,但很清楚怎麼做機器學習應用,怎麼把產品做到極致,好用。比如人臉識別系統,演算法只是一小部分,更重要的是整個系統架構,做一個demo當然容易,但一個端到端的人臉識別系統包括視頻採集,解碼,人臉檢測,特徵提取與人臉資料庫(檢索),業務邏輯,聯動報警,分散式多級部署等等。

以上第一類人才側重於"我們要做什麼,哪個方向",第二類人才側重於"怎麼做",第三類人才負責"怎麼把產品做好"。

再談公司:
一個公司從立項到交付,也需要這三類人的通力協作: 第一類人協助管理層做決策,比如,根據多年的金融領域經驗,決定做一套股市分析預測系統,第二類人趕緊跟上,先研究國內外有沒有相關的論文和研究成果,包括開源實現,然後快速實現一個原型,至少驗證技術大致可行性,後期慢慢優化,這一步過了之後第三類人出場,做一套完整的股票分析預測系統……

機器學習在垂直領域裡的需求非常多,如果能把需求跟技術很好地結合,個人感覺,對企業來說,很長一段時間裡都不會飽和。

機器學習只是工具,解決問題才是最終目的。機器學習也需要跨界。舉個例子,機器學習與IOT結合就會產生很多的應用。比如:通過設備運行數據,預測其故障可能性,使用壽命。

最近參加了日本最大的AI和IOT展,感觸很深。一方面,各行各業對機器學習的需求非常旺盛,里三層外三層,簡直圍的水泄不通,另一方面,腳踏實地才能保持企業甚至整個產業鏈的健康持續發展。另外,日本這些企業生意是真的很好,我很嫉妒。

最後上圖,順便發福利:

什麼?AI用於"接客",還省力?哦,日語里接客就是迎賓的意思,比如下圖這位花姑娘,就在"接客":


我大舅90年從北大畢業到美國羅德島讀博,讀一半從氣象轉行程序員,他說從他那個時候開始,留學生就開始為了工作轉行程序員了。(大家對那個年代的留學生所知甚少,一是經濟原因,二是教育問題。我大舅北大研究生畢業後寫了一千多封信,找了一年才找到一個願意全額獎學金收他的老師)

來張89年的GRE考試單,報名費15元哈哈哈:

(在我家珍藏多年)

他兒子,我表弟,大學依然依家裡意思學習計算機。

而從我小時候開始,我就聽過「美國最火的專業是金融和計算機」,當時我還想著,那等我長大了,計算機和金融就該過時了吧。

於是大學很傻逼的學了個材料。

出國以後發現,現在的就業形式跟我大舅三十年前來美國根本沒有區別。計算機和金融依然是最火的專業。

幾十年了,計算機依然是「新興產業」。

但是呢,「程序員行業已經飽和」這句話從小聽到大,這個話題從知乎誕生一直到現在。


我並不是非常了解機器學習,但個人觀點是:任何具有重大意義的新興行業,發展起來都是曲折漫長的,飽和與否只跟需求有關,跟熱度無關。

機器學習試圖用電腦代替人腦思考學習,意義重大,絕對不是時代的一個小浪花而已。

如果剛冒出來個新行業就說飽和,只能說你太高看人類發展速度了。

一個小小專業的發展速度,在社會發展的洪流當中,在歷史的進程面前,真的不值一提。

結尾再來點有歷史價值的照片:(跟答案無關啊,就是曬一曬)

托福的備戰書:

價格亮了

內容:

我們家最悠久的傳說是什麼呢,就是我大舅為了托福考出好成績,拿詞典背單詞,背到二十多遍的時候背一頁撕一頁,最後撕了整個英漢字典。

發個在我大舅家吃飯的照片~(左我男票,中間我大舅,右邊我爸)

波士頓程序員的幸福生活:


少年 你對飽和一無所知
我本科金屬材料?機械 冶金這行當誕生恐怕兩三千年了 從青銅器到鐵器 再到鋼鐵 工業革命之後 鍊鋼煉鐵也有兩百年了 我說我們用的最多的鑄鐵 已經用一百多年了 而且沒有根本的改進 你敢信?每年十多萬材料冶金畢業生,積壓幾十年了,這才叫飽和~
機械這行當從蒸汽機開始,也兩百年了,汽車用的內燃機也發明快一百年了,我說內燃機的效率這一百年提高不超過70%,你敢信?每年十幾萬機械畢業生,積壓幾十年了,這才叫飽和~
博士搞電子和微電子 電子這行當從真空電子管開始 差不多也一百年了 貝爾發明電話 摩托羅拉發明對講機 MIT林肯實驗室發明雷達 惠普兄弟發明微波測試技術 也差不多是第一次世界大戰的事了,你敢信?每年十幾萬電子畢業生,積壓幾十年了,這才叫飽和~
微電子就是半導體,我們現在的晶元都是得益於此,但PN結的發現已經是上世紀40年代的事情了,經過50年代的分立半導體晶體取代真空管,60年代集成電路的發展,70年代計算機體系結構和指令集的發展,但帶領下晶元技術突飛猛進摩爾定律逐步失效,英特爾新一代晶元只比上一代快了5%,你說氣不氣?每年幾萬微電子畢業生,積壓了十幾年了,這才叫飽和~
機器學習這套東西,2010年之前只有少數美國頂級高校的計算機專業在教,當時自動化學PID,統計系學假設檢驗,都不學機器學習,對口的人才很少,哪怕到今年也才剛剛創立大數據和人工智慧專業,第一批畢業生要四年以後,教育的滯後造成了巨大的需求缺口。深度神經網路2006年提出,ALEXNET2012年提出,對抗生成網路2014年才提出,alpha狗的深度強化學習2016年才提出,重大突破都是近幾年時間發生的,大量的知識還在論文上,都沒有編輯成教材,你說這算飽和嗎?
現在絕對是進入機器學習的最佳時機。


處於一個直接用框架甚至抄代碼的太多,正經做research的還不夠的地步。

當然最多的不是用框架的,而是人工智慧分析師,這種人主要屬於一行代碼都沒寫過,就開始為人工智慧乃至人類社會規劃未來百年藍圖的那群理論家、思想家、戰略家們。他們主要的活動場所,是知乎、微信公眾號、幼兒科幻級電視節目,以及各種微信討論組。

保守估計,這批人目前的數量,跟西藏被遺棄的藏獒數量差不多。


機器學習並沒有達到飽和,而真正達到飽和的是深度學習里多種模型的無意義的堆砌運用在一些稀奇古怪的應用而聲稱自己做出創新結果的文章。

而這類文章命名為通常是deep-variational/adversarial-recurrent/convolutional-encoder-decoder- network/model 的笛卡爾乘積。然而由於這樣低門檻的工作吸引並湧入了一大批研究者,所以導致一些簡單的low hanging fruit 問題已經被摘完了。

然而機器學習還有眾多問題還沒解決,比如continual learning, 模型可解釋性,catastrophic forgetting,生成式模型等等。希望這樣的現象也有利於加大對於真正硬骨頭問題和有價值研究的投入吧。


我96年上大學的時候,我爸說現在學計算機是不是太熱了,飽和了?


根本沒飽和,是還沒開始。

機器學習和一般碼農不一樣,面試沒有套路,不依賴刷題。不客氣的說絕大多數聲稱要招機器學習人才的公司並不知道這個人招進來能做啥,能提供什麼價值。所以自然就傾向於招有經驗的,讓這個人把需求發掘出來把架子搭起來,所以就望向了碩士博士,發過paper的,或者在大公司已經做過實際工程的。你說這個池子能有多大?

另外,真正搞機器學習的,里子里一定是個合格能幹的工程師,不然調參效率都上不去,更別說把模型帶到生產環境中去了。這又要刷掉一批眼高手低的求職者。

於是乎,現狀是你發現大家都在找機器學習經驗的人,似乎有巨大的泡沫,但是其實都是精確瞄準那一小撮,其他人根本是論外。這PhD的生產可沒培訓班那麼效率,周期更是四五年去了,這不都把企業逼到美國來挖人了。

所以不要擔心飽和不飽和,而是擔心自己功夫夠不夠硬。


這提問者要不是真蠢就是故意在黑。

機器學習領域都還沒正式開始呢,這頭幾十年頂多也就算個序章。飽和?那至少得等科幻電影不再拿人工智慧當點子的時候才有丁點希望。——你看過科幻天體物理的,科幻心靈控制的。你看過科幻環衛工作的嗎?你看過科幻公務員辦公的嗎?


我覺得沒飽和。我很同意@yycc的說法。特別靠譜又很懂原理的人不好找。

我們有些遺留下來的老項目老代碼,模型訓練,預測之類的前人都已經寫好了,但那些作者該跳槽也都跳走了。

現如今如果新的數據集很稀疏,或者有更豐富的數據類型,或者客戶提了更高級的要求,這時候就要拓展原來的老模型,對吧。

這可不簡單,需要對統計和優化有一定的理解,還要有行業知識,編程能力也不能差,還得心細。這種人一點也不好找,要不然怎麼會有refer bonus這一說呢。


機器學習是人工智慧領域較為年輕的分支,相關學科建立、集成學習系統研究以及各種學習方法的實際運用,將機器學習領域帶入新階段。在過去的十多年裡,我們見證了數據科學在學術界和商業界的發展,學會了如何正確地使用分散式計算、GPU,如何很快的建立抽象模型等等。人過智能彷彿完全轉化成了機器學習,每個人都在處理數據、基於數據為複雜的世界建模。

那麼,機器學習領域是否已經達到飽和了呢?今天,我們想借用卡內基梅隆大學(CMU)計算機學院院長Andrew W. Moore和副院長Philip L. Lehman最近在微軟亞洲研究院分享的相關觀點,來回答這個問題。我們劃定了一個具體的時間範圍,探討過去兩年和未來兩年機器學習的發展情況。

————這裡是正式回答的分割線————

大約2014年,許多人開始意識到我們在機器學習領域所做的工作還遠遠不夠,它們僅能實現改變世界藍圖的一半,而另一半則是被我們視為數據科學最頂層的決策系統。上世紀90年代,我們對所建立的系統都十分樂觀。但漸漸地,我們發現,這些系統在應用到實際生活中時並沒有效果,比如在優化城市交通數據時,一個完美的優化演算法並沒有幫助,因為那時我們沒有任何關於城市交通的數據。所以現在,我們嚴肅認真地考慮重新回到基於數據科學的大規模優化和決策上。

過去兩年中,機器學習領域的最大變化

對於許多大型搜索引擎公司來說,機器學習超過百分之五十的工作在於測試和驗證。因此,我對未來穩定、可靠且經過長期驗證的機器學習模型充滿期待,以及如何確保深度學習演算法不會在運行幾個月後走向奇怪的方向。對於機器學習演算法,會有工具幫助快速診斷目前正在發生什麼以及如何解決。例如,你有一些系統問題導致了隨機梯度下降的更新,並帶來了額外的延遲等,而對於這些問題你都可以很快地理解,並改進。但在我的學術生涯中,還沒有看到過類似的技術,所以我希望接下來的幾年,我們的機器學習模型可以在穩定性、安全性和長時間的可靠性上有更大的突破。

首先我想展示一下一位同事最近的研究成果。他研究的是針對如飛機和汽車動力系統的操縱系統前期和後期條件類型分析,這曾經被認為是最重要的證明軟體正確性的方法之一。我的這位同事採用老式方法將系統與控制系統中的統計和數值方法結合,來證明如果有一個機器人控制演算法,即使是一個非線性的演算法,它也會按照所說的來做。現在,美國許多的自動駕駛系統研究在提高系統安全的問題上停滯不前,因此,這項工作將非常具有實用意義。

在軍事方面,使用自動駕駛技術可以避免很多不必要的犧牲,僅僅使用一輛車就可以帶動其餘的自動駕駛車輛。雖然聽起來很簡單,但這項應用實現的最大阻礙還是證明我們所使用的機器學習系統和這些自主駕駛場景的可靠性。所以,當我們在新的研究領域找尋策略時,自適應演算法的安全性驗證相比於增加現有演算法速度的準確性,可能會更重要。

我們還做了很多有趣的研究。如今,人類生物識別也已成為一個科學研究方向。與從演講錄音中提取演講內容相反,我的一位同事,Rita嘗試了從中提取其他的聲音信號,進而得到關於演講者的信息。我們可以從低解析度的數據中準確的預測出人的氣管形狀和大小,同時,這些信息與人的身高、體重等其他身體特徵也密切相關。簡而言之,她可以在一場演講錄音中了解演講者的身高、體重、成長地等等。這也是機器學習新應用的一個例子。

此外,一個研究的重要領域是逆向強化學習(Inverse Reinforcement learning)。眾所周知,在強化學習中,我們會定義一個獎勵函數(reward function),然後嘗試尋找最大化獎勵函數長期結果的策略。而在逆向強化學習中,我們則是嘗試根據其他個體選擇的行為來推斷它們的獎勵函數。比如,根據車流和行人已有的移動軌跡我們可以預測每個人、每輛車的移動可能。所以,當我們把目光投向計算機視覺的未來時,實際上我們已經將重心從觀測即時信息,轉向了預測將來15秒的狀態信息。這對於自動駕駛和人群的安全都將有重大意義。

我們關注的另一個領域是,自主平台在機器人相關方面的成熟應用。預測空間的3D模型在機器人技術進步的基礎上,也已經非常成熟了,而這也是將來機器人發展的基礎。如果你熟悉這一成熟技術背後的計算模型,從獲取數據到傳送到雲端,它使用了大量的EM 演算法以加速前後的推理。而我的一位同事的研究突破在於使演算法有了一個非常準確的增量,不再需要上傳數據到雲端。通過簡潔的代數技巧(algebra trick),我們可以模擬整個EM演算法的運行。更有意義的是,低功耗的遠程設備就可以完成。

接下來的兩年內,機器學習領域可能會有的突破

目前說機器學習領域已經飽和為時過早,我們還有很多有趣的方面沒有探索。情緒壓力測試是一個快速成長的領域,微軟是這方面的專家。在匹茲堡,我們也對這一領域充滿興趣。這裡有一個重要的應用,我們可以通過觀察人們說話時的面部特徵,評估他們對於某件事情情緒波動的程度。舉個例子,當用於醫療時,我們可以通過觀察病人的反應,判斷治療是否有效。一年前,我們曾有實驗表明,在醫生可以判斷病人生理特徵表現的六周前,我們就成功判斷了治療的效果,通過對面部肌肉的檢測我們可以獲得許多情緒信息。因此,未來我們或許可以更快捷、有效地幫助患有精神疾病的病人。

同時,對於大家關注的用戶和電腦間的對話系統,我們的兩位同事發現,對於複雜對話,病人談論到一些疾病癥狀,或者學習上有疑問想獲得反饋的孩子們,機器能夠對對話產生更快、更成功的結果,因為機器可以根據用戶情緒調整反饋結果。

所以,通過這些客觀證據我們可以看出,如果想建立一個優秀的對話系統,則需要考慮到實際情緒的相互作用。現在在CMU,我們有計算機視覺實驗室,有對於語言技術的研究,我相信在不久的將來,情緒認知也會是我們的研究重心。

接下來,我想談談知識圖譜。在美國,許多企業和大學包括微軟,以及一些政府機構經過一系列的會議討論一致認為,我們需要分享構建的大型知識圖譜。因為對於對像阿里巴巴、亞馬遜這樣的零售公司來說,為各種產品構建單獨的知識圖譜是非常困難的,同樣的,對於做地圖的公司來說,為城市地標構建單獨的知識圖譜也非常困難。

患者想要討論醫療健康問題、學生想討論關於學習的問題等等,在未來,商業領域之外的對話系統構建方面,我們還有很多工作可以做。醫療、教育、政府等,如果每個公司都單獨構建知識圖譜,那麼這將消耗大量資金,同時,不同的語言也會帶來很多不必要的資源浪費。因此,我們強烈認為,合作將是未來工作的基礎,我們將一起構造開放的知識網路。

首先,我們可以將各種實體作為知識圖譜的節點,這些實體可以是埃菲爾鐵塔、CMU音樂學院、甚至可以是一個投影儀等等。對於這些數以萬億的實體,目前我們有很多類型的實體工具,它們各有利弊。成本高、針對性強的圖譜難以大範圍應用,通用的圖譜又過於耗時。例如GIS系統雖然已經很完善但仍難以應用到其他領域。所以,將來我們在構建和存儲實體時,需要在資料庫中為他們和其他實體建立對話聯繫。

然後,我們要匹配引擎(matching engine)。這與搜索引擎非常相似,同樣需要快速的深度學習能力。匹配引擎從演講、文本、可視範圍中選取內容,以構建知識圖譜中實體的概率分布,這對於構建一個準確的匹配非常重要。所以,對基於知識圖譜實現具體應用的人們來說,他們需要處理概率集合以形成總體結論。

大家都知道,現在大部分的知識圖譜是基於三元組的,三元組是一種原始的表達事實的方式。除了科學實驗,它還出現在一些與科學相關的領域,如經濟、金融等。專家們發現,因為缺乏統一的數據模式,即使有很好的數據集,它們還是很難在數據間建立連接。這也是我們希望通過構建全局知識圖譜來幫助我們的地方。

有趣的是,在構建全局知識圖譜中,我們還有很多機器學習的問題需要解決,比如合併指向同一實體的不同對象或者區分相像但不同的對象等。雖然我們有很不錯的概率模型,但是在公共領域之外,它們無法像成熟的演算法一樣處理數萬億的內容(mentions)以建造理想的對話系統。發現問題,解決問題,這是一件非常令人興奮的事情。

————這裡是回答結束的分割線————

以上回答摘選自微軟研究院AI頭條,講堂|CMU計算機學院院長:未來24個月,機器學習領域將可能有哪些重大突破。

感謝大家的閱讀。

本賬號為微軟亞洲研究院的官方知乎賬號。本賬號立足於計算機領域,特別是人工智慧相關的前沿研究,旨在為人工智慧的相關研究提供範例,從專業的角度促進公眾對人工智慧的理解,並為研究人員提供討論和參與的開放平台,從而共建計算機領域的未來。

微軟亞洲研究院的每一位專家都是我們的智囊團,你在這個賬號可以閱讀到來自計算機科學領域各個不同方向的專家們的見解。請大家不要吝惜手裡的「邀請」,讓我們在分享中共同進步。

也歡迎大家關注我們的微博和微信 (ID:MSRAsia) 賬號,了解更多我們研究。


希望那些已經從業或者即將從事機器學習/深度學習的,應該意識到自己真正的競爭對手是兩種人,一是入行早的,二是學藝精的,當然這兩個都有前提,下面仔細說。

對於入行早的,在一個機器學習還是比較陌生的領域,如果他們深入參與一些項目,那麼拿到的一手經驗其實是很難得的,如果加上時間的沉澱,那麼這種人其實就是有經驗的高級人才,坑都被挖了後給填了,留給後來的人更多的是修修補補了。

對於學藝精的,當所有人都在談機器學習/深度學習的時候,你就要談得比別人深,比別人專,你的學歷,你的技能,你付出的努力,都比大多數人好時,你就不用擔心那麼多人。

很多人從事這一行,這樣無形中拉高了從業的門檻,希望已從業的能踏實做,為後來的人積點福,而即將從事的能踏實學,為學弟學妹立標杆,最後說一句,未來缺的一直都是高級人才,飽和的是低端市場。


說到機器學習方向飽和的人,可能是沒見過一些基礎學科的專業的飽和程度。

之前在學校讀書的時候,就聽一些老師說過,最近放出來一個助理教授的職位,但是收到了200-300封簡歷,全部都是北美歐洲或者國內名校的PHD。

之前聽說在1980年的時候,數學PHD還不需要做posdoc就可以找到工作;到了1990年,基本上都要做一兩年的posdoc才可以找到下家;到了00年以後,回國的話馬上還能找到一個不錯的職位,雖然工作不高,但是對論文的要求也沒那麼高;等到了2010年以後,國家千人計劃等項目的開啟,沒有在國外混到一個好職位的,沒有幾篇好文章的,基本上在國內就沒法找到教職了。等到了2020年以後,還真不知道是什麼樣的行情了,進入好學校的要求肯定是越來越高,要求的論文數量也是越來越多,質量也是越來越高了。

現在國內這些大公司放出一個機器學習工程師的崗位,我想是不需要和300個PHD來PK這個崗位的(高端職位除外)。即使被這個組或者這個部門放棄了,換一個部門或者小組重新投一份簡歷就好了,實在不行可以換一個公司投簡歷。至於學校的話,就沒那麼多學校了,公司的數量遠遠大於學校的數量。

退一步講,公司總有那麼多業務需要做的,無論是推薦業務,安全業務,還是運維業務。只要有業務,就需要有演算法工程師去對接,就要做離線演算法的優化,線上項目的對接等工作。如果是在公司裡面做人工智慧相關的工作,除了機器學習方向,還有自然語言處理,語音識別,圖像處理等熱門方向。即使是機器學習,做不同的業務線所使用的方法也是截然不同的。例如,雖然都是機器學習,但是推薦系統卻不能夠解決業務安全的事情,反過來,一個安全系統也不能夠完成推薦系統的工作。綜上所述,可以選擇的方向和工作類型都是非常多的。因此,目前看上去其實還好,相比較於一些傳統的基礎學科方向,機器學習方向遠遠沒有飽和。


普通人對某個領域是否飽和的理解是:

看一兩本書,頂多考個證,就能找份不錯的工作,這叫行業沒飽和。

不然行業就是飽和了。


二十一世紀是機器學習的世紀……


AI人才缺口巨大。

人工智慧·招聘信息分享

薪資情況

這個就不能被稱為飽和了吧。


互聯網需求旺盛的應該不會飽和,別的地方嘛,其他不敢說,我大山東真沒啥公司有機器學習方向的需求。。。。


現在談飽和還太早了。
要討論一個方向是否已經飽和,要看這個方向能帶來多少潛在的行業。
我們可以把一個方向考慮成一棵樹的節點,這個方向的容量是以之為根節點的子樹的總節點數。
假如某個方向能節點能產生很多分支,那麼這個方向的容量肯定是龐大的。
就好像當初有人說計算機行業會飽和,現在看來那簡直是可笑至極。
但假如說現在討論的是iOS開發是否飽和了,那麼這個是有可能的,因為iOS開發這個方向位於樹的末端。

那麼問題來了,機器學習處於樹的哪個位置呢?
肯定不是末端,而且從長遠來看,機器學習帶來的分支不亞於互聯網。

所以,從長期來看,機器學習不會如此輕易地飽和。
或許當機器學習發展到一定程度後你就不用擔心它飽不飽和了,畢竟這可是最有可能實現共產主義的技術。

------------------------------------------
補充一點
長遠來看不容易飽和並不表示短期內不會飽和,畢竟短期內房子就那麼大,突然來一堆人還是遭不住的。不過這所房子的門檻還是不低的,這方面不需要太擔心。


騷年,你是不是想搞個大新聞啊!

無論這裡的飽和是指工業界職位,還是研究領域內課題,實際情況都恰巧與此相反。「機器學習」走入大眾視野才是近兩年的事情,即便帶有泡沫成分,也絕不會是曇花一現,很多崗位連人都沒招上,怎麼可能就把「機器學習」列入「夕陽產業」呢?

為了更清晰地了解當前「機器學習」的崗位需求情況,推薦大家通過相關招聘網站進行檢索,同時也可自帶梯子,登入幾家大廠基於機器學習演算法構建,並正在推廣的職位搜索服務。

換到學術界來講,「機器學習」相關研究課題不止不會「無礦可挖」,只是粗略看一下領域相關的會議,用在瀏覽器中打開開發者工具使用 jQuery $("classname").size() 計算下文章數量:

http://papers.nips.cc/

http://openaccess.thecvf.com/menu.py

http://dblp.org/

就會發現各大會議中,「機器學習」的論文接收量逐年上漲,一派繁(guan)榮(shui)景象。我們在使用的大多數方法,很多時候其實是給數據點畫三八線做分類,依靠偏導數計算梯度等方式優化模型的初級方法,很多東西在研究人員看來,都還是說不清道不明的。so,「機器學習」飽和到讓數以萬計的研究人員下崗失業,幾十年內估計是不可能了。。。就連近幾年的爆款方法「深度學習」,據筆者所知連自主調節結構在訓練過程中逐漸「生長」都做不到,在大多數情況下,我們在做的事情都是:調參!

且不論生物、金融等各個領域的產業界與學術界都在向「數據科學」這個萬金油的行當靠攏,就連量子物理學博士,都需要「機器學習」方法處理大量數據輔助研究工作。總之,這一波「機器學習」熱潮絕不是只是個大新聞而已,與其坐而論道不如上手試玩~


在知乎上有幾年了,似乎和寫程序員相關的任何一個方向都被提問過是否飽和了。


。。。。

並不 所有 計算機graduate level以上的領域 機器學習 神經網路 資料庫 高等演算法 這一類的領域 一直缺人。

可惜也沒多少人會這些東西。。。


推薦閱讀:

俄羅斯人編程為什麼那麼厲害?
計算機專業大一大二該怎樣提升自己的專業技能?
有哪些實例可證「世界是虛擬的」?
十行以內,你寫過哪些比較酷的 Matlab 代碼?
如何評價 Kaiming He 在 ICCV 2017 上拿下雙 Best 的 paper?

TAG:機器學習 | 計算機科學 |