截至 2016 年 3 月,機器學習、數據挖掘、計算機視覺等的泡沫有多大?

知乎上搜過,google上也用中英文搜過,沒有找到近期(一年以內)對這個問題比較詳細的論述


謝邀

現在,2016年6月,機器學習、數據挖掘、計算機視覺等應用毫無泡沫,甚至遠遠沒有發揮演算法應有的潛力。

從我在 Trulia: Real Estate Listings, Homes For Sale, Housing Data 工作的經驗來看,公司幾乎每一個產品線都有可以演算法化的地方。同時,不少新的演算法可以帶來全新的產品特性,提升用戶體驗,提高公司核心指標,拓展出新的營收渠道。

未來3到5年,會是從自動化轉向演算法化最快的階段,不少公司將會收益於此,各種核心指標會翻翻,跑得快的公司會吃掉跑的慢的公司。受益於兩大原因:一是公司已經積累了大量的數據,為演算法化打下了數據基礎。而同時,由於現代技術工具和生態系統的發展,對於一個月活千萬的產品,一個5到10人的全棧數據科學家團隊就可以支撐起一個公司若干核心演算法的端到端的所有任務,包括從研發到支撐最後的產品。

但是,對於現在的創業風潮,把各種演算法拿出來作為第三方的服務來創業,我個人認為是比較難成功的。核心原因是各種演算法需要與公司的核心產品線整合,演算法本是就是公司核心產品的一部分。能使用第三方服務的往往也都不會是核心的產品演算法。

----
陳然_Ran的微博


泡沫肯定是有的。據我了解,泡沫可以分4個方面:

  1. 公共輿論方面的泡沫。這主要體現為公眾對AI的恐懼,怕AI替換掉自己的飯碗。很遺憾,一些科技界名人,如蓋茨和Elon Musk,也被一些所謂未來學家的預測給忽悠了。
  2. IT公司招聘的泡沫。我猜做機器學習相關的人都會被很多獵頭聯繫吧。機器學習這個詞里包含太多子領域,每個人只能做很小一方面。所以有的人去的一些職位,他們博士做的東西並不太用得上。
  3. 個人培訓的泡沫。july和小象等開的機器學習相關的培訓班,每期上500人的規模是常態。相當一部分學員我覺得其實就是去湊個熱鬧的吧,有個別學員連矩陣是什麼都不太清楚。。
  4. 論文,尤其是深度學習的泡沫。這方面,做CV的公司應該理解最深。他們一般一個新演算法出來就會很快實現一下試試效果。結果呢,能按作者claim的那樣work的並不多。。不過我不是內部人,詳情就不知道了。希望有內行人出來詳細說說。

你可以把這些作為實業,金融會有泡沫,互聯網會有泡沫,實業很少有。
如果說有泡沫,也是這類公司用金融手段融資出來的泡沫。

Data Science/Analytics 出身,可以在諮詢行業做些什麼? - Ruobing Shen 的回答


說有泡沫應該是基於以下幾個方面:
1、國內學術界產出的論文質量高的不多
2、可能是題主沒有體會到大數據給你帶來的方便,當然還有你看不到的企業在大數據方向的價值。
3、是有很多做大數據產品的公司,但這還沒形成泡沫。
----------------------------------------
4、舉個例子:目前,我在某上級審計單位做稅務統計,數據量很大。之前定的方案是基於傳統的資料庫設計的,後來遇到了數據存儲的問題,以及跨庫查詢的問題。這樣,就導致了很多問題,目前,我們正在往Hadoop陣營遷移。大數據相關的技術能夠加快審計規範化的形成。


一般來講,人們會把自己不懂,很多人追,且很多人賺到錢了的東西,叫做泡沫。


搞科研或者實幹的,沒有什麼泡沫,一樣是在演化發展,可能會出更厲害的成果。

如果是創業或者僅僅學過幾下子覺得自己是data scientist的人來說,不好意思燕樂寸說了很快會有個冰河期......


什麼玩意都沒有哪來的鬼泡沫……


知乎待久了感覺現在什麼都是泡沫,不過還好,我所在的屠宰業還沒出現泡沫。


門檻越高,泡沫越低,你以為是o2o,p2p?


泡沫是因為low


機器視覺哪來泡沫。。。學了發現市面上招這一行的公司太特么少了,國內根本還沒大規模應用


不明白哪有泡沫。。。


泡沫如何界定? 不能因為火就說泡沫啊


現在國內很缺,沒有泡沫未來幾年 哪家公司有數據和自己的演算法 就能勝利


個人看法
一、硬體不行,二進位的計算速度太慢了,現在好像只有美國在搞別的進位的,類似夸克計算機什麼的,物理數學博士大概接觸更多些。

二、大數據這個東西還很早,完全沒開發,大數據不是說收集了數據統計統計就是大數據了,這個是要收集數據軌跡的,說白了最後數據應該是呈現三維的。一個數據應該不是確定值,而是最終以函數形式呈現出數據軌跡才叫大數據,而這點現在最尖端的數據也沒有完全做到


先問有沒有,再問其他問題OK?


推薦閱讀:

為什麼 Google 翻譯只重演算法不重語言學的語法結構和規則?
有誰可以解釋下word embedding?
深度學習應用在哪些領域讓你覺得「我去,這也能行!」?
如何評價季逸超、Peak Labs 和 Magi 搜索引擎?

TAG:數據挖掘 | 機器學習 | 自然語言處理 | 計算機視覺 | 大數據 |