吳海山:跨界的數據洞察者 |「35 歲以下科技創新 35 人」中國榜單專欄
來自專欄 DeepTech深科技
自 1999 年起,《麻省理工科技評論》每年都會推出「35歲以下創新35人」(Innovators Under 35)榜單,旨在於全球範圍內評選出被認為最有才華、最具創新精神,以及最有可能改變世界的 35 位年輕技術創新者或企業家,共分為發明家、創業家、遠見者、人文關懷者及先鋒者五類。
2017 年,該全球權威榜單正式推出中國區評選,並已公布並首屆評選結果。現在,《麻省理工科技評論》正式開設「35歲以下創新35人」中國榜單專欄,以人物報道的形式幫助中文讀者了解這些來自中國的新生代科技力量。
吳海山·遠見者
「跨界的數據洞察者」
獲獎年份:2017 年
年齡:33 歲
職位:BlackRock董事
獲獎事由:利用時空數據挖掘,量化分析並預測群體行為,通過移動大數據來驅動經濟系統的量化研究,分析洞察經濟問題。
「不想當將軍的廚子不是好裁縫」,這是一句關於跨界的網路俏皮話,但它在某種程度上也揭示了一個道理:有時候,跨界才能做出突破性成果。
一名計算機視覺領域的科研工作者,通過他對數據挖掘、複雜系統的深入理解,最終開發出了一套可以量化和預測中國經濟的系統。這位跨界的科研工作者,正是吳海山。
吳海山目前在全球最大的資產管理公司貝萊德(BlackRock)擔任董事。在這之前,他曾創建深知科技(SenSight Technologies)併兼 CEO。藉助人工智慧和時空大數據(如衛星圖像數據、手機移動定位數據以及物聯網感測器數據等)技術,深知科技打造經濟趨勢的量化和分析系統,不但可以進行宏觀經濟走勢分析,還可以預測上市公司營收,並為多家投資公司提供服務。
2011 年,吳海山剛剛在復旦大學計算學院取得了博士學位。他當時研究的領域是計算機視覺,主攻三維空間中物體的重建和跟蹤。然而就在博士研究期間,吳海山對一個生物領域的問題著了迷:自然界中動物的群體行為是怎麼產生的?比如大海里的魚為什麼可以游成一群,天空的鳥為什麼可以飛成一群?三維空間的物體跟蹤技術,是否可以幫助回答這些謎題?
吳海山希望通過計算視覺和數據挖掘技術,來量化分析這些複雜但又常見的自然界現象。懷揣著這個想法,在 IBM 研究院短暫工作一年後,他以博士後研究員的身份,加入了普林斯頓大學生態與進化生物系的 Couzin Lab, 開發了多個演算法和軟體,通過視頻跟蹤技術,獲取動物運動軌跡數據,並和生物學家一起用數據科學、人工智慧技術來量化分析這些生物群體行為的規律,研究成果先後發表在了 PNAS, Current Biology 等頂級學術期刊上。
2014 年,還在普林斯頓的吳海山看到了百度開發的一個數據可視化項目——百度遷徙。這個項目通過手機定位數據,來可視化春節期間中國人的群體遷移行為。吳海山被這個項目打動了,他意識到手機移動位置數據可能是研究人類群體行為最好的手段之一。
隨後他回到中國,加入了百度研究院大數據實驗室,開展了基於手機移動定位數據的群體行為研究,並通過百度的時空大數據來量化分析中國。他發現,手機地圖搜索數據可以非常準確地提前預測某一個區域的人群流量。基於此,吳海山和他的團隊開發了一個人群預測和異常預警系統,並作為公共安全服務,免費開放給公眾。
在這個研究課題完成之後,吳海山把眼光放到了一個更大的目標:中國的經濟系統。他希望用時空大數據,來量化分析這個更為複雜的系統,為經濟學家、投資機構和政府部門提供更為科學的參考依據。吳海山為此投入了一個全新的項目:MobiMetrics 即移動計量學。這個項目通過利用時空大數據,來量化和預測經濟現象,如估算失業率,預測消費趨勢,甚至可以預測特定公司的營收。前百度大數據實驗室負責人、現騰訊 AI Lab 主任張潼稱,吳海山的這套系統能夠幫助人們更好地理解中國複雜的社會經濟體系。
該項目已經實現的研究成果包括:
1. 估算中國當前不同行業的就業趨勢;
2. 量化中國當前經濟從以前的投資驅動到今天的消費驅動之間的轉型趨勢;
3. 計算中國房地產的空置率,以及導致中國鬼城現象的原因;
4. 通過時空數據多維度定義和識別貧困,為精準扶貧提供更科學的依據;
5. 預測上市的業績表現。
這些成果得到了國際媒體的廣泛關注,同時也給了吳海山一個啟發:他或許可以通過挖掘更多類型的大數據,尤其是物聯網感測器數據,來量化分析更多的經濟問題,進而構建一個實時的經濟運行地圖。這也正是他當時創辦深知科技的初衷。吳海山表示,如果說計算視覺技術為研究生物群體行為提供了一個全新的手段,那麼,感測器大數據結合人工智慧,則是一種革命性的方式,使得我們可以更好的洞察愈加複雜的經濟系統。
推薦閱讀:
※今日數據行業日報(2016.08.03)
※今日數據行業日報(2016.07.20)
※「數據故事」的兩大危險信號
※BI應用中的矛盾(轉)
※在動物身上進行藥物試驗,或許並沒有那麼可靠
TAG:數據 |