計算機科學家的土豪人生:人工智慧人物譜(二)

科學家 vs. 金錢,是個值得探討一輩子的有趣話題。現如今擺在明面上的事實是,真正有才的人工智慧科學家鳳毛麟角,能被 Google、Facebook、百度搶來搶去的那撥人年薪動輒幾百萬美金,搞得一眾苦逼碼農們唏噓不已。上行下效,這年月哪怕是毫無經驗的應屆畢業生,也願意給自己的簡歷上貼上大數據、機器學習、神經網路之類的標籤,就像淋了水的蔬菜,開了光的菩提,身價即便不漲,內心也是舒暢。

實話實說,計算機科學家能賺錢的不少,與其他門類相比,計算機科學這個圈子跟熱門行業離得更近,教授容易申請經費,學生容易打工養活自己,腦筋稍微活潑一點兒的就各種開公司,拉投資,賣概念,再不濟,就算老老實實待在大公司里寫代碼,收入也高過普通辦公室白領不少。

可十塊錢是錢,十萬億也是錢。幾百萬美金的年薪有人看了眼饞心熱,有人卻當它是鍵盤噼啪一響就翻來滾去的數字遊戲。所以,看錢得往高處看——這一篇,咱們接著聊人工智慧領域的大牛科學家,而且,先拿金錢設個門檻兒,這門檻兒其實也不高,幾十億美金起步吧。

身價幾十億美金的計算機科學家?嗯,我們先從許多許多年前聊起。

1980 年代,李開復研究非特定語者連續語音識別的時候,有個叫 Peter Brown 的神秘人物起了不小的作用。李開復在自傳里是這麼說的:

「1984 年暑假即將來臨,我正沉浸在自己課題的十字路口上,不知道何去何從。這個時候我遇到了我的一個師兄彼得?布朗(Peter Brown),他看到我愁眉不展,就把我叫到一間教室里,在黑板上寫了幾個統計學公式。彼得?布朗對我說,『開復,我知道你在做語音識別,並且為之苦惱,但是你為什麼不嘗試一下統計學的方法呢,從統計中抽取數據我想應該能夠提高語音識別率,你覺得呢?』」

李開復講得簡單,其實裡面還有一點兒背景需要交代。

這個 Peter Brown 在人工智慧領域算不得什麼頂天立地的大人物,但在技術發展史的幾個關鍵點上,都堅定地站在了代表未來方向的一面。他跟當年 CMU 畢業的許多博士生一樣,進入了那個時代 科學家們最嚮往的幾個超級樂園之一——IBM 的 T. J. Watson 研究中心。

1970 到 1980 年代,IBM 研究中心(「深藍」的誕生地),貝爾實驗室(UNIX故鄉),是不是還得算上一個施樂的 PARC(蘋果電腦的圖形用戶界面可以溯源到這裡)?它們差不多就是計算機科學的三大聖殿了吧。

在 IBM 研究中心裡,Peter Brown 跟著 Frederick Jelinek 領導的小組做語音識別。順便提一句,這個 Frederick Jelinek 是寫《浪潮之巔》的吳軍博士的導師,是自然語言處理領域的權威人物,他的好幾個學生(還有學生的學生)在 Google 工作時也跟我有過項目上的交集。

Peter Brown 這個語音識別小組要解決的是 IBM 關心的聽寫問題,目的是要用語音識別來代替打字機,代替字處理軟體。技術上講,那個時代的語音識別主流是做專家系統,大概屬於符號語義學派(Symbolic AI),可 IBM 里的這一小撮人卻悄悄搞起了概率統計模型和 HMM。箇中原因說出來,就完全沒有了神秘感——IBM 那撥人之所以去搞概率統計,倒不是真的因為他們預見到了未來,而是因為他們一時找不到語言學方面的專家。沒想到,弄一大堆訓練數據統計來統計去,效果還真比專家系統提升了不少,技術曙光初現。

李開復當時在 CMU 讀博士。IBM 的語音識別是公司里的機密項目,Peter Brown 卻因為師兄弟的關係,把 HMM 以及相關的幾個關鍵詞寫給了李開復看。李開復問起演算法細節,Peter Brown 又支支吾吾起來,一邊讓李開復去看他們發的 paper,一邊又旁敲側擊地提醒說,「發表出來的,都是效果不好的。效果好的,我們都不發表的。」高手之間,原不用說得那麼明白,就這麼明著暗著一番暗示,李開復硬是順著這條概率統計的道路走了出來,還走得更遠更好,研究出了比 IBM 發布的聽寫系統好很多的語音識別技術,用自己的論文宣告了 Symbolic AI 在語音識別領域的完敗。

鑒於 HMM 的成功,Peter Brown 和他們這個研究小組的同事們基本都拜服於統計方法的腳下。這個小組的許多人後來一直從事語音識別研究,可 Peter Brown 不是在一個領域一耗若干年的那種人。這個組裡還有另一個不安分的人,他的名字後來經常與 Peter Brown 並列,他叫 Robert Mercer,通常人們也叫他 Bob Mercer。

Bob 比 Peter 年長,1972 年就加入了 IBM 研究中心。Bob 和 Peter 玩膩了語音識別,就開始去弄機器翻譯。反正是人工智慧領域的幾大難題之一。

這一下,還真捅了馬蜂窩。要知道,語音識別和機器翻譯在經典人工智慧科學家的心裡,地位是有天壤之別的。

語音識別嘛,不就是聽見啥輸出啥,一個聽寫機器而已。符號語言學的方法在語音識別上派不上用場,統計學方法大放異彩,那完全是因為問題本身就不屬於高級智能的範疇。

機器翻譯?那可是要理解原文語法、語義,然後轉換成目標語言的語法、語義的。論智能程度,語音識別是兩三歲孩子的水平,跨語種翻譯?那可是許多翻譯大家皓首窮經,一輩子也難以企及的高遠境界。錢鍾書不是提到過么,「十七世紀一個英國人讚美這種造詣高的翻譯,比為原作的『投胎轉世』(the transmigration of souls),軀體換了一個,而精魂依然故我。」厲害吧,「投胎轉世」耶,這玩意兒絕對算得上是高級智能,是人類智慧的精華,要用計算機來解決翻譯問題,非得懂得人類思想方法,懂得語言學不可。

Bob 和 Peter 這兩個渾身碼農味道的研究員,居然要用什麼概率統計方法來解決機器翻譯問題,這真真要被語言學家們笑掉大牙的。

這故事的結局大家肯定猜得到,Bob 和 Peter 帶領的機器翻譯小組只用了很短的時間,就建立了一套可以運行的,基於大語料統計模型的機器翻譯系統,居然得到了不算太糟的結果,至少,那結果比經典語言學方法得到的結果更接近人類語言,更讓用戶信服。從那以後,成功的機器翻譯系統比如 Google Translate 走的都是統計模型的道路(今天更是在統計模型的基礎上增加了深度學習這個高級武器)。Bob 和 Peter 的工作並不複雜,但他們在機器翻譯領域的貢獻直到許多年後還有人記得。2014 年,計算語言學會議給 Bob 頒發了終身成就獎。

Bob 比 Peter 從事研究的時間長些,論文也比 Peter 多些。兩個人都在語音識別和機器翻譯這兩個領域取得了不俗的成就,算得上人工智慧發展史上的重要人物吧。功成名就之後,大概可以考慮在大公司帶帶團隊,在高等院校指導指導學生,沒事兒就去申請申請科研經費的所謂「後半生」了。

別人的人生到達頂峰,Bob 和 Peter 的人生才剛開始。他們的人生目標不是賺一個億,而是賺十個億,一百個億,甚至更多——而且,是運用計算機科學的方法,藉助計算機科學家特有的敏銳頭腦和人工智慧知識。

有一家高科技公司,在熟悉投資和基金的人聽來如雷貫耳,在普通碼農聽來,卻多半是丈二和尚摸不著頭腦。這家公司叫文藝復興科技(Renaissance Technologies)。

文藝復興科技?聽起來像什麼公司?前半部分像搞藝術的,後半部分像搞電腦的,合起來像搞詐騙的?其實,理工科學生和碼農們現在關心投資理財的越來越多,像我這種每次看見著名基金公司名字就徹底蒙圈的人,還是在逐年減少的(回頭有空了必須做一個「為什麼著名基金公司的名字都比較無厘頭」的無厘頭研究)。認真地說,這公司是家特別特別特別著名的用量化交易賺錢的對沖基金公司。

文藝復興科技的創始人 James Simons 老先生本身就是個很牛的數學家,還是個很有黑客精神的密碼學家(據說攻破過美國政府的密碼系統),此外,他還立志用數學模型來賺錢——可謂既有科學情懷、極客情懷,又有財富情懷。當然,尋常老百姓看不懂他在數學領域做了啥,也沒法知道他究竟破解了哪些密碼,大眾只知道他經常在福布斯富豪榜上排在前 100 名里。至於他到底有幾百億的身家,網上有不少數據,有沒有水分不好說,反正他每年至少入賬一二十億,媒體對他的一致評價是「世界上最聰明的億萬富翁」。

「最聰明」,「億萬富翁」,哎呀,人生能同時得到這兩個標籤,該是何等的幸福?偏偏造化弄人,這世上有多少聰明人窮困潦倒,又有多少億萬富翁智商低下?

James Simons 之所以能賺那麼多錢,主要是文藝復興科技的幾隻基金,特別是一隻叫大獎章基金的,表現超乎尋常,年均回報高達 71.8%,難怪這基金連管理費和業績分成都比同行高出一倍還多。James Simons 把基金成功的主要原因歸結為數學魔術。當然,大獎章基金到底是如何建模的,外人大多只能猜測些皮毛,真正的魔術技法,文藝復興科技才不會隨便透露。即便最近幾年外界對文藝復興科技的質疑聲漸多(特別是大獎章基金以外的幾隻基金表現不佳),大獎章基金依然在最牛基金排行榜的前列屹立不倒。姑且認為,基於機器學習的人工智慧技術就是這一類頂級基金公司的印鈔機好了。

據說,James Simons 招人的條件頗為嚴格,一定要找最聰明的數學家或計算機科學家,堅決不找學金融的、學工商管理的。文藝復興科技的公司內部,基本上就是一個極客樂園,一點兒也沒有華爾街那些世俗金融企業的影子。1993 年,Bob Mercer 和 Peter Brown 這兩個在人工智慧領域已經頗有名氣的研究員被 James Simons 招至麾下,開始和文藝復興科技里的數學家、計算機科學家一道,用人工智慧技術投資理財,走上了光芒萬丈的財富之路。

2009 年, James Simons 退休,Bob Mercer 和 Peter Brown 出任文藝復興科技的 co-CEO,正式成為財富巨輪的領航人——這麼說顯得不那麼功利,其實,作為這家神奇公司的 CEO,他們自己也早就變成億萬富翁了。福布斯的估計是他們每人每年都能凈入一億美金以上。

從大學校園和 IBM 研究中心走出來的計算機科學家領導一家基金公司,這件事在華爾街不算新鮮,但在不熟悉金融圈、投資圈的碼農們看來,確實有些不可思議。科學家和財富之間,什麼樣的關係才最和諧?

就個人愛好、性格、生活來說,Bob Mercer 和 Peter Brown 也都算得上是神人級的存在。而且,他們倆的性格還大不一樣。

Peter Brown 愛動,話嘮,好勝,據說喜歡在公司健身房跟員工角力,也花了不少精力將財富投到慈善事業里。

Bob Mercer 就不大一樣,他自己說自己喜歡孤獨,寧願不跟人說話。可另一方面,Bob Mercer 又是個著名的政治活動參與者,參與的方法很簡單——大把大把地捐錢。從 2012 年總統競選,到今年的 Trump 對 Hillary,Bob Mercer 以個人或家族名義,幾百萬幾百萬地捐出政治獻金。他女兒 Rebekah 更是直接站在前台支持 Trump,參與競選團隊的事務和決策。

其他方面,諸如 Bob Mercer 和女兒都是德州撲克高手,Bob Mercer 擁有多少多少遊艇,業餘時間愛玩一套幾百萬美元的鐵路模型之類,只能算是億萬富翁的日常生活一隅,實在不足以成為多麼了不起的談資。

從人工智慧科學家八到大把大把的金錢,從金錢八到科學家的研究、項目、事業、生活,不是說科學家一定要跟錢死磕,也不是說沒錢就配不上科學家的金字招牌,只是想小聲說一句,這世上最多的錢最好還是讓最聰明的人賺到,那總要比人傻錢多的世界來得舒心、愉快。

下一篇,我們換個沒那麼多錢的科學家來八八。

(註:本文部分內容,李開復博士亦有貢獻)


推薦閱讀:

赤壁 | 混淆矩陣 | Rock on Chibi
斯坦福大學-2017年-秋-最新深度學習基本理論課程分享
激光雷達原理秒懂
【乾貨】最新有關 DL & ML 的 R 語言書籍

TAG:人工智能 | 机器学习 | 对冲基金 |