AI研究院 | AI人才不夠用?看看臉書的員工是如何學習的!

【編者按:《AI研究院》由網易智能頻道與杭州研究院共同打造,每日一篇,專註AI行業研究與深度分析,並提供技術應用交流。轉載請聯繫我們獲得授權,公號smartman163】

【網易智能訊3月29日消息】薩克拉門托在Facebook總部的Full Circle Cafe吃午飯的時候,他手機上收到一則消息:拉里澤尼克(Larry Zitnick)是Facebook人工智慧研究實驗室的主要人物之一,他正在一個教室教授關於深度學習的課程。

薩克拉門托已經34歲了,他是的Facebook數字圖形工程師,每個人都知道他最喜歡指揮家索爾蒂(Solti),所以大家都稱呼他索爾蒂。他在Facebook中找不到這個班級的註冊方式。於是,他只吃了一半午餐就站了起來,跑著穿過了MPK 20,一個比足球場還長的Facebook大樓。「我的書桌在那邊,」他說。他快速跑到他的書桌前,打開筆記本電腦,又回到了註冊頁面。但這門課的註冊空間已經滿了。

他第一次被澤尼克(Zitnick)的課堂拒之門外。這一次,當澤尼克的講座在1月中旬開始時,他又出現了。他也加入了研討會,加入了其他同學的隊伍,他們爭相從公司數據中打造出最好的人工智慧模型。在接下來的幾周里,他登上了排行榜的榜首。「我之前沒有進入這個班級,所以我想做得最好,」他說。Facebook的員工比他更高興,正如索爾蒂(Solti)所擔心的那樣,這個課堂是一門私人的講座和研討會,只對公司員工開放,而Facebook員工則是最大的受益者。

深度學習是指你在Facebook上發布的照片中識別人臉的技術。它還能識別谷歌手機的指令,在微軟的Skype應用上翻譯外語,在Twitter上與人談論色情片,更不用提它正在改變互聯網搜索、網路安全識別等各種事情的方式。在過去的五年里,這項技術已經從根本上改變了互聯網上所有大型的業務。

在傑夫辛頓(Geoff Hinton)的幫助下,谷歌公司建立了一個核心人工智慧實驗室,為公司的其他部門服務。隨後,該公司向位於倫敦的第二個人工智慧實驗室DeepMind提供了超過6.5億美元的研發資金。另一位創始人,揚勒恩(Yann LeCun),在Facebook也有類似的行動。還有很多其他的深度學習創業公司和學者加入了該互聯網公司,他們都是被巨大的薪資所吸引的。

現在的問題是:這些公司現在雖然已經把大部分可用的人才都挖了過來,但他們還需要更多的人才。直到現在,深度學習也是依然處於學術研究的邊緣階段。相對而言,很少有人接受過這些技術的正規培訓,這是一種非常不同的思維方式,而不是傳統的軟體工程。因此,Facebook現在正在組織深度學習正式課程和長期研究實習,以培養新的深度學習人才,並將其推廣到整個公司。澤尼克(Zitnick)說:「我們這裡有許多非常聰明的人。他們只是需要工具。」

與此同時,就在Facebook位於加州門洛帕克的總部已經開始行動時,谷歌也在做著同樣的事情,並且顯然規模更大,因為許多公司都在努力應對人工智慧人才的真空。大衛艾利頓(David Elkington)是一家將人工智慧技術應用於在線銷售服務的公司的首席執行官,他說,他現在在愛爾蘭安排了獵頭,因為他無法在美國找到他需要的人工智慧和數據科學人才。「這更像是一門藝術,而不是一門科學,」他說。這門藝術最好的從業者是非常昂貴的。

在未來的幾年裡,大學將會趕上深度學習革命,培養出比現在多得多的人才。Udacity和Coursera等在線課程也傳出了福音。但最大的互聯網公司需要一個更迅速的解決方案。

放眼未來

42歲的拉里則尼克(Larry Zitnick)象徵著人工智慧技術的快速發展,以及深度學習天賦的價值。在微軟,他花了10年的時間努力打造能和人類一樣智能的系統。然後,在2012年,深度學習技術在短短几個月的時間裡就超越了他十年的研究成果。

從本質上說,像澤尼克(Zitnick)這樣的研究人員的工作,是構建機器視覺這種簡單的技術,並且將這些特定的技術應用到問題的特定部分。但是,像傑夫辛頓(Geoff Hinton)這樣的學者表明,一個簡單的神經網路可以實現更大的成就。辛頓(Hinton)和公司建立了一種神經網路,可以通過分析大量的數據來進行學習任務,而不是通過手工編碼一個系統。澤尼克(Zitnick)說:「我們看到了這一巨大的進步,這是一場深度學習的革命。一切都開始好轉。」

對澤尼克(Zitnick)來說,他個人的轉折點是在2013年秋天的一個下午。他坐在加州大學伯克利分校的一個演講大廳里,聽著一位名叫羅斯吉士克(Ross Girshick)的博士生描述了一個深度學習系統,該系統可以學會識別照片中的物體。例如,給它提供數百萬張貓的照片,它就能在眾照片中將人們需要的照片識別出並找出來。在吉士克(Girshick)描述他的系統背後使用的數學知識時,澤尼克(Zitnick)就已經明白這位博士研究生的研究方向了。他想聽到的只是這個系統的運行情況。他一直在小聲說:「請告訴我們這些相關數據。」最後,吉士克(Girshick)給出了這些數據。澤尼克(Zitnick)說:「很明顯,這將是未來的發展趨勢。」

幾周後,他在微軟公司的深度學習研究中僱傭了吉士克(Girshick),因為他和其他公司的計算機視覺團隊重新組織了他們在深度學習方面的工作。這就需要在思維上有一個相當大的轉變。正如一位頂級研究人員曾經告訴我的那樣,創建這些深度學習系統更像是當教練,而不是運動員。你不是在自己的程序上構建一個軟體,而是在一段時間內,從信息的海洋中獲取一個結果。

但吉士克(Girshick)在微軟公司工作並不太長。而且,澤尼克(Zitnick)也沒有。很快,Facebook就把他們挖走了,幾乎是團隊里的所有人都被挖走了。

這種對人才的需求也是澤尼克(Zitnick)現在會在Facebook公司教一個深度學習班的原因。和矽谷其他許多工程師和數據科學家一樣,Facebook也很清楚這一趨勢。當澤尼克(Zitnick)在秋天宣布開辦第一個班級的時候,60個名額在10分鐘內就被佔滿了。他在今年冬天又宣布開了一個更大的班級,同樣很快就被報滿了。供求雙方都有對這些課程的需求。

科技記者也有需求。我自己也參加了最新的課程,儘管Facebook不允許我參加研討會。該公司相信教育,但只在一定程度上。歸根結底,這一切都要走向商業化。

走進深度學習

深度學習這門課始於一個基本的想法:神經網路,這是弗蘭克羅森布萊特(Frank Rosenblatt)這樣的研究人員在20世紀50年代末就開始探索的。他們的目標是,開發神經網路模仿大腦中的神經元網路。從某種程度上來說,的確如此。它的作用是在神經元的處理單元或節點之間發送信息。但這些節點實際上只是線性代數和微積分,可以識別數據模式。

即使是在50年代,它也起了不少作用。羅森布萊特(Rosenblatt)是康奈爾大學的心理學教授,他向紐約客和紐約時報展示了他的系統,該系統可以識別在IBM 704大型計算機中輸入的卡片信息的變化。但從根本上來說,這個效果是很有限的,它只能解決非常小的問題。在60年代末,當麻省理工學院的馬文明斯基(Marvin Minsky)出版了一本書,證明了該系統的限制後,人工智慧社區幾乎放棄了這個想法。在像辛頓(Hinton)和勒恩(LeCun)這樣的學者擴大了這些系統的功能後,它才重新回到了前台,這樣他們就可以在多個節點上操作神經網路。這就是所謂深度學習的「深度」。

正如澤尼克(Zitnick)解釋的那樣,每一階段都要進行計算,並將其傳遞到下一個階段。然後,還要使用一種被稱為「反向傳播」的技術,層層將這些信息作為一種糾正錯誤的方式發送回鏈接中。隨著時間的流逝和技術的進步,神經網路可以用更強大的計算能力來提取大量的數據。事實證明它們非常有用。澤尼克(Zitnick)在他的課堂上說:「有史以來第一次,我們可以用音頻和圖像等方式輸入原始數據,而且可以理解它們。」

隨著課程的進展和節奏的加快,澤尼克(Zitnick)也進一步解釋了這些技術如何演變為更複雜的系統。他探索的是卷積神經網路,這種方法受到大腦視覺皮層的啟發,將神經元排列成「接收場」,就像重疊的瓷磚一樣。他的老闆揚科恩(Yann LeCun)在90年代早期就曾用這些技術來識別手寫字跡。然後,這門課會逐步發展到 LSTMs神經網路,其中包括短期記憶能力,這是一種在保留信息的同時還會檢測接下來的內容的方式。這將有助於人工智慧識別你在Android手機上說出的指令。

最後,所有這些方法都要歸於數學。但是要想理解它們是如何工作的,學生們必須想像他們是如何穿越時間和空間的。正如澤尼克(Zitnick)的學生在研討會上所說的那樣,把這些方法應用到實際問題上,是一種不斷嘗試、發現錯誤和解決錯誤的過程,就像在錄音工作室里操縱混合控制台一樣,需要不斷去微調。但你不是在物理控制台上。你是在一台筆記本電腦上,把指令發送到遍布互聯網的Facebook數據中心的機器上,在那裡,神經網路進行了訓練。但你需要花時間調整各種各樣的虛擬數據,比如數據集的大小、訓練的速度、每個節點的相對影響力,直到你找到合適的組合。「很多事情都是通過經驗來建立的,」22歲的安吉拉范(Angela Fan)說,她參加了澤尼克(Zitnick)秋天的課程。

一個新群體

范(Fan)在哈佛讀本科時學習統計學和計算機科學,去年春天剛畢業。她參加了一些人工智慧課程,但很多最新的技術對她來說仍然是新穎的,特別是在實際操作的時候。「我可以從與代碼庫的互動中學習,」她說,她指的是Facebook為這類工作建立的軟體工具。

對她來說,這門課只是一個廣大教育的一部分。她在大學教授的要求下,申請了Facebook的「人工智慧浸入程序」研究。她在接下來的一到兩年里作為一名實習生,和澤尼克(Zitnick)及其他研究人員一起工作。本月早些時候,她的團隊發表了一篇新的研究報告,描述了一個系統,該系統採用卷積神經網路,通常用於分析照片,並用它們構建更好的人工智慧模型來理解自然語言,也就是了解人類如何相互交流。

這種語言研究是深入學習的下一個前沿學科。在重塑了圖像識別、語音識別和機器翻譯之後,研究人員正在向能夠真正理解人類說的話和做出的回應的機器推進。在近期,范的文章中描述的技術可以幫助改進智能手機上的服務,這項服務可以推測你接下來會輸入什麼。她設想在你的手機上覆蓋著一個小小的神經網路,學習你如何與他人交談。

對於Facebook來說,他們的目標是培養一群安吉拉范(Angela Fans)這樣的研究人員,這些研究人員不僅要研究神經網路,還會學習一系列相關技術,包括強化學習。在面對圍棋這款歷史悠久的遊戲時,強化學習可以破解DeepMind公司的 AlphaGo 系統的棋局。澤尼克(Zitnick)研究的相關技術的課程即將結束。為此,當澤尼克(Zitnick)在今年冬天重新上課時,范和其他人工智慧實驗室的實習生們成為了班級的助教,在研討會上工作,並回答了六周的講座中學生提出的所有問題。

Facebook不僅僅是在試圖強化它的核心人工智慧實驗室,它還希望將這些技術傳播到整個公司。深度學習並不是一個小眾的追求。這是一種通用的技術,可能會改變Facebook的任何產品,從Messenger到公司的中央廣告引擎。索爾蒂(Solti)考慮到神經網路也有藝術天賦,甚至會把它應用到視頻的創作上。任何Facebook工程師或數據科學家都將從學習人工智慧中受益。這就是拉里澤尼克(Larry Zitnick)要開設這門課的原因。這就是索爾蒂(Solti)放棄了他吃了一半的午餐的原因 。

(英文來源/Wired 編譯/機器小易 審校/雨蛋)

2017年3月29日


推薦閱讀:

最近一直在想,twitter和facebook中的狀態有什麼區別呢,如果說沒什麼區別的話,twitter為什麼還能繼續發展呢?
扎克伯格同時擔任 Facbook 的董事長和 CEO 職位有哪些利弊?有可能被撤職嗎?
facebook和twitter的區別?
Facebook IPO 不久,股價就跌破 20 美元,投資者主要擔憂什麼?

TAG:人工智能 | Facebook | 工程师 |