【重磅】李飛飛宣布成為矽谷頂級投資機構a16z入駐教授，邁出進軍工業界的第一步？

04-16

近日，斯坦福人工智慧實驗室和計算機視覺實驗室負責人、斯坦福豐田汽車人工智慧中心負責人李飛飛教授正式宣布接受a16z的邀請，成為a16z在計算機科學領域的傑出訪問教授（又名入駐教授，Professor-in-Residence）。
3年前，a16z宣布成立入駐教授項目，旨在為創業圈和學術界架起一座橋樑。入駐教授在推動學術界的研究成果更快速的向工業界轉化的同時，能幫助a16z快速索定那些有意向進行技術成果轉化的學術界人士。
李飛飛是計算機視覺領域最受矚目的專家之一。她所帶頭創立的ImageNet是目前世界上圖像識別最大的資料庫。每年舉辦的ImageNet競賽都會吸引計算機視覺領域的頂級研究團隊參與其中，不斷刷新各項比賽的成績。
在成為a16z的入駐教授後，李飛飛和a16z的合伙人Frank Chen坐到一起，暢聊了有關人工智慧、深度學習、GPU、自動駕駛、機器人、計算機教育等熱點話題。
將門聽譯了這段時長38分鐘的podcast，希望與大家分享李飛飛的思考。

問：您是如何看待人工智慧(AI)在創業圈和學術圈又重新火起來的現象？

在我看來，AI的熱潮從未退去過，這並不是什麼新鮮事。AI 這個學科已經有60年的歷史了，不過這60年一直是AI的「體外」階段(vitro time)——大多時候它只存在實驗室和研究中心裡。在那裡，我們打下了很多AI的數學基礎，制定了AI問題，還測試了很多AI演算法的原型。

現在AI正在邁入它的「體內」時代(vivo time)——它進入了我們的生活。那麼導致這一轉變的背後推手是什麼呢？首先，現在AI 技術已經足夠成熟了，這一點上主要有以下幾個驅動因素：

大數據為AI做的貢獻。信息時代下，互聯網為我們帶來了龐大的數據量
幾萬億個感測器提高信息量
運算硬體。CPU 和GPU的提高，還有計算機集群

因此，數學基礎、機器學習的統計工具、大數據以及新硬體四個條件的相得益彰，帶我們走進了AI的這個歷史時刻。

問：對於硬體，我們發現深度學習在GPU上比CPU運行更有效，因為它把任務作為線性代數處理而且可以並行運算。您認為以後會有深度學習專用的晶元嗎？它如何構造以擁有有更強大的並行計算能力？會不會和現在Nvidia做的晶元完全不同？

我覺得會有並且希望會有。Nvidia是現有深度學習晶元的領導者之一，因為他們的GPU是高度並行的，可以進行高級別的並行作業。由於「神經網路」或「神經網路卷積」的深度學習演算法中有很多操作都是重複計算，這些都是可以同時完成的，因此GPU 大大提高了運算速度。GPU對訓練深度學習來說真的是太完美了，但我認為我們在快速測試和時間推理晶元上依然有很大的進步空間。會有更專用的晶元可以植入到設備里，我覺得這是深度學習晶元的趨勢。

但是我覺得，目前我們還在探索階段。因為演算法還沒有足夠成熟。我們還要探索怎樣是最佳方式。今年我去了一個深度學習的大會，best paper的其中一篇是來自於斯坦福的Bill Daley實驗室。他們在探索把更聰明的演算法用於一個具體的晶元設計。所以現在，為了設計出創新的晶元而提高演算法的這件事還在進行中。

我覺得現在很重要的一點就是科研和設計要同時進行。演算法和晶元設計的關係就像是「雞生蛋還是蛋生雞」的問題——演算法導致晶元設計的變化，但是晶元的設計局限也會導致演算法的變化。我覺得現在是時候在這上面投入資源去探索這一點了。當然，從商業模型的角度來說，我們也要很謹慎。

問：現在深度神經網路很火，但是在過去的這60年里，我們嘗試過很多不同的技術。大家會一直對深度學習抱有熱情么，還是現在火一陣也會有別的替代？

很多人都在問我這個問題。深度學習是這一切的答案嗎?

首先，我很開心你提到了其他的演算法和工具，當你回頭看看AI的發展，在早期的Manske MacArthur 年代，他們用了很多一階邏輯和專家系統，那些都基本來自於認知設計規則。

但是我覺得AI真正開始的第一階段是機器學習——是統計類的機器學習演算法帶來的。我們看到了提升演算法、貝葉斯網圖形模型、支持向量機、回歸演算法，還有神經網路等等。所以那20-30年在機器學習演算法上的發展奠定了今天AI使用統計類機器學習的基礎。

我們不能個小看這點。深度學習從不是一個新鮮話題，它其實是在六、七十年代，由Kunihiko Fukushima等人一步步發展起來，之後又由Geoff Hinton，Yann LeCun 和他們的同事不斷壯大的。

我覺得神經網路結構里其實有些部分是很強大的。這是一個容量很大的模型，它可以讓幾乎任何演算法在知道任務目標的基礎上，利用數據做端到端的訓練，並且同時做到優化。

最明顯的例子是我們現在經常討論的有監督和無監督訓練。

很重要的一點是目前我們的重點往往仍只關注於有監督訓練，但我們的電腦並不能像小孩那樣去學習。

首先，我們都不知道小孩是怎麼學習的。有很多發展心理學的理論都還未能在計算機科學領域應用。有監督學習在可以注釋的數據上很管用，但是，當他被應用在更實際的訓練場景時，會很模糊。舉個例子，如果某天一個公司做出來一個小機器人送到你家，然後你想讓這個機器人適應你和你家人想讓他做的事，最好的學習方式肯定不是把它打開然後給它全部注釋的數據。你希望可以告訴和展示給他看，讓它觀察和學習。但現在的深度學習還做不到這點。

但是，有監督和無監督訓練的差距還遠遠不止這點。這裡還涉及到了對「智能」的定義。特別對工業界來說，任務主導的智能很重要。標記圖片、避讓行人、語音識別、錄製對話、搬運物品……這些具體的任務主導的應用是AI很重要的一部分，但是，我們還有個「強人工智慧」(AGI，artificial general intelligence)的概念，包含推理、概括、溝通、情感互動，理解智能和目的規劃學習以及理解環境的人工智慧。

以上這些我們現在都還不知道怎麼去實現。

問：創新人工智慧(creative AI)在你待解決清單的什麼位置？

其實，我們先要問自己一個問題，什麼是創新？如果你去看AlphaGo 贏的那4場比賽，李世石在每場里都有對AlphaGo做出的決定感到驚訝的瞬間。在圍棋社區里，不少人都對AlphaGo具有能下出人都想不到的步驟的創造力而感到吃驚。

從這點，我們已經看到創新和人工智慧的創造力了。這個創造力的一部分就是能做出我們預測不到的正確的選擇。這些現在已經是現實了。

一個很有趣的現象，目前有些深度學習已經開始在轉換藝術了。你可以給它一幅梵高的畫，它可以把一張圖轉換成那副畫的風格。但我同意，這只是個模仿機制。我們所說的創造力是可以混合我們的邏輯思維、感性思維和直覺思維，我至今還沒有在任何建立在數學公式上的作品裡看到這樣的表現。

這就回到了我之前說到的三點裡的「大數據」那一部分：究竟AI能不能通過學習海量的數據，做出真正創新的、數據里沒有的東西？我們已經看到機器可以模仿不同的畫畫風格，因為他們通過數據可以分析出不同類的風格。但是，現在的問題是，用深度學習我們最終可不可以完全生成一套嶄新的東西？我們離印象派和立體主義這些還都很遠，因此回到一個更平凡的層面，比如計算機視覺。我們近期的一些工作可以實現對一張圖片進行簡單的描述，接下來我們做的是對一張圖片進行Q&A。

我們在想，能不能開發一種演算法，它不僅可以通過訓練數據來學習，也可以學習如何去學習、學習如何問出合理的問題。舉個例子，在我們最近上交的一份paper里，我們給電腦一張圖片，然後問他圖裡的女生在幹什麼。電腦反過來，需要先問我們一系列問題，才能回答我們的問題。所以，這個演算法需要學習如何不直接回答問題，而是先探索正確問題的潛在空間，再達到正確的答案。學習如何去學習是我們希望孩子們掌握的能力，這也是我們希望演算法可以做到的。

問：我很喜歡你之前說的關於人工智慧「體外」和「體內」階段的描述，處在轉換的這個時間點，你覺得現在的創業公司會為體內階段帶來什麼不同？

首先，現在的演算法已經成熟到工業界和創業界都可以使用的階段了。20年前，只有少量的幾個世界頂級的實驗室才有可以真正能做事情的AI演算法，那時AI還沒有滲透到其他行業和大眾群體中。所以在當時，一個創業公司甚至一個大企業想拿到這些演算法都是很難的。

當然還有其它原因，現在互聯網的大爆炸，更多感應器的應用，導致現在AI的應用面大了很多。要想收集數據，我們要管理和理解信息。這帶來了很多智能演算法的需求，這就是現在AI的應用之一。

有了這些意識和目標，現在才有了自動駕駛汽車這類的場景。突然之間，我們需要開始創建駕駛汽車的智能演算法了。這也是我覺得現在AI一下子火起來的另一個原因。

問：那麼對於創業公司和大公司都開始做自動駕駛的人工智慧這件事，你怎麼看？小公司和大企業的貢獻該如何更好的分配？

從誰會贏得「自動駕駛」這場比賽的角度來看，我覺得對像豐田這樣的大公司來說，只要他們全力投入，在車上安裝鏡頭，他們就可以很快拿到大量的數據，這點對於小創業來說很難。像Google這樣的公司，他們一開始沒有車，但是有演算法。他們開始的很早，所以他們現在既有數據又有演算法。雖然他們是軟體公司出身，並不是一個開始做軟體的汽車公司，但軟體的重要性仍使他們擁有很大的優勢。

那對於創業公司來說，他們的優勢在哪裡？我覺得有很多商業場景，對於大公司來說不重要，但創業公司可以瞄準更細化精準的領域或者垂直行業來建立他們的數據和演算法。或者可以走MobileEye的路線，不做整個系統、整輛車，而是把一個關鍵的零件做的比其他任何人都好。

問：你的同事Andrew Ling離開斯坦福後在Baidu開了一間人工智慧實驗室，幫助Tesla進行技術研究，但因Tesla近日的自動駕駛事故而受到了一些困擾。目前看來一些基本的駕駛場景自動駕駛汽車還不能很安全的處理好，Andrew也表示自動駕駛技術目前仍處於未成熟的階段。我知道你也參與到豐田汽車項目的研發中，因此這件事你怎麼看？

當Tesla的AutoPilot面世時，我在Youtube上看過他們的一些視頻。作為一個母親，我絕對不會讓我的孩子坐到這樣的車上。因此，從這個角度上看，我的反應是有些拘謹的。但我真的希望在商業和消費者之間能有一個很清晰的溝通策略。不過我沒有買Tesla，所以也不知道Tesla是怎麼和他們的用戶來溝通的。

但如果Tesla已經明確的告訴他的用戶什麼時候應該相信自動駕駛系統、什麼時候應該用這個系統、什麼時候不應該相信，這個時候，我們就又面對了另外一種情形，當Tesla已經盡到了所有告知的責任，而消費者操作失當時，誰應該來背這個鍋。因為每一台機器，如果操作失當，都有可能產生讓人心驚肉跳的後果。我想我們需要一個的是一個全社會都來參與的對話。

在我們的斯坦福-Toyota中心，有一組教授正在奮戰於各種各樣的項目，其中有一個很大的項目就是由HCI組所領導的。有一件事是我們特別需要謹記於心的是，與計算機相比，人類其實是運算極其緩慢的計算機器。和晶體管比起來，信息在我們腦海中傳遞的速度是非常慢的。如果要產生運動行為，從我們的大腦再到肌肉的這個過程，就更慢了。所以當我們在討論人機交互和瞬間決策這個話題的時候，一定要把這個考慮進去。

問：這其實讓我想起了很有名了電車難題（trolley problem）。當自動駕駛的車輛在行駛中遇到前面的車輛突然剎車的情形時，它是應該選擇不作為，直接撞上去，令車裡的人受傷呢？還是向右轉，撞到旁邊騎摩托車的人呢？又或者是向左轉，撞上一輛小型貨車呢？如果發生事故，誰需要對此負責任呢？演算法的設計者？

這其實就涉及了近幾年來我一直在AI的教育和研究上所倡導的一個理念——我們需要在機器當中注入很強的類人思維的元素。科技發展越來越快，它們和人產生接觸，進入我們的真實生活中，我們所思考的方式以及開發和設計的演算法，讓我們的生活變得更美好。但科技如何才能與人類更好的融合共存，我認為需要給它加入那麼一點人類思考的方式進去。

這個項目的負責人是Silvio Savarese教授，他們研發了一個名叫Jack Robot的社會機器人（social robot）。Jack Robot其實是一個自動駕駛的機器人/交通工具，它主要想要解決的是我們在駕駛上所謂的最後一公里問題，它的使用場景是在一個更社會化的空間中，而非高速公路上，像人行道、喧鬧的城市、校園、機場等這些地方都算。

所以，當我們來看駕駛的最後一公里問題或者僅僅只是社交場所的時候，我們突然發現它要解決的就不僅是行駛在高速公路上所有需要注意的事情，如了解周圍的布局、路人、小巷子，你還需要能夠找出一種方式，能夠讓人類覺得是素質的、可接受的。

有些人可能會說，那這個簡單了，讓它們保持足夠低的速度前行，遇到人就停下來不就行了。其實我們也測試過這種方法了。但結果是，如果按照這麼來辦，那這個機器人想要去一個地方，基本上是不可能的事了。因為在一個很擁擠的環境里，一定全都是人。如果機器人完全遵循上面的做法，它就會一直在禮讓行人，那麼就哪兒也去不了，只能停留在原地。

問：坦率的講，如果把這個機器人放在舊金山的街道上，估計會被踹好幾下。在那麼擠的街道上，它又移動地這麼慢，人們是不是就怒了？

是的，我們確實想過這個問題。但目前為止，我們還沒有想到解決辦法。我想這個機器人必須要有一個能夠進行求救的電話功能。但打造一個這樣的機器人，其實我們想要解決的是一個「如何能在理解人類的社交運動後，能成功完成某項任務」的問題。比如能在校園裡，把某個東西從A點運送到B點。當然，是用一種有素質的方式。

所以一開始我們在斯坦福的校園裡去用數據記錄人們的行為方式，觀察他們在小範圍聊天的時候是如何聚焦到一起的，以及他們是如何行走的。尤其是在早上9點的時候，斯坦福校園裡很多學生要趕著去上課，而他們行進的方式並不是完全隨意的。根據要去的方向，他們會形成一些很有趣的花樣。

我們收集了這些數據後，把它們注入到我們的演算法中，讓演算法去學習這些數據，並且著重去注入一些社交的準則（social rules），比如：

在去一個相同的方向時，人們會傾向於跟隨其他人;
當人們在聊天時，你不會輕易打斷他們。

但我們給到的一些社交線索也只是比較籠統的，至於去具體的像什麼時候要去避開兩個正在聊天的人，要從多遠開始避讓，是在10英尺的地方還是2英尺的地方，這些都是需要演算法去通過自己的觀察去。

問：因為每個地方的風俗都是不一樣的，所以這些機器人是每去到一個地方，就需要拿當地的數據去訓練它一遍么？

這是一個很棒的問題。我的回答是，目前我們還只能是根據地點的不同去一個個訓練它們。我們需要去收集不同地點的數據。但就像我之前說的，我的下一個夢想就是希望能教會機器人應該怎麼去學習，而不是模仿訓練數據。如果到那個階段，機器人應該具有線上學習以及增量學習的能力。

問：我想聽你再多說說之前談到的人道主義方面的問題。你說你希望在計算機科學中注入更多的有首人文科學的東西？

3年前，我就開始思考，其實在我的職業生涯里，正上演著兩個讓人們覺得恐慌的事件。一個是人們覺得終結者就要來臨，人工智慧（AI）開始變得邪惡，我們有一天將會被這種邪惡的力量所統治；另一個是在我所處的STEM/AI行業里，女性的角色太少了。

當我想清楚的時候，我發現其實它兩者都和一個很重要的假設有很大的關係——在開展有關科技的教育和研發的過程中，我們缺少了人本思維和人本使命的宣言。所以現在讓我們來看第一個問題，為什麼我們會認為技術會變得邪惡？技術都是掌握在人類的手中的。

技術本身是中立的。大到核武器，小到一把能切蘋果的刀，只是在不同的人手中，才產生了不同的後果。因此，為了讓技術肩負起它應有的責任並且不作惡，我應該追求是這樣一個社會——我們的技術人員應具有人本意識和思維，能負責任的將技術進行恰當的使用。

關於第二個問題，為什麼政府沒有投入足夠多的資金去吸引足夠多的女性進入STEM和我所在的領域？我發現其實要去說服女性加入這些領域是非常困難的。拿斯坦福的學生來說吧，他們都是極其聰明的。幾乎來到斯坦福的每個學生，不管是本科生還是PhD，他們都非常擅長分析問題、有很好的寫作能力、關心著整個世界。我突然意識到的是，在我所處的這個領域（在矽谷也是），我們並沒有向社會中各行各業的人們傳遞正確的信息。

我們往往只是去推崇極客(geekiness)和書獃子(nerdiness)。當一個擁有遠大抱負的女生走進我們的學院或者是我們的AI實驗室的時候，她可能正在思考的是老齡化的問題、如何治癒癌症的問題，以及一些其他眾多與社會息息相關的重要問題。如果我們只是展現出我們對極客感興趣，喜歡去一些極客的事情，那我們就會錯失一大批真正想將技術應用於解決人類問題的人。因此，我開始意識到由於我們對於人工智慧中的人道主義使命的思考和關注不夠，使我們錯失了很多去促進這個領域多元化發展的機會。

在我和我之前的學生Olga Russakovsky的設計下，我們的實驗室發起了一個讓高中女生來學校參觀兩個星期的夏令營。我們希望能夠吸引到那些開始思考她們是誰、她們未來想做什麼的女生。創辦這個夏令營，我們最希望達成的目標有兩個。

一個是我們希望能從技術層面去激發這些在數學和計算機方面擁有天賦的學生，他們將是未來AI的領袖。但同時，我們想要吸引的是那些還沒有開始思考AI到底是什麼的學生。他們還不了解AI當中所蘊含的人文使命。實際上，在暑假裡，我們做了一個非常嚴格的假設測試，並寫成了一篇技術論文。

我們的夏令營從一早就開始了，學生們會去聽非常嚴肅的講座、和TA和博士以及博士後學生們一起去探究AI方面的技術問題。下午的時候，她們會被分成4個研究小組，每個小組都是一個有關AI的技術項目，比如說計算機視覺、自然語言處理或計算生物學。

不過，我們在每個項目中都加入了很強的人文陳述。舉例來說，去年，我們開設了4個項目。計算機視覺項目通過步伐感測器去觀察醫院的環境，幫助醫生和護士去監測手部衛生的情況。自然語言處理項目通過運用在自然災害時期Twitter上的數據，比如說地震，進行正確的數據挖掘工作，試圖找出能夠幫助人們進行災後援助的信息。

其實每一個項目都是非常技術的，但與此同時，她們又真切的學會了如何將技術與人類的問題相結合。我和我的兩個本科學生、一個博士學生組成了一個研究小組，我們針對以下的這個假設設立了一個非常嚴格的評估項目：人道主義是否能夠增強人們對AI的興趣？結果我們發現在數據層面，這些女生對於這個話題的興趣在項目開始前後有巨大的不同。相關的論文將會發表在計算機科學和教育大會上。今年我們還會開展這個項目，我們也真的希望它能成為一個長期存在。

-END-

本文由將門創業原創編譯，如需轉載，請私信聯繫或在「將門創業」(thejiangmen)微信公眾號後台留言，獲得許可謝謝！