Michael I. Jordan：我們並非處於人工智慧的大爆炸時代

05-02

現今的我們，並非處於一個人工智慧的神奇大爆炸時代。

在人工智慧成為炙手可熱的話題之後，前百度首席科學家吳恩達的導師、被譽為人工智慧領域的「根目錄」之一的Michael I. Jordan教授希望能通過自己的課程讓人們更準確地認知AI領域。

*以下根據Michael I. Jordan 9月9日在混沌大學的課程《人工智慧-機器學習：觀點與挑戰》整理而成。

授課老師｜Michael I. Jordan

加州大學伯克利分校教授、美國三院院士

目前，人們講到人工智慧和機器學習，可能還是覺得它很複雜。

事實上，當你聽過我的課程，就會發現，關於這個話題，有很多還停留在概念性、戰略性的階段。當然，也有一些投入實際應用的技術，但這背後的理論，還是非常基礎和簡單的。

人工智慧與機器學習，其實還遠遠不是一門基礎紮實的工程學科，它並不能為現在用數據分析問題提供強大且可拓展的解決方案。

因此，我們並不能將人工智慧與機器學習的發展簡單理解為一個神跡，如同高樓非一夜而起，它是必須要經歷長時間的發展的。

大家首先要意識到，在這一領域，我們仍處於非常初級的階段。很多事情我們還不了解，現今的我們並非處於一個人工智慧的神奇大爆炸時代。

可以說，我們有可能要花上百年的時間，這個高樓大廈才能真正地建立起來。

準確認知人工智慧的現在與未來

本節要點

目前的智能系統還無法做到對場景的常識理解；
我們不太可能看到所謂的「超級人類AI」。

拋棄那些外界的宣傳，我們需要實際且準確地理解人工智慧。我們來講，目前的人工智慧有哪些可能性，以及，哪些技術還沒有實現的可能。

計算機視覺

可能：在可視場景中標記對象
目前尚無可能：對視覺場景的常識理解

比如，一個會議室的攝像機，把它連接到電腦上後，讓它區分哪些是人臉。在目前，人工智慧也許可以標記對象，但卻不能理解這個場景。

作為人類，我知道這個會議室有很多人，出口在哪裡，我要小心台階不能掉下去。這是我的常識性理解，但計算機是做不到的。

語音識別

可能：多語種語音到文本和文本到語音的轉換
目前尚無可能：對聽覺場景的常識理解

我的聲音可以通過話筒接到電腦中並轉化為文本，轉化為語音。但如上所述，電腦並不能對文本背後的常識進行理解。

人們可以馬上理解一個很複雜的句子來預測下一步行動，但計算機做不到。

自然語言處理

可能：最低限度的翻譯和問答
目前尚無可能：語義理解、對話

自然語言中有很多東西，機器是做不到的。機器只能死記硬背，卻沒有辦法真正地回答問題。

當你和電腦交流的時候，它可以回答你「中國最大的城市是哪一個」，那是它通過「中國」、「城市」、「最大」這三個關鍵詞，在百度搜索的答案。

但如果你的問題是「中國不在河邊的第二大城市是哪一個」，電腦給你的答案一定是對你一點用都沒有的。因為在此之前可能從來沒有人做過這個問題的相關數據，沒有這個問題答案的數據列表。

但在未來的十年，上述被列為「尚無可能」的部分，將至少可實現基本形式。

十年，就技術而言，是一個很長的時間窗口了。事實上有一些技術已經開始出現，只是目前在比較原始初級的階段而已。

比如自駕車以及自駕式空中計程車，它們還是會出現的。儘管不會是超級智能，但肯定會越來越好。

但請注意，人工智慧系統仍然是非常有限的智能系統。我相信，我的AI同事們也會贊同我的觀點：我們不太可能看到和人有同等智力的靈活性與創造性的AI系統。

首先，人類每時每刻都在以新的方式思考怎樣用新的語言來表述，就像我現在講的每一句話都是有創造性的，我在講話中可以不斷講新的內容以及新的理念，使用隱喻、反諷等修辭。

在現實中，AI系統還做不到。AI可以幫你做一些基礎工作，比如幫你在網上訂一張票，但是它無法和你談人生。

此外，人類還非常善於做新的抽象推理。

比如，「Blank從上海走到杭州只花了3個小時」。作為人類，你會做很多推理：Blank會移動，而且從上海走到杭州只花了三個小時，它的運動速度一定很快。那麼，你會針對Blank問很多問題。

但AI系統就做不到，它需要反覆、重複用海量的數據才能得出一個答案。

最後，人非常擅長計劃和規劃。而AI系統只是擅於捕捉目前的數據，而不可能對未來做出一個長期的、有條不紊的規劃。

很多人在講「超級人類AI」，這類人一定沒有在AI領域工作過，他們根本就不知道AI領域中存在的技術問題有多難。

AI系統可以知道世界所有的城市、餐廳、電影院，然而它也只知道這些事實而已。

所以，我不相信所謂的「超級人類AI」，也不相信AI會比人更聰明。

人們覺得AlphaGo很厲害，是因為覺得一般玩圍棋的人就很聰明了，那能打敗玩圍棋的人肯定更聰明。

這是有誤解的。人知道怎麼還貸款，上什麼學校，怎麼和同伴做智慧交流，這些事都是AlphaGo做不到的。

其實，AlphaGo只是通過無數對棋盤的模擬，非常機械地、不斷重複地復盤，十幾億、幾百億次地進行學習。這背後沒有什麼創造力，只是無數次的重複工作。

所謂的「智能」，是我們根據參數彙集起來的數據演算法，它們只能複製、模仿、模擬人類的行動，而不是真正的智能。說到底，相比我們真實的世界，圍棋的複雜程度要低很多，因為真實的世界充滿不確定性。

我覺得，有生之年不會出現這個奇點了。

傳統的機器人演算法不能適應未來

本節要點

傳統單一機器人的演算法並不能應用於未來的智能城市構建；
甚至在今天，傳統的機器人問題也沒有得到很好的解決；
相比過去的工業革命，人工智慧帶來的事業浪潮將會比過去進程快三倍；

那麼，什麼是值得大家擔心的呢？

我前面講到，所謂的超人類智能系統，我們是不應該擔心的。而正好相反的是，看似智能，實則不夠智能的這些系統，卻是值得我們警惕的。

很多媒體提到AI的時候，講到的是視覺、語音的方面。但我們未來涉及到城市規劃、推薦系統、醫學診斷等，都不再是傳統單一機器人的問題。

這是完全不同類型的問題。

一個機器人的某一錯誤我們是可以控制的。比如，機器人走到舞台邊緣，探測到下面將有一個高度落差，它會知道停下來。

但如果是一系列問題呢？又或者，是很多機器人一起呢？

如果大樓發生火災，這個機器人就不會知道該怎樣逃出去。因為，這是一系列的決策，涉及到你從哪裡轉移到哪裡，還需要和其他人的合作。

比如，大家都從同一個逃生通道出逃，就會出現堵塞，那麼，就要選擇換其他的道路。在這種情況下，機器人是做不到的，這樣的演算法是非常難的。

如果你用過去傳統的機器人研發演算法去應用到城市規劃建設等領域，就會出現很多無法解決的重大問題：

NO.1：大規模多重相關決策的錯誤控制

搜索引擎給你一個錯誤的推薦建議，如果沒有人因此死亡，就不會出現什麼大錯漏。頂多你會覺得這個搜索引擎不好用，再換一個就完了。

但假設這個推薦是醫療診斷意見呢？如果這個意見出現錯誤，那真的是會出人命的。而且，我們已經看到這件事情的發生了。

即便是在金融服務領域，一旦出現錯誤，也可能會引發市場的大動蕩。交通也是如此，如果連公交走向都出現問題，就極有可能發生車輛碰撞，整個城市的交通陷入癱瘓。

因此，一旦擴大到這些領域，我們就不能再以傳統應用到單一機器人的演算法去做這種大規模的事情，必須要有新演算法。

但事實上，在這一點上，我們遠未達到。目前，我們所沿用的思路都是比較傳統或通用的，並沒有意識到在這個層級上還需要做很多事情。

NO.2：如何在競爭環境中共享數據

很多公司手握數據，卻不願與人分享。

假如，有一個黑客找出了新的辦法來騙錢，他針對了某一家公司A。那麼，A公司就會從這次欺詐當中學到新東西，可以未來避免同樣的情況。

但因為當初的攻擊只針對了A公司，其他的公司並不知道，因此也就不知道如何改進自己的系統了。

表面上看，A公司只把這個技術掌握在自己手裡，讓其他人學不到，這好像有點自私。因為，他沒有從整個行業的角度去考慮問題。如果這家公司把這個數據分享給所有人，整個行業就可以一起改善這個演算法。

但現在大家都不願分享，其實一方面是技術原因，一方面也是法律的原因。

NO.3：大規模的雲端互動

大家都在談雲計算，所有的東西都在雲上，讓人們感覺到非常便利。

但這些智能設備，並不是雲設備，而是端設備。

事實上，我們未來將要接觸的設備，都會是所謂的端設備，它們沒有時間將數據上傳到雲中。如果你和機器人的每一次對話都要上傳到雲，就會導致速度跟不上。

比如，汽車做智能，「我在這裡到底要不要轉彎」這樣的問題，是不可能每一次都實時和雲進行交互的。

因此，要把端設備和雲連接起來，還要實時交互，這兩者之間是存在極大挑戰的，我們現在也不知道該怎麼做。

NO.4：如何實現公平，保證品質、保持多元化

收集大量的數據並沒有問題，但這些數據是可能產生偏差的。

比如，你出於某種原因不喜歡某類人而沒有把他們納入你的樣本，但以這樣的樣本去做預測其結果本身就是存在偏差和偏見的。

NO.5：穩健性和安全性問題

我們在報紙上經常講到所謂的超級AI，發生了某種革命。

但請記住我今天講的話：很多技術還遠遠不能實現，很多問題還有待解決。

比如，無人駕駛車怎樣確保在所有氣候條件下，在所有的路況前提上，每一台車都可以保證安全駕駛呢？這其實也是一個極大的挑戰。

甚至在今天，傳統的單一機器人，也仍有很多問題沒有解決。

還有失業浪潮。每一次工業革命，都有很多人會因此失去工作。但值得注意的是，過去的失業浪潮是花費三五十年完成的。但接下來，很多工作可能在5-10年內就會被完全取代，這是一個新的趨勢，貧富差距也會隨之進一步拉大。

並且，人工智慧可能會被居心叵測的人濫用。AI本身不存在邪惡與正義，主要還是看它被誰利用。比如，我們現在的網路安全就是一個很嚴重的問題。

現階段人工智慧的商機

本節要點

United Masters：用數據分析打造新市場，換取新的商業模式；
Jibo：開放機器人學習的應用平台，聚焦家庭；
螞蟻金服：應用大數據，連接客戶與商戶兩端。

我想向大家介紹三家公司，我也是這三家公司的科學顧問委員會的委員，因此有更多的信息分享。

United Masters

這家公司是專門做音樂作品的。

事實上，音樂市場在幾十年前是為幾十家大公司所控的，它們會簽幾個音樂歌手，然後在市場上大規模推廣。而作為消費者，你沒什麼選擇，也就那麼幾個作曲家和歌手。

但你看現在的音樂市場，已經並非僅限於幾位少數的歌手了。在網上，有很多音樂人才，他們會在網上播放自己製作的音樂視頻，也會有越來越多的人聽他們的音樂。這和以前聽音樂的人數相比，達到了一個全新的數量級。

問題是，這些歌手沒有一個很大的商業市場，在市場上最受歡迎的音樂，一般還是大公司做出來的。

United Masters的目標，就是希望有更多的人從事自己所喜歡的音樂創作，並可以以此為生。

這家公司怎麼實現這一目標呢？就是連接數據，用數據分析。

比如一個年輕的音樂人，他寫了很好的歌，有幾萬名死忠粉。但其實他本人並不知道自己有這麼多追隨者。

誰知道這個數據呢？網站，比如微信。

United Masters就會把這個數據拿過來，告訴這個歌手，你的粉絲有多少，分布在哪裡，接下去可以做什麼。比如，你可以去粉絲多的地方開演唱會。

而且，這家公司還會告訴你如何針對自己的粉絲去打造一些產品。

比如，有個粉絲要來這個歌手北京的現場演唱會，那麼，歌手可以給這個粉絲一個VIP後台通行證，讓他可以到後台見面。很多粉絲是很看重這種和偶像親密接觸的機會的。

所以，通過這些數據的匯總，就可以創造出盈利模式。只要有人對這些數據感興趣，就可以獲取這些數據。因此，慢慢地，這家公司的口碑就建立起來了。

這就是非常好的商業模式——通過一個小的數據交換。傳統的唱片公司對歌手的抽成要到85%以上，但對於UnitedMasters來說，它只抽10~15%，就打造了這樣一個全新的市場。

Jibo

這家公司做家庭機器人很多年了。未來10~20年，我們每個人家裡可能都會出現一個家庭機器人。

目前，很多人還是把家庭機器人當作玩具，它們在家裡走來走去會發出很有意思的聲音，但真正時候幫助到人們的生活，現在還是很少。但是，所謂的家庭助手或者家庭秘書，卻是不一樣的。

Jibo三年前推出了一個機器人，長得很像手機。但是它會跟隨你，像眼睛一樣看著你，給你拍照片。你可以對它說：Jibo，今天晚上我要在家裡開派對，你幫家裡的人們拍照片好嗎？

Jibo就會給你拍照。它還會跟你說看這兒、看那兒，可以把整個派對的影像資料保留下來。

這聽上去是一個很有意思的應用，但要把它打造成一個規模性的應用還是很難。三年後，這家公司終於感覺找到了方向，推出了一款新的家用社交機器人。

這個機器人擁有電子眼睛、耳朵和聲音，可以捕捉照片、視頻通話，也可以做提醒、訂餐、發送郵件等這些輔助工作。它是一個開放式的平台，可以讓人們不斷開發新的應用。

這和手機上的應用是不同的。手機的應用並非機器學習的應用。但這中機器人的平台應用，會進行適應性的調整，進行自我學習。

而Jibo肯定不是唯一一個往這個的方向努力的公司。

我相信可能在中國、日本也是會對這種機器人非常感興趣。

螞蟻金服

螞蟻金服在中國發展非常迅速，我現在是螞蟻金服科學智囊團的主席。他們也是中國首家有這麼一個科學智囊團的組織，他們希望智囊團可以幫助這家企業把握未來的方向。

這家公司比我所知道的任何一家西方公司成長都要快。

美國還是一個信用卡加現金的社會。儘管美國有一個Paypal，與支付寶有點類似，但是它的規模也不過是支付寶的十分之一，並且也不是所有人都在用。

也許是受益於中國沒有信用卡這個產業的束縛，使得支付寶一下子實現了移動支付的巨量增長。螞蟻金服手握大量的數據，它知道你買了什麼，了解很多關於你的個人信息。

它使貸款變得前所未有的容易。這不是表面上你在手機上按一個鍵說「給我錢」這麼簡單，其背後蘊含著大量的機器學習。這涉及到機器學習中的「欺詐監測」：如果你很簡單地讓人們貸到款，很多人是會來騙你的。

總結：人工智慧的商業模式，是要創造一個市場，而非一個演算法

傳統的推薦，都是針對個人。

但這裡的問題是，如果有一家很好的餐廳，它被推薦給很多人，那麼大家都跑到這家餐廳去，就需要排長隊，人們的體驗就會很糟糕，反過來給差評和抱怨。

如此，整個系統就開始崩潰，形成惡性循環。

你必須要去創造一個市場，而非一個簡單的演算法。

比如，在APP上面，不僅僅是向客戶推薦某一家餐廳。除了讓客戶看到自己附近有什麼餐廳之外，你還要讓餐廳看到自己今晚可以供應多少食材，我今天接了一場婚宴之後，還剩下多少個散客的位置。

甚至，你可以了解一下旁邊的競爭對手餐廳，他們有沒有滿座。如果旁邊滿座了，那麼對我而言就是一個機會，我可以打折吸引更多的人流到的餐廳。

你要結合客戶和商戶兩端的需求。

這不僅是一個應用的事情。現在很多公司已經著手在研究這方面的工作。當然，這個過程要充分考慮人們不同的喜好和需求，要掌握大量的數據。

本文根據9月9日Michael I. Jordan在混沌大學的課程整理而成，內容僅為全部課程的1/7。

更詳盡：

1、機器學習的核心概念

2、AI的發展歷程；

3、AI的核心演算法與底層技術。

請下載「混沌大學APP」，註冊為學員，即可觀看混沌大學課程回放。