王威廉機器學習：現在與未來

07-07

新智元推薦1

發表於《科技導報》2016，34（7）

2016年3月，在韓國首爾四季酒店舉行的谷歌 DeepMind圍棋挑戰賽，人工智慧圍棋軟體AlphaGo以4∶1戰勝了韓國棋手李世乭九段。本次比賽後，關於人工智慧和機器學習的話題迅速升溫，引起社會各界的關心。然而，除了在本領域工作的一線科研人員，其他人士對人工智慧和機器學習的發展現狀和前景了解的卻不多，甚至存在不少誤解。在此，本文希望能跟讀者探討一下人工智慧和機器學習，談談其發展現狀與未來趨勢。

1 什麼是機器學習？

機器學習是人工智慧的一個分支學科，主要研究的是讓機器從過去的經歷中學習經驗，對數據的不確定性進行建模，在未來進行預測。

舉一個最簡單的二分類例子（圖1），假設現在想用機器自動把網頁分成2大類：體育和非體育類網頁。首先需要收集訓練樣本，在這裡，指得就是各種體育類和非體育類的網頁。接下來，需要對樣本進行分析，通過一些抽象化的描述，定義特徵。譬如，分析網頁里應用的詞語以及每個詞語出現的次數。第三步為數據建模。通常，需要設計數學模型，來分析特徵與標籤的分布情況。具體來說，是通過優化方法，學習一個映射函數，其輸入是一個樣本的特徵向量，其輸出是標籤（體育類或非體育類）。在預測階段，當用戶輸入一個新的網頁樣本時，我們同樣做特徵抽取，通過使用學習完畢獲得的映射函數，自動去預測這個樣本的標籤類別。

上述例子僅是一個較常見的有監督二分類問題。在機器學習領域，通常人們習慣把演算法分為3類：有監督學習、半監督學習和無監督學習。所謂有沒有「監督」，指的是機器在學習階段，能否看到樣本的標籤（如上述例子中的體育及非體育類別）。半監督學習通常也被稱為弱監督學習，目的是通過少量的例子，在無標籤的樣本中自動學習參數。至於無監督學習，通常人們接觸比較多的是聚類問題：通過分析數據樣本的相似性，來把相似的數據組合成集群。

2 機器學習的當前研究重點和發展趨勢

除了上述3大類演算法，機器學習還有很多有趣的子領域。比如近些年興起的深度學習熱潮，指的是通過使用多層的神經網路模型在大數據上建模。比如谷歌的AlphaGo系統，就是通過在數十萬的人類對弈棋譜上學習策略網路（Policy Network）和估值網路（Value Network），再結合蒙特卡洛搜索樹演算法來決定如何走棋的。所謂策略網路，其實是一個卷積神經網路，用來選擇如何落子。所謂估值網路，也是一個卷積神經網路，用來分析當前的勝率。圍棋的棋盤相對較大，是一個19×19 的網格，每一步有上百種走法。對於李世乭這類頂級棋手來說，可以預測未來的局勢。對於計算機來說並非易事，因為可以落子的搜索空間太大。谷歌之所以取得成功，正是因為其很好地把這2個神經網路與蒙特卡洛搜索樹結合，精確地分析和預測了李世乭的棋路。

在大數據時代，機器學習領域還有一個熱點是把系統與演算法結合，設計大規模分散式的機器學習演算法與系統，使得機器學習演算法可以在多處理器和多機器的集群環境下作業，處理更大量級的數據。這方面較為知名的系統包括：加州大學伯克利分校的Spark、谷歌的TensorFlow、華盛頓大學的Dato（原名 GraphLab）、卡內基梅隴大學的Petuum、微軟的DMTK系統等。也許在幾十年前，計算機科學的核心是操作系統、演算法和編程語言。但是在今天，在大數據的背景下，計算機科學逐漸演變成一個越來越強調跨領域合作的學科。如何有效地把系統和機器學習方法相結合來處理海量數據，這將是未來人工智慧和計算機科學發展的關鍵。除了這2個最近5年比較熱門的領域，其實機器學習還有許多有意思的科研方法。譬如，優化演算法一直是機器學習領域的重點，如何處理各種凸優化和非凸優化問題、如何處理分散式優化，避免局部最優解，一直是學者最關注的問題之一。其他值得關注的領域，還包括強化學習（reinforcement learning）、概率圖模型（probabilistic graphical models）、統計關係學習（statistical relational learning）等。

3 谷歌AlphaGo成功的啟示

在谷歌的AlphaGo系統戰勝李世乭後，由於對技術背景缺乏了解，加上部分公司和媒體為了達到商業目的而進行的誇張宣傳，部分人對人工智慧和機器學習技術的發展表示擔憂。有人認為，圍棋是人類最後的智力堡壘，計算機攻克了圍棋，那麼人類是不是離滅亡也不遠了？

在國內外人工智慧學者的討論中，美國喬治亞理工大學機器學習助理教授Le Song認為這種論斷具有基本的邏輯錯誤，因為古今中外，會下圍棋並不代表能統治世界，絕大多數的國家領導人也都不是圍棋棋手。從事實出發，谷歌的AlphaGo系統僅僅是在人類棋譜上訓練而成的計算機圍棋軟體系統，其根本不具有理解人類語言、圖片和推理等其他機器智能。另外，需要強調的是，AlphaGo系統的背後，是幾十名谷歌科學家數年的辛苦工作，設計演算法和調試程序的反覆迭代，才取得的成果。所以，AlphaGo的棋商，歸根到底也是谷歌科學家們集體智慧的結晶。

不久前，我通過微博對我的朋友們（主要來自科技界）做了一項多項選擇調查：「你覺得 AlphaGo戰勝李世乭意味著什麼?」 361位用戶參與了投票，其中44.5%的票投給了「一次對技術發展有益的測試。」；29.5%的票投給了「AI 歷史上的里程碑事件。」；13.8%的票給與了「無感，圍棋規則明確，機器善長。」；另外有10%左右的票認為李世乭不在巔峰，應該給柯潔機會。然而，只有 0.6%的票認為「機器即將滅亡人類」。由此可見，科技界總體相對還是比較理智的。

毫無疑問，我認為AlphaGo是近年來機器學習、系統和高效搜索演算法結合成功的典範，谷歌AlphaGo成功給我們的啟示是多方面的：

1）正確的選題。谷歌選擇了可以量化、規則明確的計算機圍棋領域，其主要負責人David Silver 和 Aja Huang的博士論文均是計算機圍棋，有著超過10年的經驗。

2）恰當的方法與時機。在計算機性能大幅度提升的大背景下，谷歌通過訓練大規模深度學習網路，結合高效的傳統蒙特卡洛搜索樹，成功地控制了圍棋的複雜度。

3）精密的工程實現。在數十名谷歌工程師的努力下，AlphaGo有了單機和分散式 2個版本，針對時間限制，設計了快速落子和仔細斟酌的策略，對時間採取毫秒級別的估計。這些工程上的細節，無疑是決定成敗的關鍵之一。

卡內基梅隴大學博士、Facebook圍棋項目負責人田淵棟認為：谷歌AlphaGo的成功，告訴我們結合機器學習與傳統符號搜索方法可以解決人工智能里相對複雜的推理問題。這點我十分同意。David Silver 等 2016 年 1 月在《Nature》發表的介紹AlphaGo的論文中，也明確提到了，只有把機器學習與高效的搜索方法集合，AlphaGo才能取得最高的Elo棋力評價（圖2）。

4 理性看待人工智慧和機器學習的未來

人工智慧和機器學習的路還很長，我們應該正確認識AI能夠在當前取得的成就，才可以解決更加複雜的問題。我們能看到上述 AlphaGo 對技術發展的積極啟示，但是也不能忽略：對於自然語言理解，雖然經過了數十年的發展，依然沒有人工智慧系統可以做到完全正確地理解人類的語言（包括語音識別和機器翻譯）；在機器人領域，即使工業機器人發展迅速，我們依然沒有看到具有常識和推理能力的智能家庭機器人；在計算機視覺領域，即使我們在人臉識別和圖片分類上取得了不小的成就，但是對於關係理解和完整的場景認知，現在系統能做到的還很有限。

作為科學工作者，我們的本質工作就是追尋事物發展的基本規律，尋找真理。所以在媒體出現與事實不符的報道時，我們需要客觀地分析技術的發展，理性地看待科學技術的成長，澄清謠言。

歷史上，也曾出現過由於對人工智慧的炒作而造成的技術發展停滯，這一時期被稱作是 AI 寒冬（AI winter）。在1970年代，由於較早前對人工智慧技術發展過於樂觀，但在由於實際實現中發現困難重重，美國國防部先進研究項目局取消了大部分對人工智慧研究項目的資助，導致人工智慧技術在當時發展停滯不前。

對於「人工智慧威脅論」，大可不必擔心機器滅亡人類。至於人工智慧技術發展對於社會的影響，我認為是雙向的。首先，我同意卡內基梅隴大學機器學習系Alex Smola教授的觀點：AI技術在未來確實有可能對流水線工人、卡車司機、保潔員等相對低技能要求的工種造成衝擊，然而解決的辦法只能是提高整個社會的教育水平。其次，我認為社會也在對人工智慧技術的發展產生各種積極的約束：譬如，用戶對於技術的安全性和穩定性的要求；用戶對於數據隱私的要求；用戶對於產品的道德約束。總而言之，當前是人工智慧發展的一個令人興奮的時期，機器學習技術對於整個人類的發展，也是具有不可估量的潛力。我們應該正視科學技術發展的進步，理性看待所取得的結果。

作者：王威廉美國卡內基梅隆大學計算機科學學院發表於《科技導報》2016，34（7）

《科技導報》

中國科協學術會刊

聯繫電話：010-62194182

長按二維碼即刻關注