當機器會學習能成長 人類下個被擊敗的領域會在哪?
2017年8月,在美國西雅圖舉辦的Dota2(一款電子競技遊戲)國際錦標賽現場,計算機擊敗了世界頂級玩家。在一場單對單的表演賽中,由OpenAI機構設計的人工智慧打敗了職業玩家Dendi。OpenAI直接拿下了第一場比賽,並在第二場比賽迫使Dendi認輸,第三場比賽也沒有再進行。也許Dendi覺得取勝完全無望。
西雅圖的鑰匙體育館內舉辦的Dota2國際邀請賽中,數以萬計的觀眾重新見到了TI1冠軍成員、Dota2的代言人之一——Dendi。他這次的對手是一枚U盤——這是人工智慧第一次在一個遊戲的公開比賽中挑戰人類選手。這讓很多過去在遊戲中以打電腦為樂的玩家驚訝了。
「打遊戲要比下棋更加複雜。」清華大學研究人工智慧的博士傅昆,是位圍棋迷和遊戲愛好者。他解釋說,圍棋每步的可能性只有361種,而在即時戰略遊戲中,玩家用滑鼠點擊下達命令的每步可能性超過1億種。此外,圍棋全盤的信息是完整的,所有推測可以基於盤面情況。但AI在遊戲中獲取到的信息並不完整,它必須學習規劃、設局甚至欺騙對手。
電子遊戲正成為人工智慧研究的理想訓練場,OpenAI是特斯拉創始人馬斯克旗下的人工智慧研究機構。OpenAI官方介紹,這次為DOTA2研發的人工智慧是完全自學訓練的結果。而試圖通過遊戲來測試技術的公司並不只有OpenAI。Google公司旗下的DeepMind,也就是開發人工智慧AlphaGo登頂世界圍棋之巔的機構,已經對外透露準備選擇「星際爭霸2」遊戲,進一步測試技術。
但無論是下圍棋,還是打遊戲,這些人機對弈,看上去更像是普及人工智慧的秀場。當人工智慧快速進入大眾視野,它背後更大的潛力卻仍在深入挖掘當中。
?圍棋人機對壘: 人工智慧如何學習,變得更強大
計算機與人類在棋盤上對壘,並不是第一天。相比傳統的計算機,當代人工智慧的強大之處在於:機器會學習,會成長。
程序員們一直在用棋盤檢驗和發展計算機的能力。1997年,IBM公司的人工智慧「深藍」打敗國際象棋世界冠軍卡斯帕羅夫,這是人工智慧第一次打敗人類頂級棋手。2006年成為了人類在國際象棋的絕唱,自此之後,國際象棋選手再也沒有戰勝過頂尖的人工智慧。
儘管20年前就攻克了國際象棋,但圍棋一直被視為人工智慧難以破解的遊戲。圍棋規則簡單,然而在19×19的棋盤上卻生出巨大的複雜性,一局100多回合的對弈,個中變化遠遠超過國際象棋。
更棘手的是,圍棋在對弈過程中,有難以量化的東西。很多頂級棋手常常依靠直覺這類模糊的判斷。而強大的超級計算機,過去只能依靠在合理的時間內,分析出每種走法可能的結果。此前的人工智慧並不擅長學習人類的思維,去做這類模糊判斷。
人類本以為可以保持最後一點對機器的驕傲更久一些。一些棋手和計算機學家都曾坦承,如果往前推幾年,很難想像,人工智慧會在近年來變得如此強大。
那麼,為什麼AlphaGo能突然崛起,擊敗那麼多圍棋棋手?
回顧AlphaGo擊敗頂級圍棋棋手的過程,可以領教到它的學習和進化能力:
2015年10月,第一代AlphaGo以5∶0第一次擊敗歐洲冠軍樊麾;
2016年3月,第二代AlphaGo以4∶1擊敗李世石,過去10年里最偉大的圍棋選手之一。與上一代機器相比,這代的機器棋力高出3子。
2017年5月,第三代AlphaGo以總比分3:0擊敗世界排名第一的棋手柯潔。相比於擊敗李世石的版本,這個版本的人工智慧,棋力再次提升3子。
人工智慧突然令棋盤之上的博弈變得無限未知,年輕的棋手柯潔因為對手「太完美」「輸得沒脾氣」,在第三局對弈時甚至中途崩潰,痛哭二十分鐘。
相比於擊敗頂尖棋手,這才是人工智慧真正的可怕之處。人類棋手一輩子難以跨越的鴻溝,而AlphaGo只花了數個月的時間學習和進步。
AlphaGo的不可阻擋,關鍵答案叫做:深度學習。傅昆解釋說,將人工智慧、深度學習等關係,放在同心圓當中,最外面的圓環是人工智慧,裡面的一層是機器學習,深度學習和人工神經網路則在最中心。
AlphaGo的深度學習,使用了兩個人工神經網路的計算策略,它們各有所長——像人腦中的模塊一樣,其中一個通過大量的棋局分析訓練提出一些可能的走法,另外一個網路負責根據隨機採樣技術來評估這些走法。這些神經網路通過這種新的方法訓練,結合人類比賽中學到的監督學習,以及在自己和自己下棋的過程中強化學習。
人工神經網路的概念,源自人類的大腦皮層。在生物的大腦中,每個神經元都能被其他神經元觸發,將輸出的信號饋送給另一個神經元,並不斷輸出和觸發。計算機演算法也希望實現類似的認知方式,通過排列出多個神經層,層與層之間互相關聯。神經層越多,整個網路也就越具深度,功能也就更強大。通過輸入和輸出數據,不斷調整判斷權重,使輸出結果逐漸走向準確。
正是這個神經網路,把人類的直覺賦予了計算機。谷歌DeepMind機構2016年1月發表在《自然》雜誌上的論文顯示,早前一代版本的AlphaGo輸入了16萬盤人類棋手的棋譜,學習了人類落子布局的特徵後,它又自我對弈3000萬盤,不斷提高神經網路的精度。
據DeepMind機構官方透露,對壘李世石之後,AlphaGo經歷了一輪新的進化:整個系統架構經過了重新設計,神經網路從原來的12層增加到40層,而且不再藉助人類棋譜,完全通過機器的自我對弈來訓練——通過這種自我對弈產生高質量的數據,成為一個能夠自主學習、自我適應的智能體。
此外,技術的進步,也提高了AlphaGo的訓練效率。經過一年的演算法結構優化,從李世石版的50個TPU(谷歌專門為機器學習而設計的處理器)並行式運算,AlphaGo變成由4個TPU組成「單機版」,運算量降低了90%。計算力的提升意味著,過去一個月取得的進步,現在一周就能達到。
人工智慧AlphaGo進步之神速,令研發者自己也感到意外。其思考接近人類,實現了從「計算」到「智能」的超越。英國BBC的一檔節目中,主持人問到研發DeepMind的科學家哈薩比斯:「在你看到AlphaGo獲勝之後,你也很驚訝?」
哈薩比斯表示:「是的,我們對這台機器的能力很震驚,因為AlphaGo居然有自己的棋路……」
當人工智慧遇上醫生, 深度學習的潛力
如果人工智慧可以在幾年的時間內把一個機器訓練成圍棋大師,那麼,機器是否也可以訓練成一個醫生、一個程序員,甚至一個作家、一個藝術家?
2017年2月,《鳳凰周刊》記者曾在美國科學促進會的年會現場上,看到斯坦福大學的人工智慧研究者在一場講座上介紹他們的機器學習成果。台下除了計算機從業人員,還有醫學領域研究者。
2015年,計算機科學家塞巴斯蒂安·特龍(Sebastian Thrun)博士,測試了機器從教材圖像的學習成果,最終,人工智慧打敗了皮膚科醫生。讓機器看片子,正是人工智慧和深度學習在醫學領域的典型應用。事實上,近年來人工智慧正在給醫學領域帶來巨大衝擊。2017年1月底的《自然》雜誌封面是一篇人工智慧識別皮膚癌的論文,《自然》雜誌的子刊《自然-生物醫學工程》在2017年2月推出「機器學習」的特刊,介紹人工智慧在醫療領域的廣泛應用。
這一領域的風向標事件發生在2015年。此前曾在斯坦福大學任教的計算機科學家塞巴斯蒂安·特龍(Sebastian Thrun)博士,在那一年測試了機器從教材圖像的學習成果。他們採用由皮膚科醫生給出診斷結果的大約14000張圖像,測試機器能否將圖像正確歸到以下三類——良性病變、惡性病變和非腫瘤學增生。
最終,人工智慧打敗了皮膚科醫生。在第一輪測試中,人工智慧系統得到了72%的正確率,而2名經過斯坦福大學董事會認證的皮膚科醫生同時參加測試,他們只得到66%的正確率。接著,特龍博士的團隊又將研究範圍擴大到25名皮膚科醫師,使用了更準確的評價標準,結果,人工智慧再次取得了勝利。
「在每次測試中,演算法均優於專業的皮膚科醫師。」特龍的團隊後來在《自然》雜誌發表的論文中稱,這一成果的背後,是數以萬計的臨床圖片深度學習,且圖片閱讀量還在增加。
在此之前,醫療領域以往也有過計算機做自動化診斷,但由這種機器醫療的結果是,診斷效果準確率可疑,比如,上一代計算機輔助檢測和診斷在乳腺X照相術上的表現並不佳。
新一代的人工智慧診斷設備,與對陣圍棋的AlphaGo一樣,正是基於深度學習的演算法。與此前不同,特龍博士研發的演算法系統不是由明確的醫學知識庫和診斷規則列表引導,研究者不再使用編程教給機器各種原則,而是由機器自己去認識,由機器通過大量的內部調整,類似於加強和削弱大腦中的神經突觸連接,有效地自學,比如,區分痣與黑色素瘤。
新機器擁有了此前未曾有過的內置的學習機制。用《紐約客》的報道說,以前「一台已經看過3000張X光片的機器,它的能力和它看第一張的時候,是一樣的。」而現在,只要不斷輸入數據,機器就能通過神經網路,學習和成長。
特龍博士認為,從基於規則的演算法,轉變為基於學習的演算法,使得機器完全可以超越第一代診斷設備。
可新機器的診斷藝術究竟是什麼,它如何像一位優秀的放射科醫生那樣,觀察出其他醫生看不出來的CT影像陰影,或其他不同尋常的東西,並作出準確的分析?
我們現在只知道,它是通過神經網路,而神經網路奇特的地方在於,它們就像「黑匣子」,裡面的工作是神秘的。基於神經網路的策略,機器深度學習的內在過程,即便是開發者自己,也並不清楚。
2017年5月《紐約客》雜誌的一篇報道,用一個「認狗」的比方,形象描述了這個過程。
老式的計算機程序要識別狗,工程師會寫很多行邏輯代碼:如果有耳朵,豬嘴,並有頭髮,則不是老鼠等等無限的判斷語句。但這顯然不是人類認識狗的方式。起初,小孩通過看見狗,被教導這是狗而認識狗;他會認錯,然後糾正自己。比如,他會把狼認成狗,然後被大人糾正這兩種動物不是同一類。他一次次調整自我認知:這是「狗」,那是「狼」。
機器學習也是這樣。研究者只是將圖像資料及診斷分類標準提供給神經網路,機器自己會從已分類的訓練中提取信息。這張圖是狗,那張圖不是狗。它會從不同類別中歸納出特徵。通過觀察成百上千張歸類的圖片,它最終形成自己認狗的方法,過程和小孩認狗的方法一樣。
「黑匣子」問題在深度學習中很流行,神經網路學習時的內部修正和處理過程均不受我們的控制。它如何提升確定病變是黑色素瘤的能力?它如何提升在遊戲中跟玩家對壘的能力?它又如何從新加入的圍棋棋譜中學習?我們並不知道,它也無法告訴我們。
無論如何,機器學習正在醫療領域不斷取得突破。在《美國醫學會期刊》(JAMA)報道的一項研究中,谷歌公司的人工智慧學習診斷眼疾。在學習了12000張圖片後,它能準確地判斷糖尿病性視網膜病變,靈敏度和特異性分別超過96%和93%,可以媲美眼科醫生。
更重要的是,人工智慧的學習潛力無限。以識別皮膚病變的過程為例,一位新的皮膚科住院醫生要從零開始接觸患者,而人工智慧卻是一直在成長和學習。一位全職皮膚科醫生,一生中大概會看20萬個病例,而機器的學習潛力遠甚於此。此前的人工智慧在3個月內吸收了13萬個案例,未來還能吸收更多,比這個領域最資深的皮膚科醫生還要「資深」。
大數據: 人工智慧的運作基礎人工智慧在近年來成功取得突破,基礎是來自大數據的支持。
作為谷歌大腦團隊的創辦人、前斯坦福人工智慧實驗室主任,吳恩達曾如此描述人工智慧,「儘管人工智慧已經有很大範圍的影響了,但它在產業內的應用方式還極其有限。幾乎所有人工智慧最近的進步都是通過一種類型——即輸入數據A然後快速生成簡單的回應B。這些 A→B系統已經在急速地發展,現在最有效的技術就是深度學習。」
但這樣的學習框架有一個弱點:它需要巨量的數據。在吳恩達2016年為《哈佛商業評論》(HBR)撰寫的文章中,他指出人工智慧的不足,人們需要給這個系統很多A和B的樣本。比如,開發一個圖片標註器需要成千上萬的圖片A及其可以說明圖中是否有人存在的標籤B。而開發一個語音識別系統也需要成千上萬小時的輸入語音A以及有語音轉錄文本B。
「因為互聯網有了大量數據,人工智慧最成熟的應用其實就是圖片搜索,再就是語音識別。」國內一家語音技術公司的工程師張樂說,語音識別技術的突破是深度學習在實際應用的重要斬獲,我們手機APP里的語音輸入功能正在變得比以前更強大。
語音搜索也在變得越來越聰明。谷歌公司已經利用它多年收集的數十億語音樣本建立了人工智慧系統,能理解各種口音和細微差別,使得谷歌的語音搜索功能有了更多可能。
但深度學習最主要的受益者,仍是「計算機視覺」,這是人工智慧領域當下最成熟的應用。計算機視覺在許多圖像識別的任務上,可以與人類媲美。消化了大量的標籤化訓練數據,深度學習在醫學領域,才從X光掃描與CT掃描圖像分析取得突破。
「搜索引擎里使用的相似圖片識別,就是典型成熟的人工智慧應用。」張樂說,高質量的大數據和強大的計算能力是深度學習演算法統領江山的兩大支撐,由於人類已經上傳到網路數十億張照片,用元數據標記這些照片,強大的計算機可以從中找出模式和意義。
2012年10月底,在由微軟亞洲研究院和南開大學、天津大學舉辦的一次學術會議上,微軟首席科學家理查德·F·拉希德(Richard F. Rashid)發表演說,基於深度學習的電腦程序對他的講話內容進行了識別,還用英語把這些內容實時顯示在了他上方的大屏幕上。清華大學的傅昆也認為,人工智慧在近年來成為科技界最熱門的話題,大眾層面上,要歸功於人工智慧戰勝圍棋世界冠軍這樣的事迹,但在業界,則會一致追溯到圖像領域。
人工智慧的重新興起要追溯到2012年被稱為ImageNet挑戰賽的在線競賽。為了與過去像國際象棋「深藍」那樣的人工智慧區分,很多研究者一度避免使用「人工智慧」這個術語,而更喜歡用「神經網路」。
ImageNet是一個擁有數百萬張圖片的在線資料庫,所有圖片都有人工做的標籤。對於任何給定詞,例如「氣球」或「草莓」,ImageNet里都能找到對應的圖片。每年的ImageNet競賽鼓勵該領域的人在計算機識別和自動標記圖片上比賽,並衡量進展。這些系統首先使用被正確標記的圖片集進行訓練,然後挑戰標記之前沒見過的測試圖片。
根據《經濟學人》雜誌2016年的報道,相比於2010年獲勝的系統可以正確標記72%的圖片(人類平均有95%的準確率),2012年的成果是一項突破。這一年,歸功於深度學習技術,多倫多大學的科學家Geoff Hinton帶領的團隊實現了85%的準確率。這項技術使用了大量的計算和訓練數據,由人類的神經網路啟發而來。他們也被稱為深度學習的先驅。
這帶來了一種長遠快速的改進,在2015年的ImageNet競賽上,一個深度學習系統以96%的準確率第一次超過了人類。
過去的十多年中,新技術的出現使得訓練深度網路變得可行。同時,互聯網的興起產生了數十億可用於目標訓練的文檔、圖片、視頻數據。
這所有的一切都需要大量的數字操作能力,而2009年左右,當幾個人工智慧研究團體意識到個人計算機和視頻遊戲機上用於生成精緻畫面的圖形處理器晶元GPU,也同樣適用於運行深度學習演算法之後,計算能力也早已不再是問題。
此前,斯坦福大學由吳恩達帶領的一個人工智慧團隊發現GPU能夠幾百倍地加速深度學習系統。然後,訓練一個四層的神經網路突然就變得很快了,由之前需要花費幾周的時間變成了不到一天時間。
ImageNet的結果顯示了深度學習的能力。然後,深度學習不僅在人工智慧界,也在整個科技產業界獲得關注。深度學習系統20或30層的網路變得常見,微軟的研究人員甚至曾建立過152層的網路。更深層的網路能進行更高水平的抽象併產生更好的結果,事實證明,這些網路擅長解決眾多領域的難題。
強大的學習能力, 人工智慧的未來與威脅人工智慧早就走出實驗室,離開棋盤,潛入人們的日常生活——幫你美圖、給你指路、為你推薦圖書和電影,繼而洞悉你的喜悅和痛苦……但這還遠不是它的全部。所有通過學習得到的專業技能似乎都可能將被人工智慧掌握。所有的專業技能領域都將直面AI挑戰,我們似乎都要面臨圍棋手柯潔在三盤棋間的起落激蕩。
2016年,谷歌公司徹底改造原先的翻譯系統,引發輿論關注。谷歌引入神經網路,大幅提高了翻譯的準確率,其中一些語言的準確率甚至提高了85%。隨之發布的多語言互譯系統,將兩種語言的翻譯學習「遷移」到更多的語種,比如,通過中英互譯的學習,就能直接把模型演算法遷移到中日、日英等多語種互譯方面。機器「學習如何學習」,已經成為谷歌未來最重要的研究方向。
「讓人激動的是,深度學習能夠應用於眾多不同的領域。」谷歌機器智能研究部門負責人John Giannandrea在接受《經濟學人》採訪時稱,除了改善網頁的翻譯服務,谷歌正在使用深度學習提升其網頁搜索結果的質量,理解智能手機端的口語指令,幫助人們在照片中搜索特定的圖片,推薦電子郵件的自動回復,並且幫助自動駕駛汽車理解周圍環境。
在醫學領域,除了一些疾病的診斷,更有些雄心勃勃的機器學習演算法想要整合自然語言處理(讀患者醫療記錄)、百科全書知識、期刊文獻和醫學資料庫。麻省劍橋的IBM沃森系統(Watson Health)和倫敦的DeepMind公司都希望創建這樣一個全面的系統。
機器的學習能力,大數據的積累,以及其他各種技術的突破,使得人工智慧技術突飛猛進。之前看起來不可能自動化的工作,現在似乎都同樣面臨著危機。
當機器人會自動編寫新聞,已經有一些大型新聞通訊社在實踐,有人開始擔心記者會失業。而當機器取代了醫療的診斷角色,醫生這個職業也將面臨人工智慧的挑戰。基於神經網路的更好的翻譯效果,則讓翻譯對自己的職業前景產生了懷疑。
在深度學習那個並未給予因果關係闡釋的「黑盒子」里,人工智慧正在以令人驚駭的速度快速攻克各種單一技能,在簡單任務上逐一完勝人類。它們在棋類比賽中獲勝,在汽車安全駕駛比賽中獲勝,沒有人知道,人類下一個被擊敗的領域在哪裡。
矽谷傳奇軟體工程師Jeff Dean眼中有一條清晰的AI發展路徑,「醫療、無人駕駛,這些走在比較前面,都是會比較快改變的行業。需要人工智慧的不只是科技公司,而且會是一個社會性的全面應用。各個行業先後不一,但都會探索性地先在小問題解決上使用人工智慧,之後漸漸拓寬人工智慧在該行業的應用,最終發展到整體人工智慧解決方案。」
但相比工作崗位的爭奪,還有人擔心,人工智慧是否會威脅到未來?有人想起雷·庫茲韋爾那些關於「奇點」的古怪預言,比如,未來人類是否會製造出比我們更聰明的機器,它們再造出更聰明的機器,如此這般,整個世界朝著我們無法預計的巨型超智能的方向狂奔;又或者,我們將人的思維載入計算機,在計算機的電路里獲得超強智力,甚至永生。
人工智慧會成為人類的威脅嗎?很多業界人士都不認可這一點。IBM倫理研究員Farancesca Rossi說,人工智慧「總有一天會覺醒並獲得自己的思想」的想法並不現實。在剛完成寫作《人工智慧》一書的李開復看來,AI威脅論目前似乎更適合科幻作家們去討論,「機器學習永遠不可能有自我意識,因為優化目標是人類給定的。」
AI本身的確不可能成為威脅。人工智慧與人類智能無疑還有著本質的差異——它不具備情感、不具備慾望,更不用說統治世界、奴役人類的興趣與野心。
然而,這項技術也因為展現出前所未有的強大性,值得人們對如何使用它產生擔憂。在人工智慧時代,人類依舊要學習與思考。在一些人工智慧的會議上,很多專家都將AI安全部署當作重要議題。
「我們在公司創立的時候就明確,我們想要開發通用型學習技術去打造一個更好的世界,我們的技術必須秉持透明、合理的原則,讓人類監督並且讓人類掌控。」谷歌DeepMind實驗室創始人哈薩比斯曾說,技術應該具備「正確性」,「研發者需要給AI植入一個『善』的動機,第一不能被用來製造殺人武器,第二不能被個別公司所控。」
比如,與英國國家醫療體系NHF的合作是AlphaGo後台部分技術落地項目之一,「我們完全接受NHF的監督,絕對不會把用戶的數據用到保險或者是其他的業務中去。」
不過,隨著人工智慧的發展,一些從業人士也對AI應用于軍事等其他可能的威脅發出了預警。
我們正身處人工智慧的革命中,一方面,人工智慧展現了強大的希望,按照Facebook創始人扎克伯格的說法,未來十年,人工智慧將大幅改善人類的生活,另一方面,人工智慧是福是禍,是否會失去人類的控制,終究只在那些研發和使用者的頭腦之間。
相關鏈接:
人工智慧真的來了!哪些人會被淘汰
機器人與我:人類的下一個10年將翻天覆地
這場革命下 人類將面臨巨大的焦灼!
推薦閱讀:
※CNS薦文:癌症領域中不可不看的亮點研究
※癌症領域顛覆性技術產品TOP10
※博客進入學習領域--網路學習者
※腎臟領域高血壓的四個關注
※女人身上最敏感的「七寸」領域,情商高的男人不會碰!