從「機器學習」到「學習機器」:人工智慧的文化影響

1

1月31日,在第五屆CCTV賀歲杯中日韓圍棋爭霸賽決賽上,面對衛冕冠軍柯潔,井山裕太數度模仿AlphaGO在橫掃弈城時的著法。現場觀戰的羅建文對記者說:「自從AlphaGO出現後,以前的很多理論都被顛覆了……像這種下法,以前是要被老師罵的!

在AlphaGO和李世石的歷史性對局之後,所謂「AlphaGO流」的圍棋風格就開始在職業棋壇流行起來,並且在「master」的連勝之下愈演愈烈。

和20年前的「深藍」一樣,AlphaGO同樣選擇一項棋類遊戲對人類發起挑戰,這不是偶然。和語言翻譯、新聞推薦、語音理解不同,這是勝負分明的領域,失敗者必須尊重和學習勝利者,而不是挑剔它們偶爾出現的誤差。

至少在圍棋領域,機器向人類學習的時代已經開始接近尾聲,而人類向機器學習的時代正在黎明。

2

為什麼在「深藍」擊敗人類大師的20年後,AlphaGO仍然讓我們感到空前的不安?

國際象棋的遊戲複雜度是10的46次方,對於現代計算機來說不是一個天文數字。「深藍」採取的策略非常簡單粗暴:在人類對手下完之後,利用計算力的優勢,窮盡棋盤上的每一種可能性,並從其中排除掉會令自己落敗的著法。

所以,「深藍」其實從來沒有被人們看作一種「智能」,她只是一套從數學上「破解」了國際象棋的「程序」——這門遊戲儘管已經非常複雜,但相比現實中的人類智力活動還是很簡單的,這種「窮舉法」無法直接應用於社會實踐中。

圍棋的遊戲複雜度達到了10的172次方——要窮盡它的策略選擇,是不可能的。AlphaGO的「深度學習」是一種基於統計數學的方法論:通過獲取人類對弈的記錄,以及直接與人類或自身對弈,AlphaGO能夠獲得大量用於統計分析的「學習樣本」。通過對著子紀錄和勝負關係進行數學分析,AlphaGO可以逐漸理解在不同的棋局裡哪些下法更容易贏、哪些下法更容易輸。接著,她用分析得到的策略去和人類對弈,或者和自身對弈,保留更優的著法——不斷重複。

AlaphGO並不是「深藍」那樣算無遺策的機器,而是人類的模仿者。她觀察、分析、訓練、總結……不知疲倦地重複。

終於,她用人的方式戰勝了人——昔日的學徒成為了大師。

3

在和機器打交道的數百年里,人們已經習慣於機器絕對的精密和準確。但AlphaGO不一樣,正因為她用以對抗人類的「思考方式」遠比「深藍」更像人類本身,所以AlphaGO的著法不像「深藍」那樣無可挑剔。

當需要解決的問題足夠複雜時,每一個現實樣本都有其自身的特殊性,一個能完美吻合所有學習樣本的數學模型是不可能的。不夠複雜的模型會擬合不了現有的學習樣本(欠擬合),而過於複雜的模型則會在實踐應用中出現太大的誤差(過擬合)。機器學習的優化目標,不是對於每一個樣本都完美擬合,而是在「欠擬合」和「過擬合」之間找到整體最均衡的狀態。

這剛好就像圍棋一樣:為了交換整體局勢的最優,在局部付出一些代價是必須的。

對於當下任何足以勝任複雜任務的「人工智慧」,都應當作如是觀。當我們挑剔AlphaGO、谷歌翻譯和Siri們所犯下的各種錯誤時,最好別忘了,因為這些」智能「在計算中的誤差,才讓她們看起來比以前更像人類——人類是會犯錯誤的。

4

機器的「深度學習」會讓人聯想到人類兒童接受的早期教育。我們的「學習樣本」被標註為「圓形、方塊、三角」、「紅色、綠色、藍色」或者「大的、小的」。一旦這些抽象概念的模型在我們的頭腦中被成功建立起來,我們會開始練習使用這些基本概念去組合形成更加複雜的概念:「紅色的大三角」、「綠色的小方塊」……再接下來,和生活實踐相結合,我們開始區分貓和狗、男性和女性、房屋和車輛……

區別在於,如果AlphaGO的團隊認為有必要,她可以每天進行數以萬計的自我對弈以獲取大量的新的學習樣本——即便把這個標準降低到每天幾盤,也只有極少數人類才能堅持下來。

要保持終身、高專註度的學習,人需要不斷克服自己的惰性、慾望、挫敗感。而這些是機器永遠不需要面對的。

所以,人類的思想很容易陷入僵化。階層、教育、家庭背景的制約會逐漸減少一個人生活的選擇,因而讓他陷入對既有生活經驗的簡單重複中,而當你花了太多時間在少量、高度相似的學習樣本上,你很容易得到對這些樣本「過度擬合」、缺乏泛化能力的思考模型。

有一篇流傳甚廣的雞湯不無道理,它說:大多數人在30歲的時候就死了,他們只是不斷重複自己在30歲以前的人生——除非他能始終保持開放的心態,主動去接觸那些超出自己經驗範圍的樣本,不斷泛化自己的思想模型。

但那很不容易。大多數人面對超出既有生活經驗的新現象,幾乎會出於本能地提出質疑和否定,從而換得停留在既有經驗和思想上的舒適感。

5

AlphaGO的勝利是一個毋庸置疑的信號,它讓人類不得不正視這樣一個事實:人類思考的過程與機器的相似之處也許遠比人們過去以為的高。儘管機器常被認為沒有靈感、聯想和視覺思維等人類「獨有」的思考模式,但僅憑藉對邏輯的充分運用,機器一樣可以恰當地模擬人類的思考,甚至比人類幹得更好。

這其實提出了一個很好的問題:人類真的存在那些非邏輯的思維方式嗎?或者說那只是出於對自身認知模式的無知而提出的一些不符合事實的假設呢?

完全有理由相信,機器學習在人類社會中的影響還遠沒有開始充分釋放。這不僅是指機器學習將如何進一步應用於人類的社會實踐中。更關鍵的一種影響可能是文化意義上的,機器在人類領域設立的更多成功樣本可能成為人類學習和模仿的對象。

6

AlphaGO不是天才,李世石才是天才——他用遠比AlphaGO更少的訓練樣本,達到了與它旗鼓相當的思考水平。

AlphaGO其實向我們再次證明了那些我們很早就知道卻沒能做到的道理。

就像一位大師說過的那樣:

真正的大師永遠都是學徒。

A true master is an eternal student.

感謝魔雲獸等讀者對本文的貢獻

本文作者:劉晨

高顏值新媒體專家

頭條號三金冠自媒體

我的頭條號、微信公眾號和知乎專欄:

字典序列

你也可以通過「在行」約見我

推薦閱讀:

如何評價小米聯合中國移動推出的4G版筆記本較大幅漲價的情況?
給你一百萬人民幣或一萬個比特幣,你會選擇哪個?
為什麼OV的內存卡這麼便宜?
顯卡該上 GTX 1080 還是 1070 ?
人們真的因為科技發展而變聰明了嗎?

TAG:人工智能 | 科技 | AlphaGo |