別看AlphaGo這麼狂,它離真正的智能還差得遠|陳經
關注風雲之聲,提升思維層次
解讀科學,洞察本質,戳穿忽悠,粉碎謠言
導讀:現在所有的人工智慧程序,都和最簡單的程序一樣沒有智能。說是機器在學習,其實機器做的仍然和過去一樣,沒有本質區別。如果人類只管建神經網路,把各種數據扔給機器自己去「領悟」,然後機器輸出了一些出人預料的、有意義的智力成果,那就真有本質不同了。
————————————————————————————————
2016年12月,《科學》雜誌照例公布了年度十大科技進展,其中圍棋人工智慧AlphaGo擊敗人類高手排在第三位,僅次於引力波檢測,以及比鄰星系行星的發現(就是劉慈欣筆下三體人的行星)。同月《自然》公布的年度八大科技進展中,AlphaGo排在第七位。圍棋人機大戰也在全社會引發了人工智慧熱潮,機器在圍棋這個最難的博弈遊戲中取得了出人意料的勝利,引發社會思考人工智慧技術突破對人類的影響。
很多人對機器擁有與人類相當甚至超過人類的智能這事很有興趣,在相關的科幻小說與電影中,人工智慧也經常是眾多媒體的關注焦點。「人工智慧」這個詞本身就是常見辭彙,人們並不陌生,但其實大多數人對人工智慧技術細節並不了解,有時會有一些誤解,或者作出過於誇張的解讀與聯想。
AlphaGo戰勝李世石是「人工」而非「智能」
IT時代的人們早就熟悉了計算機的特性,如電腦做數學運算速度遠超人類,可以不眠不休一直穩定運行,程序可以海量快速複製,但我們並不把計算機看成智能。汽車跑得比人快,起重機比人力氣大,但這些都是人發明的工具,並沒有智能的感覺。人類對自身的智能非常自豪,認為這是人特有的「本事」,動物沒有,機器也沒有,所以人類是「萬物之靈」。
五子棋、國際象棋、圍棋等「完全信息博弈」遊戲,是一類典型的智力活動,其中圍棋是最難的一個。
1997年國際象棋AI深藍打敗了代表人類最高水平的卡斯帕羅夫,但當時的圍棋程序非常差,水平比業餘「低手」都差得多,怎麼寫出能挑戰人類高手的圍棋AI毫無頭緒,沒法估計要多少年。
2016年AlphaGo戰勝李世石,以及年底升級版本Master在對人類高手快棋比賽中以60:0碾壓式勝利,可以說人類在最難的圍棋中都已經被機器打敗了,找不到更難的棋類去顯示人相對機器的智力優勢,人在這個類別的智力活動上已經不如機器了。是不是說機器的智能已經開始超過人類了?很多人對此很迷惑。
可以肯定地說,到目前為止,人工智慧雖然在下棋、圖像識別、自動駕駛等多個領域取得了令人印象深刻的成就,但都只是「人工」的結果,完全是人類自身的智力活動成果。「機器智能」的進展並沒有想像的那麼大,甚至可以說毫無進展,機器本身沒有任何智能。
從程序開發的角度看,如果先不管這些人工智慧程序最終的效果,它們只不過是一些演算法思想與程序代碼,並沒有任何特殊之處。代碼是程序員一行行編寫、修改、調試出來的,程序中用到的數據不管有多少,都是開發者有意識地收集、生成、維護的。如果告訴程序員群體,這裡有一個程序,它的代碼是這些,數據是那些,它的功能是對給定的輸入產生期望的輸出,沒有任何一個程序員會感到奇怪,因為所有程序都是這樣的,利用電腦的存儲與數學運算能力,設計演算法寫代碼實現,讓輸入的數據得到預想的輸出。
舉個例子,我們來看兩個程序。
第一個程序將兩個輸入數字的乘積輸出給用戶,並保證它是絕對正確的。
第二個程序對於一個圍棋局面的輸入,給出兩個坐標作為輸出,下這個點能夠獲勝。
我們可能把前一個程序叫工具,因為它就是計算器的一個功能,但是把後一個程序稱為有「智能」的AI,因為它看上去需要很深的智力思考。但是從使用的機器、開發的過程、最終生成的程序文件、程序執行時的運算過程等各方面來看,兩個程序本質上完全一樣。可以說第二個程序除了最後展示出來像是智能,和第一個程序性質上並沒有任何不同。
也就是說,現在所有的「人工智慧」程序,都和最簡單的程序是一回事。聰明的演算法設計者和程序員們,讓一些程序看上去有了「智力」才能實現的能力,並稱之為「人工智慧」。實際執行程序的電腦完全就是在執行人類的指令,沒有任何智能。
可以說,目前的「人工智慧」,都是人類智能的第二種展現方式。人可以直接用人腦去下棋,用的是人的智力思維。也可以寫程序代碼,用機器去替自己下棋,而且比第一種方式幹得更好。人可以自己用鋤頭挖地,也可以開挖掘機挖地,這是人類勞動的兩種方式。在體力勞動上,挖掘機比人力氣大,顯然更先進,但沒有人會說挖掘機有智能。也就是說,人類的體力勞動方式能夠藉助工具不斷變化,先是用手指挖地,再揮鋤頭挖,再開挖掘機挖,以後可能有更先進的方式。而人類的智力思維,同樣也可以藉助工具。人類可以自己用腦子算315*227,可以用算盤算,也可以用計算器算,可以用電腦上的EXCEL表格算,也可以說話讓手機AI助手算。無論哪種,都是人在用各種工具實現人解決問題不同的思路。
現在所有的人工智慧程序也是如此,都是人類主動去發明創造一個工具,用另外一種辦法展示人類的智能。最終好像是一個機器下棋打敗了人類高手,人們說AlphaGo智能超過人類了。但其實是Deepmind團隊里做演算法設計與程序開發的十多個人,換了一種思維方式,藉助電腦這個工具打敗了靠傳統思維下棋的人類高手。AlphaGo的單機版或者分散式版本中的CPU、GPU都只是工具,沒有任何智能,只是在做簡單的加減乘除運算。AlphaGo不知道自己在下棋,它就是在機械地做算術。和人類高手對戰的,其實是程序開發者,他們是用設計演算法寫程序的思路來下棋。
圖為AlphaGo開發團隊,李世石真正的對手。左五為David Silver,左六為Aja Huang,負責演算法設計的兩位核心成員。
如今的人工智慧遠沒有人們想像的那麼強大
現在人工智慧開始在很多領域嘗試人的專業「智力」工作。如人工智慧像專家那樣分析醫療圖片,像保險專家那樣審核保單,像律師那樣分析案件涉及法律條款,像記者那樣寫稿件。很多人將這理解為,機器在代替了工人的體力勞動之後,開始衝擊知識水平更高的專家的工作了。甚至有些人憂心忡忡,怕自己的專業工作也變成能被機器取代的簡單勞動。
根據以上的分析,這並不是「機器」對人的衝擊,而是演算法開發者與程序員們,在用另一種思維進行各種專業智力活動。本質是人類兩種思維方式的碰撞,一種是演算法思維,一種是傳統專家思維。電腦與機器本身都只是工具,沒有思維沒有智能,體現的是背後指揮它們行動的人的意圖。演算法開發團隊,會設計演算法寫程序實現,讓電腦去看醫療圖片給出分析結果,自己手工抄到紙上;而傳統醫生專家,用人眼看醫療圖片給出判斷,他們也會用電腦,如把圖片顯示在電腦屏上,給出的結論輸入到電腦存成文件。兩種思維方式的區別是,對電腦不同的利用水平。
如果說近兩三年「人工智慧」取得了巨大突破,那更接近事實真相的描述是:熱衷於演算法設計與程序工程實現的開發者群體取得了巨大進展。他們搞出了一些先進技術,藉助電腦把觸角伸到非常多的領域裡去。以前這些領域是被人類傳統「專家」佔據的,現在演算法開發者們認為自己能用新的思維方法在這些領域搞出大的創新,在效率、可靠性、識別率等指標上超過傳統專家。
這些技術可以統稱為「機器學習」,是近年來發展最快的科技領域之一。雖然說是「機器」在學習,其實機器仍然和過去一樣,做的是數據存儲、數學運算,沒有本質區別。所有機器學習技術的共同特徵是,電腦存儲了一些「係數」,這些係數是「神經網路」、「分類器」等數學結構中可變的部分,開發者讓電腦程序執行或多或少的「樣本」進行「訓練」,得到正確或者錯誤的輸出,根據結果回頭去正向負向改變這些係數。近年來的新趨勢是:
1. 係數數量越來越多,多達上百M,比程序代碼行數還要多得多。組成的數學結構越來越複雜,如以前簡單的三層神經網路,發展成十幾層甚至上百層的多層「卷積神經網路」。各種新型的數據網路結構層出不窮,非常活躍。
2. 用於訓練的樣本數量,從過去的幾百、幾千,發展到幾十萬、上百萬個。訓練需要的時間越來越長,需要GPU、機器學習專用晶元等新式的硬體支持,過去的硬體跑不動訓練了。
3. 訓練樣本,過去是人工收集、人工標註正確輸出,現在發展到機器自我「強化學習」。如AlphaGo進行海量的自我對局,生成幾千萬個樣本,回頭用於神經網路訓練。也有些樣本是程序在互聯網上用「爬蟲」自動收集的。因此,機器學習有時需要海量的伺服器支持,可能需要十萬個以上,有實力的公司才做得了。
4. 研究者群體在機器訓練方法上取得了突破,對於很複雜的數學結構、海量的樣本,想出了「深度學習」這樣的辦法。在語音識別、圖像識別等多個領域,最終效果甚至可以超過人類的水平,在指標效果上比過去有了重大突破。程序識別率指標突破臨界點以後,就會對產業產生爆髮式衝擊。如語音識別幾十年來都在研發,準確率一直在提升,但都不溫不火。但這兩年來準確率足以實用了,一下就爆發了。
因此,目前人工智慧行業與社會其它行業的互動趨勢是,機器學習研究者群體會用以上這些技術,去各種有價值的行業里,用演算法與程序思路去解決專業問題,提供另一種智力勞動的方式。當他們在一個行業成功了,這個行業就面臨重大技術變革,舊的從業人員確實會受到衝擊。但是正如前面所述,這並不是機器對人的挑戰,而是演算法與程序思維的人群,對傳統思維人群的挑戰。
這種挑戰是真實正在發生的。上面描述的人工智慧技術仍然在高速發展,還沒有遇到之前幾次人工智慧熱潮遇到的瓶頸。人工智慧技術突破一定會在更多行業中發生。作為社會大眾,其實我們已經不知不覺已經用了很多人工智慧的成果,如手機語音輸入,停車場自動收費,高速公路卡口自動開閘通行,高效的快遞分發,可以說全是好事。
至於說舊的從業人員會受到什麼樣的影響,應該要具體行業具體分析。可以肯定一些行業的從業人數會大幅減少,如港口集裝箱理貨人員數量會大降,富士康生產線上的工人會減少,智能機器會增加。這些簡單勞動,並不需要特別的專業知識,普通人經培訓後都可以做。用機器代替人做簡單勞動,將人從枯燥繁重甚至危險的工作中解放出來,從生產力角度看應該對全社會有益,能夠創造更多社會福利。如果發生大規模的失業,這是社會生產關係的範疇,只要社會在福利分配上做好,解決問題沒有本質困難。歐洲一些國家這方面走在前面。往深里說,甚至可以設想「機器共產主義社會」,勞動全由機器干,人類就管幸福生活,當然還只是比較遙遠的幻想。
一些更複雜的智力勞動會受到什麼樣的影響還不好說。如醫療專家、保險專家、銷售專家會不會失業,只有等相關行業的人工智慧程序真的出來後才知道。媒體編輯記者們,會不會被機器寫手大量代替,也不好說。無論如何,如果行業傳統專家們能夠熟悉演算法與程序的思維,將機器的能力與自己的能力結合,就能更好地適應被機器改變的行業。
以上介紹了目前正在快速發展的人工智慧產業技術現狀,可以說還是人類自己思維方式的重大進展,機器仍然做過去一樣的事,沒有任何智能。有些研究者,把目前的機器智能稱為「弱人工智慧」,就是這個意思。那麼,真正的機器智能,或者說「強人工智慧」,會是如何的?我們可以作一些探討。
自主創新才是真正的機器智能
有人說「強人工智慧」就是機器有自己的思想了,甚至會像「天網」一樣反抗人類,很危險。也有些人受「技術奇點」思維的影響,認為人工智慧發展下去,就會出現比人類智力水平高一檔次的機器智能物種,而且發展是加速度的,奇點一到歷史就不屬於人類了,有些專家們認為就是三四十年事,聽上去很嚇人。
據筆者對人工智慧技術的了解,這些還是屬於科學幻想的範疇,沒有可行的技術路線。可控核聚變、量子計算機、強人工智慧,是目前意義最大的三個技術領域。但是都沒有頭緒,什麼時候能突破完全沒法估計,有時會說要50年,等50年過去還是要50年,其實就是說不知道要多久。
現在的人工智慧程序,全是人寫出來的。機器自我生成數據訓練神經網路數據也是人讓它做的,代碼不會變,程序輸入輸出的目的不會變。人類只是沒法理解幾百M的神經網路數據黑箱子,說不清楚為什麼就挺厲害了,但並不是不了解它。了解多的研究者會知道黑箱子有時會出一些離譜的錯誤,如將完全沒有意義的混亂圖片認成一隻貓。
而且現在人工智慧程序其實都是些「白痴天才」,就一個事特別厲害,其它什麼都不會。用專業術語,就是沒有「泛化」的能力。下棋厲害的程序不能用來開車,認圖片厲害的不能用來語音識別。開一個新任務,還是得人類開發人員絞盡腦汁建模編碼調試優化,雖然這個過程倒是有套路了,但那是人類的本事。人類的智能不會這樣,一個腦子,可以學會成千上萬種本事,而且不同的本事還能觸類旁通。
如果研究者們開發出了一種龐大的神經網路連接結構,然後用不同的數據集對它進行訓練,就可以完成不同的智力任務,那會是一個極大突破。這會使得人工智慧研發的任務大大簡化,甚至有點人腦的雛形了。這目前看有一點希望,如一個訓練好的神經網路,可以直接移到另一個任務里去當一個部件,當然難度還是極大的。如果這種訓練弄得很容易了,有可能在社會上造成很大影響。
現在人工智慧的開發難度不低,門檻較高,需要專業的演算法開發人員與程序員進行編碼,一般人做不了。如果搞出了有「泛化」能力的人工智慧學習框架,也許社會各界稍微學一下就能自己訓練出人工智慧了。這樣,人工智慧的發展就不再是極少數技術精英的事,全社會各領域會主動去引入人工智慧技術。這種情況下,正如百度首席科學家吳恩達說的,人工智慧會像「電」一樣,變成各行各業的新型工具。這無疑會極大地推動各行業的技術進步,人工智慧可能會是第四次工業革命,像蒸氣機、電力、計算機一樣改造各行各業。
但就算做到了這一步,仍然是人類在進行思維,機器還是沒有智能。如果再進一步,人類只管建神經網路,然後漫無目的地把各種數據扔給機器自己去「領悟」,然後機器輸出了一些出人預料的、有意義的智力成果,那就真有本質不同了。
比如在電腦里放一個程序連上多個攝像頭,把某戶的家庭生活全拍下來,演算法開發人員讓它自己觀察想辦法優化主人的家庭生活。然後這程序某天對男主人報告,我這已經準備好了一個功能,幫您每天到網上搜索好一個笑話讓您講給太太聽,根據太太的情緒準備不同的素材。過陣子又對主人報告,準備好了另一個功能,對小孩作出提醒,優化小孩的學習效率。這些功能是機器自己想出來的,不是人規划出來的。
再比如,電腦里一個AI程序吃下一個公司的所有營銷數據,開發者讓這個AI自主分析觀察這些數據。過陣子,AI建議說公司要如何改變經營策略,公司有哪些工作是做得不好需要改善,要開除哪些人,哪個部門要多招人。電腦具體會提出什麼建議,開發人員事先並不清楚。
如果這種機器程序真有了,那就特別厲害了。也許這個程序不知道自己在幹啥,仍然沒有自主意識,但和之前的人工智慧相比,它能自主地搞出了一些智能發現,不需要人去規劃引導。這時就可以說,人工智慧脫離了人的具體指導,有了「自主創新」的本事了。當然還需要人去劃一個大框架,人工智慧程序在裡面發揮一定的「主觀能動性」。成果可能是,機器自己到網上亂看小說後寫出了暢銷小說,機器自己看了很多數學定理的證明後證明了很難的數學定理,機器聽了很多樂曲之後寫出了好聽的樂曲。和以前的作詩機、機器證明、機器作曲不同,機器用什麼辦法去寫作、證明、譜曲,人沒有告訴它。這時機器再要聲稱自己是有智能的,就理直氣壯了。這類機器會脫離開發者,在那不斷地進行「自主創新」。人面對的競爭者就真的是這些機器了,而不是開發出機器的人,因為開發者也不知道機器會幹出什麼事。
當然這些功能現在還不知道怎麼做出來,但並不是完全不可想像。研發人員可以給機器設定更複雜、更自由的係數變動模式,數據輸入的樣式也更多種多樣,機器學習的目的更加泛化。其實人類自己具備的能力,也是經過不計其數的人自由嘗試之後,不斷積累而來的。
這個階段的人工智慧,應該還是在人類的控制之下。因為它們的工作範圍還是人設定的,控制起來不難。它們也沒有自主意識,只是在漫無目的地進行運算,有時會給出對人有意義的結果。但是這種人工智慧顯然會極大地改變人類社會,也許會讓人類科技突飛猛進,不僅是工業革命,還是科學技術的革命。比如在人工智慧幫助下,可控核聚變有了新的方案,實現了能源革命。
美劇《西部世界》劇照
再往下發展,要是人工智慧發展出自主意識,那意義就大得沒邊了。本文主要基於現階段的人工智慧基礎技術,進行技術性的討論。具有自主意識的人工智慧與人的互動,是很多科幻小說、影視劇、科普文章的關注焦點,如美劇《西部世界》。對此筆者並沒有特別的觀點,也是個看片欣賞的,只能說機器自主意識現在還是文藝與科幻意義上的,沒有太多現實意義。
總的來說,筆者對人工智慧的發展是非常樂觀的。即使人工智慧技術進展不大,用現有的技術也能改造一大批行業。如果人工智慧技術再有突破,將會極大促進人類社會的生產力發展。而人工智慧完全脫離人類發展進而威脅人類,又過於遙遠,這個問題可以用輕鬆的心態去面對。
作者簡介:筆名陳經,香港科技大學計算機科學碩士,科技與戰略風雲學會會員, 微博@風雲學會陳經。
【本文2017年2月4日發表於瞭望智庫旗下「智客」微信公眾號(別看AlphaGo這麼狂,它離真正的智能還差得遠陳經)。】
風雲之聲獲授權轉載
請關注風雲學會的微信公眾平台「風雲之聲」,微信號fyvoice
責任編輯:黃澹寧
----------------------------------------------------------------------------------
恭祝大家新春愉快,工作進步,學業增進。歡迎關注風雲之聲知乎專欄:
知乎專欄
一點資訊:
http://www.yidianzixun.com/home?page=channel&id=m107089
今日頭條:
http://toutiao.com/m6256575842
推薦閱讀:
※「加註」科研合作,出門問問究竟想做什麼?
※自動駕駛的中國「落地戰」,突破口將在封閉場景丨小飯桌特寫
※【腦洞故事集】二、EXE病毒
※Part of Machine
※人工智慧技術讓尼古拉斯·凱奇真的「變臉」了!