人工智慧vs人類智能小傳——再議阿爾法狗

深度網路代表的這波人工智慧風潮代表的是一種局部的演進,還是未來的一扇大門打開?

AI離真正的智能很遙遠是因為它不能創造嗎? 是因為它只擅長形式邏輯? 是因為它沒有自我意識?

其實,我們連生物的智能都不了解。 現在,我們回顧一下神經科學和AI的歷史, 從腦和智能的演進來看這個所謂的人工智慧有多聰明。

要談這個問題,我們就需要從智能說起, 智能其實分為三個層次,對應丹內特對意識進化的三個分級: 達爾文式造物 ,斯金納式造物, 波普爾式造物 。

智能的第一個層次是進化(達爾文式),而不是自我意識這些高端裝逼的東西。智能的起點是學習,學習即對環境變化做出相應對策。整個生物進化過程,就是學習的過程。為什麼呢? 你一個小小的細菌, 也可以對環境做出趨利避害的反應, 並且通過基因突變的方法有點盲目的適應環境,這其實就是用遍曆法來選擇針環境變化的最佳生存策略,然後通過遺傳以及下一代繼續試錯,將某種策略強化。 阿法狗的策略網路也是類似的道理, 通過對可選策略集合的分析進行局部最優的調整。 細菌和十億年的 的惡略環境下棋, 把對哪些化學物質該如何轉化這個信息深深的埋藏在了它的DNA里, 因此才可以有如今如此從極地到大漠的如此偉大的適應性。 大自然的這種學習方式可以看做智能1.0版, 缺陷是速度慢和讀取數據量小 。我們人類模仿進化的過程創造了進化選擇演算法, 作為人工智慧一個非常基礎的部分。

下面我想說的是第二階段的智能, 斯金納(偉大的行為心理學家)式造物。

斯金納式造物說的是生物自己能夠自主的去學習而非被動的靠基因變異適應環境。 這項偉大的創舉背後就是大名鼎鼎的神經網路, 生物進化幾十億年的歷史都是這種被動的適應環境, 直到神經網路的出現一切才悄悄發生變化。

神經網路的作用簡單來看, 就是一個分類器, 它可以把外界刺激分成好的和壞的, 並且趨利避害。擁有這個分類器, 動物終於可以在自然環境面前主動做決策, 並且趨利避害。把獅子放在要躲避的那一堆, 異性放在要接近的那一堆對於動物的生存意義之重大不言而喻。 這個分類器最開始是儲存一些先天的條件反射, 比如嬰兒見到目前的乳頭就要吸。 而後來就出現了後天習得的條件反射, 比如著名的巴甫洛夫的狗,聽到鈴聲就會分泌口水。沒錯, 後天形成的條件反射-就是學習的2.0版。

然而生物神經網路是如何實現這一調整的,卻一直是個迷,直到1940年Hebb提出神經科學的牛頓定律-Hebbian learning rule, 人們開始了解神經網路是如何實現這一步驟。 Hebb說組成神經網路的神經元通過不停的調整之間的突觸連接來改變對外界刺激的反應,這個變化法則就是同時放電的神經元連接加強(細節來看還與放電的順序有關)。 這就使得被一起激活的神經元形成一個基團, 比如狗聽到鈴聲以後被餵食, 那鈴聲這個刺激之前狗可能沒有任何反應,而之後就被劃分到午餐那一類, 從而形成對鈴聲的條件反射。阿爾法狗深度學習的基本原件人工神經網路也是一個人為敲定的分類器, 用於做決策。

人工神經網路的訓練過程同樣借鑒了生物神經網路的學習過程, 根據反饋調整神經元之間連接的權重關係, 來實現對外界信號分類方法的改變, 因此調整決策(reinforcement learning 強化學習)。

分類問題可以由神經網路解決:

上圖的神經網路, 就是一個基本的卷積網路, 把輸入的值乘以一定權重在加在一起, 再通過一個非線性的階梯函數, 轉化為0(有害),1(有利)的輸出, 即決策過程。

學習, 數學上叫調參: 改變w的數值即可改變分類的方法(界限)。

神經網路的分類功能, 把輸入的信息(環境變化)分為有利和有害的進行決策, 環境的變化越複雜, 越體現神經網路可以任意的通過改變連接強度來調整決策「界面」 的優勢, 而不需要用進化的方法上下一輩來適應環境(學習的重要性)。 當然這個學習過程需要大量數據的訓練。

結論: 一個單層神經網路完全可以嫻熟的應用斯金納造物

從第二種智能方式我們依然可以看到, 生物智能的方式是如何啟發了人工智慧。

智能的最高級形式波普爾造物, 對外部世界進行表徵, 形成認知,信念和預期,則對應神經網路的更高級功能。

如果仔細思考, 我們會發現這些很多包含在阿法狗使用的深度網路里。 首先, 深度網路最擅長的是對事物進行抽象(深度學習), 在最靠近輸入的層次上, 每個細胞就如同數碼相機CCD上的像素,之後的每一層次都比上級網路的感受野要大, 而最終得到的效果是最深層的神經元直接處理和圖像的全貌相關的特徵,比如照片上的人是誰。如果換到其他地方,就是從抽象或全局特徵進行決策。

這個結構像極人類社會的結構, 越是高層, 越能把握和總控全局。深度網路上的「抽象概念」這個認知武器,使得阿爾法狗有對全盤棋的趨勢進行判斷的能力,可以迅速捨棄一些錯誤的方向,減少搜索的深度,即價值網路。 其實人腦所使用的演算法和阿爾法狗差距沒有那麼大, 記得前些年有一篇著名的science文章說人類發現在高級腦區表現抽象概念-如人名的細胞,這是符合這種深度網路逐層抽象的概念。高級腦區正是對應人腦深層網路的最底層。

阿爾法狗能夠戰勝代表棋牌巔峰智慧的圍棋冠軍這件事最大的意義,也在於深度網路賦予了AI自主判斷局勢和形成策略,而不是靠之前的僅靠人為給定的策略遍歷所有可能。或者說深度網路打開了波普爾造物的大門

當然,深度網路演算法只是提取了生物神經網路的一個主要特徵 , 而幾億年進化結晶的人腦, 由於計算機能夠提取並用於學習的數據量巨大, 使得它能夠在學習了人腦的一個雕蟲小技之後通過迭代學習迅速在某個特定任務上超越人類。

就上面這個簡單的歷史陳述我們發現,AI說到底是一種仿生,但是這種仿生無疑會改變我們生活的方方面面, 阿爾法狗的智慧是結合了古老的細菌智慧(策略網路)+高級哺乳動物的智慧(價值網路),可謂仿生物智慧傑作。

一些常見問題:

1. AI到取代人類大量勞動的時候了?

AI一定會逐步取代簡單的人類勞動, 但是也會增加新的勞動出來, 比如AI設計, AI糾錯 , 以及如何利用AI做出以往實踐不能的事, AI將使得人腦從簡單勞動中解放, 可以爆發中不可預計的新產業。

2, AI沒有意識, 無法預測,沒有創造力, AI幾乎永遠無法與人類智能望其相背。

人類容易犯的錯誤之一, 就是用一些自己也無法嚴格定義的概念去套用機器。 「 意識」 「 創造力」這些概念, 其實人類自身也不理解, 你站在人類的角度上, 去討論ai有無意識這個問題, 是自己陷入了一個思維的陷阱。 因為究其根本, 我們對自己有沒有意識這件事也沒有一個掌控的時候, 整個這樣的討論流於空泛。 而對於這些概念的進一步掌握, 取決於神經科學的進步。雖然我比較懷疑很快強人工智慧會出現, 但是即使出現, 它也不一定需要以我們人類能理解的方式產生意識, 達到目標。 說不定在另一個外星觀測者看來, 我們也是無意識的, 意識不過是這個被稱作「人」的東西所使用的多級神經網路里某個調節參數的輔助工具。

3, 覺得AI的運轉方式一定和人腦是天壤之別的

這也是犯了太驕傲的毛病。 因為你並不懂得人腦運算所採用的演算法。 人腦這個東西, 即使是情感這些我們覺得很柔軟的功能,背後也是以海量運算為背景的,而目前的科學論文證實的是, 在視皮層的運算, 很多與目前的深度網路運算是很接近的。 有的人說人是向前看的動物而機器只會向後看, 事實上呢, 人對未來的預測也來自於對過去數據的大量積累。

我們並無太多證據受AI是否和我們的大腦有著相類似的運轉方式, 但是有一點肯定的是, AI的發展源自我們對自身的模仿, 而對AI的探究反過來正在幫助我們理解我們自身 ,這也是生命最終的意義。

正如費曼所說, 只有你知道如何製造一個東西, 你才真正理解它。

本文首發於微信公眾號混沌巡洋艦(chaoscruiser)

歡迎關注混沌巡洋艦,追尋自然界複雜下的簡單,帶你學習各路跨界乾貨。

歡迎加小編鐵哥個人微信562763765

著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

推薦閱讀:

TensorFlow實現神經網路入門篇
Deep Residual Network 深度殘差網路
深度學習(Deep Learning)基礎概念1:神經網路基礎介紹及一層神經網路的python實現
SPPNet-引入空間金字塔池化改進RCNN
擔心的事情還是發生了,AI水軍你根本看不出來

TAG:人工智能 | 深度学习DeepLearning | 神经网络 |