大腦是如何工作的?兼談如何做出類人智能。
記得讀書的時候,我的老師曾經提到過當年他為什麼選擇計算機視覺和人工智慧這個方向。 他說,他曾經參加過人工智慧之父明斯基的講座。 老先生上來就問了一個問題: How human brain works? 做AI的人, 其實終極目標一直是如何做出像人一樣聰明的機器,這是一個歷史使命, 要代代穿傳。 創始人時代做不出, 就傳給我的老師那一代, 之後再傳給我們。 我寫這篇文章的目的是想說, 也許或許我們不用再往下傳了, 我們這一代就能解掉這個問題。 以下是詳解。
這篇文章要不要寫, 我其實猶豫了很長時間, 腦子裡有很多想法, 模模糊糊有些答案,但是並不確切。 寫文章應當能經得起歷史考驗。 萬一錯了, 被打臉會很丟人。想來想去還是把不成熟的想法寫下來, 讀者君們一起思想碰撞, 會進步的更快, 想的更明白。
先說為什麼我覺得我們這一代能解決掉AI的問題,並不是我們比前輩們聰明, 歸根結底是計算能力,我們趕上了好時候。 大腦的計算能力是多少, 有各種估測數字。 什麼時候計算機的計算能力超過大腦, 也有各種估測。 其實這些數字都是胡扯, 你連大腦是怎麼計算的都還沒搞清楚的, 怎麼評估計算能力? 那種算算神經細胞個數,然後把神經細胞當作一個計算單元來統計的都是偽科學。但是為什麼我還是敢說我們這一代能遇上計算機計算能力超過大腦? 因為有摩爾定律, 就算估計不準,差了2個數量級, 也不過是十年功夫的事情。 基本上, 我的個人預測(胡猜),與人體同等重量的計算機計算能力超過人腦, 大約在2018-2019年。 這裡耍了個流氓, 沒有拿大腦的重量和計算機比, 大腦和人體的重量差了幾十倍, 對摩爾率來不過不到十年功夫。
計算能力是物質基礎, 硬約束, 沒有計算能力都是空想。 有了計算能力, 可以談演算法了, 也就是軟體。 大腦是怎麼工作的? 這裡面關鍵是工作的原理, 就像造飛機一樣, 研究了鳥以後, 科學家發現了伯努利原理, 造出了跟鳥的飛行方式不一樣的飛機。 AI的伯努利原理是什麼?
要想從功能上模仿大腦,迴避不開的問題是如何理解人類智能。 大腦的功能又多又複雜, 一眼望不到邊, 從何入手。 怎麼建立理論框架。 解題的思路在心理學, 心理學一直是研究人的。 心理學三大門派, 精神分析,行為主義, 人本主義都對人是什麼有自己的理解和研究方法。 自心理學之父馮特之後已經心理學已經研究人有快兩百多年了。其中以佛洛依德的提出的, 自我, 本我, 超我的模型最流行。 自我是動物性, 是生存本能, 是條件反射層面的東西。 本我是邏輯, 是理性判斷和分析, 超我是社會性, 是道德和思想。 這個思路, 正可以用來指導AI, 目前AI做到的東西, 大致也可以這樣分。 以下分開來說:
自我:語音,視覺都是自我層面的東西,對應於潛意識。 人類生存的基本技能, 我們還沒學會,但是可以 一個一個技能做, 慢慢來。深度神經網路發明之後,大大提高了大家做出這個層面東西的信心。 究其原因, 自我是對外部世界的基本理解和直接反饋, 解決的問題是如何從外部世界抽出概念這個關鍵的東西。 並做出相應的直接反饋,那麼我們要學習一個從外部表象, 比如語音, 圖像, 到內部概念的映射關係。 深度神經網路學這個映射大大的有效。 為什麼會這樣?
MIT的幾個物理學家最近有個理論給出了解釋。 他們說自然世界是建立在簡單的物理規律之上的(這些規律甚至大部分都是線性的)。不同的線性規律相互作用,產生了非線性,比如雙線性插值就是個簡單的例子。 有了非線性, 加上耗散結構自組織,最後就能形成了五彩繽紛的現實世界。所以歸根接地,世界就是一個大的分層網路產生的, 用分層網路來理解,做這個逆向過程,當然有效。 這樣同樣可以解釋為什麼大腦也這麼厲害, 大腦的分層神經元結構不也是干這個的?
本我: 有了映射關係, 我們可以從外部世界走到內心世界了, 但是自我的內心世界很簡單, 就是一些狀態,和對應的簡單邏輯, 比如分了多少類, 每一類該怎麼做。 AI一開始做的玩具世界,就是搞搞類似的邏輯, 所以用LISP語音描述這個就可以。 當年計算能力不夠, 玩不了外部世界到內部世界的映射, 前輩們只好玩玩具模型, 積木世界,也真是不容易。 也愈加佩服他們的聰明才智。
但是對應人的本我, 這些簡單的狀態和邏輯是遠遠不夠的, 這裡面有幾個關鍵的東西要弄明白, 什麼是知識? 什麼是通用知識? 什麼是記憶?最最重要的是,什麼是自我意識?
先說知識, 搞知識表示的人研究這個很久很久了, 語義網路, 概念層次網路, 還有個語義互聯網的RDF標準, 在他們看來,知識是一種概念直接的聯繫, 語義聯繫,確定性關係。 比如RDF標準,核心是一個三元組, 從一個概念,到另外一個概念,加上中間的鏈接關係, 就是知識。 RDF折騰了十幾年了, 仍然只有有限的應用。 為什麼不成功?各種解釋原因都有, 在我看來, 是走錯了路。 知識是確定性的關係嗎?大錯特錯, 知識從來就是不確定的, 動態變化的, 所以要表示知識,不能用確定性網路, 要用概率網路, 也就是貝葉斯網路。 這裡就不展開了。
有了知識,就可以談談通用知識。 所謂通用智能, 大家說計算機笨,AI笨,一般指責最多的就是這個。 計算機就是工具嘛,智能幹一些特定的事情,而且還做不好。 這種指責其實相當沒有道理, 剛開始學說話的小孩,學一個詞都不容易, 你問他為什麼不會作詩? 從知識到通用知識,是一個慢慢積累的過程, 這裡面有沒有過不去的門檻,量變引起質變。 僅此而已。
再說什麼是記憶? 其實人的記憶很複雜,有短期記憶, 有長期記憶, 有短期記憶到長期記憶的轉化過程, 人要睡覺, 除了讓身體各個器官休息以外,最重要的就是要干這個: 把一天接觸到的東西整理下來,變成長期記憶。 這個過程中沒有自我意識的干擾。 有的時候, 轉換出了點小問題, 就會做夢, 展開說可以是另外一篇文章。 這裡點到為止。 那麼記憶怎麼來理解,關鍵在動態, 在時間。 與記憶相關的都是時間,我們記住了新東西,慢慢的就忘了舊的。 要模擬這個,知識表示的貝葉斯網路每個狀態都得有動態屬性, 動態貝葉斯網路。哈哈, 我的博士論文就是寫這個的,瞎貓碰上死耗子,小得意一下。
最後要說自我裡面最關鍵的東西, 自我意識。這裡就不談概念了, 就說說心理學認為自我意識是怎麼來的? 一言以蔽之,學出來的!自我意識是從孩童開始逐漸發展起來的概念, 小孩子剛生下來是分不清楚內外部世界的, 慢慢的才知道」我「和其他東西是不一樣的。 既然大腦可以學, AI也可以學, 具體怎麼學, 因為設計到高層次的東西, 在我們還沒解決知識和記憶之前, 提這個有點早, 但基本上可以推測這個跟增強學習相關。
超我:有了自我和本我,其實大部分人的智能就有了,尤其是有了自我意識的東西, 必須承認它已經是一個「類人」了。超我這種文化和道德層面的東西, 在於AI個體之間如何連接,如何建立關係。 我們做出了一個AI, 兩個AI, 幾百上千個有自我意識的AI之後,他們之間如何組織成社會。 Startrek這個片里的想像是borg人, 所有的AI個體公用一個大腦。 是不是這樣, 值得商榷。 這個很重要, 人類簡史里說, 智人之所以打遍天下無敵手,就是有了精神世界,創造了共同想像物,可以大規模群體分工,一致行動,直至建立龐大複雜的社會組織。 AI會怎麼樣,AI如何定位,AI和人的關係如何,這個交給未來學家,哲學家,社會學家。 涉及價值觀,每個人都可以有不同的想像。
文章到此就可以收尾了。 有兩個小問題再補充下, 一個是創造力,一個是自由意志。這也是討論智能時候口水最多的兩個問題。 創造力從哪裡來,自由意志是什麼? 很多人說這個歸結為量子效應,這種說法很高大上。 我的個人觀點,沒那麼深,大腦利用的全部科學,就在十九世紀的物理學裡, 用不到二十世紀的物理學。 有熱雜訊就夠了。
推薦閱讀: