大腦的自由能假說-兼論認知科學與機器學習

如果大腦如何運作的機理可以和熱力學一樣系統完整完美解釋, 那這個理論將是物理學家的終究夢想。

而有一篇神文險些勝利。這套理論可以叫自由能大法,如果你通讀此文, 也會感覺到一種腦科學, 人工智慧, 物理學, 甚至經濟學都打通的感覺,然而, 估計99%的物理系讀者都很難讀通此文(The free-energy principle: a unified brain theory)

什麼是物理里的自由能法則? 一句話說就是: 任何處於平衡狀態的自組織系統均趨於自由能極小的狀態。 這話是什麼意思? 自由能又是什麼? 自由能和大腦有啥關係?

自由能是什麼?n自由能的物理公司E-TS極為簡潔,E是能量 ,S是熵。 統計物理說, 與外界具備能量交換的系統(一杯放在桌上的熱水,底下放著一塊冰糖)處於平衡狀態下,則自由能最小(水溫下降,冰糖擴散), 指的是一個能量儘可能小熵儘可能大的狀態。 當水溫下降到室溫, 冰糖均勻擴算, 此時水分子和外界環境的整體所能夠取得的微觀狀態數最多, 也就是最大概然狀態,或者說穩態。好比一個教室里沒有老師,學生就逐漸的變得亂遭遭的,這個亂遭遭的狀態就是穩態。 自由能最小是熱力學第二定律下系統與外界環境相互作用的法則。

生物系統呢?n生物系統和水這種系統恰好相反,因為它們是開放的非平衡耗散系統,它們所遵守的法則是趨於有序和結構確定的狀態, 相當於一個嚴厲的老師管制下的教室, 同學工作井井有條(這樣的狀態需要外界輸送能量,如老師的工資)。所以我們經常說生物遵守反方向的熱力學第二定律-即產生和維持秩序,而緊閉大多數自由狀態。 如果某個時刻你開始控制不住自己, 那也就是衰老的起點。

剛剛好,n生物系統也可以被一個形式類型自由能最小的定律結合。表現在認知系統,就是學習過程! 你讀過之後就會立刻發現它和機器學習的聯繫。

簡單的看,n你可以把你的腦子想成剛才說的那杯水,外部環境和這杯水具有一種能量交互關係,正好對應你的腦子通過眼睛和耳朵這樣的東西採集外部的信息(感知)。這杯水會越來越趨於室溫, 你的腦子像這杯水一樣與外界交換能量和信息, 只是, 這個過程中,你的腦子對外界的信息越來越豐富, 它不僅是被動的採納,還要主動的預測和做出行為。

那麼看看我們通常說的大腦對外界信息處理過程包含以下幾個方面,感知(sensation)決定計入哪些數據, cognition(認知)對這些數據進行處理如分類, action(行為)一個由cognition的分類導致的決策, motion(運動),一系列的行為組成motion。 n

我們來看看這個過程是怎麼發生的。 首先, 這一切行為的綜治是為了最大化生存可能性(maximize existence), 外部世界充滿危險, 如果把生物所有的行為可能性做成一個狀態空間, 那麼只有極少數是可以保證生存的, 生物越能夠綁定在這極少數狀態里, 生存機會就越大, 這也是生物需要抵抗熱力學第二定律的理由。 n那麼如何不跑偏呢?n

一方面我們有基因編碼(genetic encoding),使得我么的表現型(phenotype)只能在一個有限的範圍里(由一個條件概率函數P(pIg) 描述),這套編碼已經在我們的祖輩自然選擇里被遺傳下來,去掉了大部分不適宜生存的可能, 比如長出三頭六臂。

另一方面,n作為具有認知能力的動物,n能夠保證對生存最有利的狀態的辦法就是學習,整個對大腦外界信號的處理都可以通過"學習」來認識, 請看下圖(請始終想著機器學習)。

大腦的自由能最小定律說, 學習的狀態就是使得 1,通過不斷調整行為得到符合大腦預期的感知狀態(Accuracy) 2, 大腦內部的狀態能夠更加準確的匹配外部世界的變化 ,不至於出現沒有預期到的狀況(Divergence)。 兩部分何在一起使得上圖定義的大腦的自由能函數最小。這個原則的威力是巨大的, 它可以告訴你如此多你為什麼要這麼想, 這麼看,儘管你平時從未知覺。 比如為什麼你看到你想看的, 為什麼你想到的東西又總在隨時客觀情景調整。

註: 第一項D中p是已知生物的感知得到某種外部世界狀態的概率, q是已知大腦內部狀態生物猜測到某外部世界狀態的概率 , D是p和q兩個概率分布函數的距離, 指的是大腦猜測的真實之間的距離。 第二項是對數項內的p是已知外部世界的變化得到某種感知狀態的概率。

外界的信息是無窮多的,我們的腦子就那麼多, 選擇哪些信息錄入,就顯得特別重要。 感知的過程, 就是一個數據採樣的過程, 機器學習的同學都知道, 開始錄入什麼樣的特徵對機器學習是具有決定性的一步,而感知也一樣, 生物要做到的是要取樣哪些數據。 所以感知絕非被動的過程。

這裡的關鍵是要把感知,認知和行為放在一個循環里理解。這裡理解的框架就是貝葉斯決策。貝葉斯公式把事物之間的聯繫表現為一系列的條件概率關係, 並根據新的證據不停調整條件概率,最終我們要優化我們想得到的結果, 比如此處的生存機會, 就是通常生物系統優化的量, 為了優化生存機會,我們只有少數幾個想要達到的結果, 我們需要產生一個使得這一系列結果機會最大的決策機制(所謂我們不是為思考而思考,而是為生存而思考), 這一切決定了感知和認知的過程。

那麼我們是如何通過學習來找到這個機制的呢? n其實你會發現,這就是一個模型選擇過程(model selection)恰恰符合機器學習的本質。

所謂認知,即找到一個預測性模型使得感知得到的信號可以預測出未來外界物體的運動, 從而趨利避害。 所謂感知,就是尋找最能夠提供給這一模型預測效力的有用證據(feature engineering)。一句話說,世界很大, 我只要最和我的遊戲相關的。

那麼行為呢? 我們的行為最終還是要歸之於感官,所謂人生食色性也。行為如果帶來香甜的巧克力或可愛的美女,則得到嘉獎,這是符合你的理想的生存預期的。

一個非常有趣的例子說明認知模型:一個黑暗裡摸索的人, 他不停猜測前面是什麼, 它會主動伸手去摸索,證實他的想法,一般如果我們發現我們的證實與內心的想法不符,則不停探索,知道符合它的預期,這就是一個簡單的認知模型。

這裡面我們看到認知模型包含兩方面, 一個是感知和行為所獲取的外部世界的狀態, 一個是大腦內部認知過程的內部狀態(模型)。 這個內部模型不停預測每個一個感官背後的動因, 和所蘊含的未來變化, 而行為本身則趨向於那些有利生存的結果。學習的目的就是讓那麼內部狀態的模型更準確(預測精準),另一方面讓行為決策獲取更多對生存有利的證據。 如果模型的預測不正確, 則行為決策無法得到正確的結果。

這一原則所得到的啟示十分強大,可以直接打通認知科學和機器學習的諸多方面:

1, 貝葉斯大腦假設: 如之前提到的, 大腦是部貝葉斯機器。 貝葉斯推斷和決策的核心即由最新採納的證據更新先驗概率得到後驗概率。 認知科學的核心(Perception)就是這樣一個過程。

這裡再說兩句認知,n認知的過程用機器學習的語言說就是用大腦的內部變數來模擬外部世界, 並希望建立內部世界和外部的一個一一映射關係。 這裡我們說認知的模型是一個概率模型,並且可以被一系列條件概率所描述。如果用一個形象的比喻來說, 你可以把你的大腦看成一個可以自由打隔斷的巨大倉庫, 你要把外部世界不同種類的貨放進不同的隔斷,你的大腦內部運作要有一種對外界真實變化的推測演繹能力, 即隨時根據新的證據調整的能力, 你和外界世界的模型匹配的越好, 你的腦子就運轉越有效率。 認知是對外部世界運動的一種編碼, 你可以立刻聯想到機器學習里的表徵方法(representation), 如果你熟悉RNN或CNN的embeding過程, 就會有一種豁然開朗的感覺, 雖然一時並不知有鳥用。


推薦閱讀:

心靈哲學:你知道靈魂是什麼嗎?
趣談:中國人數學好的不完全解釋
心理學的七宗罪4:靠不住啊(Unreliability)
如何評價羅文益10月23日的知乎live——通識路徑的閱讀參考?
心理學的七宗罪2:數據貯藏(Data Hoarding)

TAG:机器学习 | 认知科学 |