也許我們從未活在當下,而是永遠期待即將抵達的未來

也許我們從未活在當下,而是永遠期待即將抵達的未來

來自專欄神經現實77 人贊了文章

一個充滿爭議的理論認為,感知、運動控制、記憶等大腦功能,都是大腦通過模擬預期未來,並與當下的實際體驗進行比較,才得以實現的。

6月,人工智慧領域的巨擘DeepMind公司發布了一個新程序。無需人類介入,該軟體能自動從虛擬三維空間單個視角的照片推斷出整個空間的布局,並給出在其他全新視角下可能看到的畫面。只要給它幾張三維迷宮的圖片,這個叫做生成查詢網路(GQN)的程序就可以模擬出整個迷宮的布局。

該程序不僅有顯而易見的技術應用前景,也讓神經科學家頗感興趣。因為用來訓練該程序完成任務的演算法利用了「現實和預測之間的偏差」,項目領導者之一阿里·伊斯拉米(Ali Eslami)說。

他在DeepMind的同事及論文共同作者達尼洛·雷森德(Danilo Rezende)說:「演算法能夠調整它(預測性)模型中的參數,使得以後再碰到相同情況時,少一些『驚訝』。」

給定一張繪有彩色立方塊的二維圖像(左圖),人工智慧程序「生成查詢網路」可以推斷出立方塊的三維構型(右圖)。該人工智慧背後的基本想法與神經科學中的「預測性編碼」理論相同。圖片來源:Deepmind

神經科學家想到的,是預測性編碼理論(實際上,這正是啟發GQN團隊的靈感之一)。該理論認為,在認知過程的每一個層級,大腦都會建立模型,或者說生成信念,去預測它從低層級腦區會接收什麼樣的信號,這些信念被翻譯為一種在特定情況下會有哪些感覺體驗的預期,這樣就可以解釋外界發生了什麼,並理解體驗的意義。這些預測隨後被向下傳輸,反饋到低層級的感覺腦區。大腦會將反饋來的預測和實際的感覺輸入進行比較,判斷導致差別(或者說預測誤差)的可能原因,通過內在的模型「抹平」部分差別;無法被解釋並消除的預測誤差,則作為前饋(feedforward,與反饋正相反)信號被傳輸到高層級的腦區,在那裡它們被視作有價值的信息,需要加以注意並適當處理。

「這時,需要的就是調整內在模型,即大腦的動態,來抑制預測誤差。」卡爾·弗里斯頓(Karl Friston)說,他是倫敦大學學院的著名神經科學家,也是提出預測性編碼假說的先驅之一。

心靈時間的數學原理?

mp.weixin.qq.com

過去十年間,認知科學家、哲學家和心理學家,將預測性編碼視為一個重要理論,尤其是作為感知運作機制的有力解釋。更有人充滿野心地認為,它是可以解釋整個大腦機制的大一統理論。然而,很長時間以來,我們都沒有足夠的實驗工具,來直接測試該假說描述的具體機制。隨著技術發展,更顯著的新證據在近兩年開始湧現。同時,早期一些里程碑式的證據的可重複性受到了質疑。

卡爾·弗里斯頓(Karl Friston)

咖啡、奶油和狗

「我的咖啡加了奶油和__。」在這句話的空格里,似乎只有填進「糖」是最自然的。加州大學聖迭戈分校(University of California, San Diego)的認知科學家瑪爾塔·庫陶什(Marta Kutas)和史蒂文·希利亞德(Stenven Hillyard)在20世紀80年代做了一系列實驗,將上面這句話逐詞呈現給參與者,同時記錄他們的大腦活動。然而最結尾處不是「糖」,隨著最後一個詞顯示出來,人們看到的是「我的咖啡加了奶油和狗。」

研究者觀察到,當實驗被試看到出人意料的單詞「狗」時,他們的大腦反應更大,而且顯示出了一種特殊的腦電活動模式,他們稱之為「N400效應」,即該單詞出現約400毫秒後腦電波達到峰值。問題是,大腦是因為該單詞不符合句子的上下文語義而產生N400效應,還是因為它違反了大腦的預期?

2005年,庫陶什和她的團隊進行了另一項研究,實驗結果支持了「違反大腦預期」這一解釋。在該研究中,逐詞呈現的句子是:「今日微風習習,因此男孩去戶外放(fly)__」。因為「風箏」(a kite)是最有可能的結尾,因此被試會預期下一個看到詞應該是冠詞「a」。而當被試看到的是「an」而非「a」時——這就代表最後一個單詞是母音開頭,比如「飛機」(an airplane)——他們的大腦出現了N400效應。這時,該效應顯然和冠詞的語義無關(冠詞沒有語義),也和處理視覺刺激本身的難度無關,而是和冠詞所提供的對下個單詞的預期有關。

2005年的研究似乎非常符合預測性編碼的理論框架,但是去年4月,在《eLife》上發表的一篇論文稱,數個實驗室都無法重現實驗的結果。目前,其他的研究者也紛紛回應,其中一些聲稱,在複製實驗中,實驗方法存在細微差別,但對它們分析結果依然更支持預測性編碼解讀。

這些來回往複的爭辯,很大程度上反映了圍繞預測性編碼本身的爭論。類似庫陶什做的實驗可以有多種解讀:除了預測性編碼理論,還有很多模型可以解釋它們的實驗現象。這些實驗都不能給出預測性編碼理論的決定性證據,因為它們尚未挖掘到深層機制。儘管預測性編碼理論已經對「大腦持續做出推斷並與實際情況比較」的想法做了深入闡釋,但是理論的支持者依舊在苦苦尋找證據,以證明他們講述的故事是「唯一正確版本」,並可以擴展到所有類型的認知。

貝葉斯大腦和高效計算

預測性編碼的基本觀點——大腦持續地對當下體驗做出預測並評估預測——並非一直都被當作理所當然。20世紀的主流神經科學將大腦描述為一個特徵檢測器:感知、處理、然後行動。神經元的活動代表物理世界中刺激的在場或缺乏。比如說,視覺皮層的一些神經元對視野中的物體邊緣反應,另一些的發放則反映了物體的方向、顏色和灰度。

但是,事實證明這個流程並非我們想像中那樣直接。進一步實驗發現,當你的目光隨著一根長長的直線延伸到遠處時,雖然視野中的直線還在,檢測直線的神經元會停止發放,就好像這條直線消失了一樣。而此時,神秘的「自上而下」反饋連接中,卻好像有許多信息通過。

這就輪到「貝葉斯大腦」登上舞台了。這個根源可以追溯到19世紀60年代的普適框架徹底顛覆了傳統理論。該理論認為,大腦基於其內部的模型對外部世界做概率推斷,換句話說,它在儘可能地猜測它應該對感知到的東西作何理解;這和貝葉斯統計原理是一致的,即用過去的經驗和當前的體驗,判斷某個事件發生的概率。大腦並不只是消極地等待感覺輸入來驅動認知,而是持續主動地建立「世界如何運行」的假說,並用這些假說來解釋感覺體驗、補充缺失的部分。這就是為什麼,有些專家認為感知是「受控的幻覺」。

按照同樣的思路,貝葉斯大腦模型也能解釋視錯覺如何產生。比如,屏幕上交替閃動的兩個亮點看上去像是一個點在來回移動,於是我們的大腦就無意識地將它們看作是同一個亮點。對物體移動的理解是高層級的,但是它卻能從根本上影響我們低層級的感知。大腦就是這樣填補信息空洞——在這個例子中,缺失的是物體的運動——以繪製出並不完全準確的世界圖景的。

在這個為大眾熟知的視錯覺圖片中,棋盤A格的顏色看上去明顯比B格深一些;而實際上,它們的灰度是一樣的。大腦利用周圍格子的顏色和圓柱體陰影的位置對棋盤的顏色做出推斷。在這個例子中,這種推斷產生了「A和B灰度不一樣」的感知,儘管物理上它們的灰度是一致的。像右圖那樣連接起兩個格子,並遮擋掉圓柱體,你能看得更清楚。圖片來源:Adrian Pingstone,修改自Edward H. Adelson

儘管科學家們已經明確了生成模型以及預期在大腦功能中的重要性,卻依然無法確切指出它們到底是如何通過神經迴路實現的。「相對來說,貝葉斯大腦版本的故事對於其底層的機制抱著不可知論的態度。」愛丁堡大學的心靈哲學教授馬克·施普雷瓦克(Mark Sprevak)說。

說回預測性編碼理論。它為大腦如何做貝葉斯推斷提供了具體的公式。「預測性編碼」一詞原本指通信工程中一種讓遠程通信更高效的技術。因為視頻文件幀與幀之間通常包含許多冗餘,壓縮數據時編碼每一幀的每一個像素很沒效率,更有效的方法是相鄰幀之間的差異進行編碼,再反向操作來解碼整段視頻。

1982年,科學家發現在神經科學中也可以巧妙運用這個想法,因為它能解釋視網膜的神經元如何編碼在視神經上傳輸的視覺刺激。人們也堅信它是大腦獎賞系統的運作原理:多巴胺神經元編碼的是預期獎賞和實際獎賞間的差異強度。研究者們認為,這些預測誤差幫助動物更新未來的預期,並驅動它們的決策。

雖然那麼多例子擺在這兒,過去的科學家們大多還是認為,預測性編碼只是專用於幾個特定大腦網路的原理。現在,運用功能核磁共振成像(fMRI)等方法的實驗已經開始改變這個觀點了。

一個統一的架構

預測性編碼假說如此具有說服力,部分原因來自其強大的解釋力。「令我信服的一點在於,許多東西都可以在這個故事中得以闡明。」安迪·克拉克(Andy Clark)說。他是愛丁堡大學的邏輯學和形而上學教授,也是預測性編碼理論專家。

首先,它將感知和運動控制統一納入了同一個計算過程。它們本質上是一枚硬幣的兩面:儘管使用的是兩種不同的方法,但大腦都在盡量消除預測誤差。在感知中,大腦是在調整內部的模型;而在運動控制中,調整的是實際環境——想像一下,如果你想要舉手,而手還沒舉起來,這個差異就會產生巨大的預測誤差,這個誤差只需你移動手臂就能消除。

Lucy Reading-Ikkanda/Quanta Magazine, 翻譯:顧金濤

感知和運動控制領域的一些實驗也為預測性編碼提供了最強有力的證據。例如,6月發表在《神經科學雜誌》(Journal of Neuroscience)的一篇論文中,實驗者要求被試看著屏幕,他們看到了屏幕上的單詞「kick」,隨後他們又聽到了一段音頻。音頻原本錄的是「pick」,但是經過了音頻處理,像是壓著聲音說的,這讓大多數被試都彙報說他們聽到的是「kick」。而fMRI掃描顯示,大腦響應最劇烈的是開頭的音「p」或「k」。這說明大腦在表徵預測誤差,因為如果大腦表徵的僅僅是實際的感官體驗,那麼響應最劇烈的應該是在屏幕上和音頻中都出現的「ick」,而非與預測誤差相關聯的「p」或「k」。

還有一些學者努力將預測性編碼理論擴展到感知和運動以外的領域,試圖將其定性為大腦中一切活動的「通貨」。「這就像是積木,能構建出不同大腦功能結構的積木,」克拉克說。不同的腦區之間交易的就是不同種類的預測。

弗里斯頓等人聲稱,這也適用於更高級的認知過程,包括注意力和決策。最近對前額葉腦區進行的計算神經科學研究,就提示了在工作記憶和目標導向的行為方面,預測性編碼也有參與。一些研究者論證道,情緒過程也可以用預測性編碼的方式來描述:情緒可能是大腦為了減小對身體狀態(比如體溫、心率、血壓)的預測誤差而表徵出的狀態,當大腦認識到自己激動、焦慮和不安時,它知道的是自己的這些身體指標飆升了。或許,這也是「自我」這個概念湧現的起點。

研究者發現當工作記憶過載時,大腦有三個腦區會失去原本的協調同步。該發現亦為預測性編碼理論提供了新支持。

我們短期只能記4、5個事物?是什麼限制了工作記憶的容量??

mp.weixin.qq.com

這一系列的研究大多數著眼於藉助預測性編碼理論,解釋神經精神病和神經發育紊亂的原理。弗里斯頓說:「如果大腦是一台做統計推斷的機器,那當它出錯時,它會犯統計學家常犯的錯。」也就是說,它會因為高估或忽視預測及預測誤差而做出錯誤推斷。

例如,自閉症的某些特徵,可能是由於大腦無法忽略最低處理層次的感覺預測誤差而產生的。這可能導致對感覺的過度關注,對重複和可預測性的渴求,對某些錯覺的高度敏感以及其他反應。精神分裂症等與幻覺相關的病症則可能與之相反:對正在發生的事情,大腦可能會過度依賴自己的預測,而不夠重視與這些預測相矛盾的感官信息。(不過專家們也不忘提醒,自閉症和精神分裂症的成因是複雜的,不能簡化為單一的解釋或機制。)

自閉症的根源在感官系統嗎??

mp.weixin.qq.com

耶魯大學醫學院的臨床神經科學家菲利普·科萊特(Philip Corlett)說:「它給我們最深刻的啟示是,我們的心智功能竟然如此易受影響。」 科萊特的實驗室進行過一些實驗,他們能在健康的被試腦中建立新的「信念」,讓他們產生正在體驗曾經接受過的刺激的幻覺。(在其中一個實驗中,科學家將一個圖案作為條件刺激和一個音調聯繫一起,當被試看到圖案時,即使沒有聲音,他們也以為自己聽到了那個音調。)研究者正試圖弄明白這些信念是如何被轉化為感知的。通過這些研究,「我們有證據表明感受和認知並沒有那麼涇渭分明。」科萊特說,「新的信念可以被植入,並影響你的感知。」

然而,證據還不足以確證結論——直到現在。

聚焦一下,仔細看看

「我們的實驗工作經常表明,實驗結果與預測性處理的假說兼容,但這並不意味著預測性編碼是最佳解釋。」施普雷瓦克說。預測性編碼理論在認知科學領域中被廣泛接受,但「在系統神經科學領域,它仍然處於弱勢,」 瑞士弗里德里希·邁瑟生物醫學研究所的神經科學家格奧爾格·凱勒(Georg Keller)說。他的實驗室正試圖用更確鑿的證據改變這一局面。

瑞士弗里德里希·邁瑟生物醫學研究所的神經科學家格奧爾格·凱勒。他一直致力於找到預測性編碼假說的機制性證據。圖片來源:Roland T?nnler

在去年發表於《神經元》(Neuron)的一項研究中,凱勒和他的同事觀察到小鼠視覺系統中出現了一種神經元,它們的預測能力可以隨著時間的推移變得更強。該發現源於一場意外:當他們開始在視頻遊戲中訓練小鼠時,發現虛擬世界的方向弄顛倒了。通常,只要小鼠向左轉,它們就會看到視野向右移動,反之亦然。但有人不小心左右翻轉了研究人員在研究中使用的虛擬世界,因此老鼠一旦左轉,視野也會向左移動。研究人員意識到這個失誤有意想不到的價值。他們監測小鼠腦中表徵這種視野流動的信號,發現隨著小鼠逐漸熟悉倒置的環境,該信號也緩慢地變化著。凱勒說:「這些信號看起來像是對視野向左流動的預測。」

如果該信號表徵的只是小鼠的視覺感官體驗,那麼小鼠進入虛擬世界時它們就會立即翻轉。如果它們是運動信號,根本就不會翻轉。事實是,「它關乎識別預測,」凱勒說,「給定運動方向下,對視野流動的預測。」

「這項工作提供了一種前所未有的證據。」克拉克說,「這項證據具體到了非常局部的每個細胞、逐個層級,於是我們可以清晰地看到,預測性編碼是最佳適配模型。」

巧合的是,幾乎同時,有人在獼猴大腦的面部識別腦區發現了類似的現象。以往的研究已經顯示,該腦區神經網路的較低層級上,神經元對以方向為基礎的面部信息編碼,比如說,有些神經元專門在看到側臉時發放。而在較高的層級,神經元以更為抽象的方式表徵面部信息,它們在乎的是臉的「身份」,而非位置。

在這個獼猴研究中,研究者先訓練猴子,讓它們看兩張臉,先出現的一張臉總是透露一些有關第二張臉的信息,讓獼猴可以對第二張臉進行一定預測。隨後,實驗者用特定的方式干擾它們的預期,比如用不同角度呈現第二張臉,或者兩張臉沒有絲毫聯繫。結果,在面部處理網路的低級神經元發現了與面部朝向無關的預測誤差——獼猴預測「身份」出了差錯。這些錯誤源於系統較高階層,也就是說,低階神經在比較感官輸入與高階傳輸下來的預測時,產生了錯誤。

「在那個系統中發現了預測誤差,並找到了預測的具體內容,讓我很激動。」該論文的第一作者,德國哥廷根歐洲神經科學研究所的神經科學家卡斯帕·施維茲克(Caspar Schwiedrzik)說。

馬克斯·普朗克經驗美學研究所的研究員露西亞·梅羅妮(Lucia Melloni)則稱,她的小組在人類實驗搜集到的一些神經數據也可以用預測誤差解釋。

尋找超級預測機器的競賽

支持大腦採用預測性編碼的證據似乎更強大了,但不是所有人都被說服了。一些科學家承認這個理論可以解釋認知的某些方面,但並不認同它可以解釋一切。還有些人絲毫沒有被預測性編碼理論打動。紐約大學心理學教授大衛·海格(David Heeger)提出,關鍵在於區分「預測編碼」(重點是高效地傳輸信息)以及「預測處理」(他將其定義為做出預測的歷時性過程)這兩個概念。

他說:「過往的文獻中存在很多混淆,因為那些研究者以為只要不加區分地一鍋亂燉就可以了。」他說, 「這種做法有時候會導致錯誤,甚至可能把研究的大方向都帶偏了。」他舉例說明道,在某些情況下,其他類型的貝葉斯模型可能會提供更準確的腦功能描述

該領域的許多專家普遍認同的是,這項研究在機器學習領域的應用潛力不可估量。目前,絕大多數人工智慧研究都不涉及預測編碼,而是關注其他類型的演算法。

但弗里斯頓認為,在深度學習環境中建立預測編碼架構,可以使機器更接近智能。

DeepMind的GQN就發揮了這一潛能。去年,蘇塞克斯大學的研究人員甚至使用包括預測編碼功能的虛擬現實和人工智慧技術,創建了他們所謂的「幻覺機」,這種工具能夠模擬通常由迷幻藥物引起的幻覺狀態。

通過比較預測編碼模型與其他技術的表現,機器學習領域的進展還可以為我們提供關於大腦的新洞見。至少,將預測編碼引入人工系統可以顯著提高這些機器的智能水平。

但在此之前,還有很多工作要做。科學家需要將凱勒、施維茲克等人正在進行的研究繼續推進,以回答大腦在哪些地方進行內部表徵等問題。此外,類似的實驗是否能夠發現支持預測性編碼參與更高級的認知過程的證據,目前也懸而未決。

格拉斯哥大學的神經生理學家拉爾斯·木克里(Lars Muckli)指出,預測性編碼「對於神經科學來說,就像演化論對於生物學一樣重要」。但就目前而言,施普雷瓦克表示,「還不到判決的時候。」

編譯:顧金濤校對:有耳編輯:EONhttps://www.quantamagazine.org/to-make-sense-of-the-present-brains-may-predict-the-future-20180710/

推薦閱讀:

[原創]我對黃.喉飼養的認知!!!2012
部編版:九上歷史《第五單元 步入近代》基礎認知
辯證研究癌症(文/董草原)|癌症認知[頁2]
認知抗戰,你需要辨明的6個疑問
居|「紙上財富」終覺淺,「認知高度」才是錢!

TAG:神經科學 | 認知 | 人工智慧 |