人工智慧助力神經科學：DeepMind 復現大腦空間導航方式！

05-20

來自專欄人工智慧學習筆記

導語
5月9日，DeepMind 團隊與 UCL 在 Nature 上發表重磅研究成果：人工智慧演化出和動物大腦類似的空間導航能力，引起人工智慧和神經科學領域的熱議。本文是 DeepMind 官網對這項工作的介紹。

1.網格細胞——動物大腦里的 GPS

大多數動物，包括人類，都能靈活地在他們所生活的世界中辨別方向。這樣就可以探索新地方，迅速回到記憶中的地點，同時還能「抄近路」。事實上，這些能力對我們而言是非常簡單和自然的，以至於我們不能馬上看出這潛在的過程到底有多複雜。相比而言，人工智慧在很多方面都已經遠遠超過了人類，但是在空間導航能力方面，還差的很遠。

2005年，一個驚人的發現揭示了神經系統空間導航能力的一個關鍵機制：當動物探索環境的時候，神經元會以六邊形網格的模式激活。類似於地圖上的網格線，這樣的網格對於導航能力是有促進作用的。

動物腦中激活的網格細胞，呈六邊形「蜂窩狀排布」

這些被稱為網格細胞(grid cell)的神經元除了給動物裝備了一個內部的坐標系外，最近也被作為一種假說來支持基於矢量的導航系統(vector-based navigation)。意思就是說，這使得大腦可以像烏鴉飛行那樣(利用歐幾里得距離)計算目的地的距離和方向，就算沒有遵循準確的路線，也可以在不同地方之間旅行。

首次發現網格細胞的研究小組，因為揭示出空間認知表徵可能的工作方式，於2014年共同獲得諾貝爾生理學或醫學獎。但是經過了十多年的理論研究，我們仍然不清楚網格細胞的計算功能，以及網格細胞是否支持基於矢量的導航。

當 Agent 穿過一些稱之為激活區域(firing fields)的地方時，網格細胞的激活模式。

這個顏色編碼的圖，顯示了生理上的網格細胞的激活強度分布。顏色變化表示強度從最弱的藍色到最強的橙色。

在解剖學上，生物上的網格細胞被分割成不同尺度的神經單元（灰色的橢圓）。每個規模的神經元在圖上呈激活狀態即橙色。通過解讀網格細胞活動的模式，即「網格編碼」，動物就可以在環境中進行定位。

網格細胞激活區域通過三角形連邊，形成了網格遵循的六邊形規則。

2.人工智慧自發演化出

與動物網格細胞類似的網路結構

DeepMind在最近在Nature上發布的論文"Vector-based navigation using grid-like representations in artificial agents"上，研究人員開發了一個智能主體（Artificial Agent）來驗證網格細胞是否支持了「基於矢量的導航系統」的理論。

研究人員首先訓練了一個RNN網路，這個網路主要利用了一個運動相關的速度信號，來在虛擬環境中對自己所處的位置進行定位。這個能力主要被人類用於在不熟悉或者很難找到地標的環境中（比如黑暗環境）進行定位。

研究人員發現類似動物的六邊形網格，很自然地就出現在了神經網路中。而且跟在人類的神經活動中觀測到的模式非常的相似。也支持了網格細胞提供了一種對空間的高效編碼的觀點。

人工智慧生成了類似網格的表示（上圖），這跟哺乳動物的網格細胞（下圖）非常相似。

3.構造智能Agent

測試網格結構的導航能力

進一步了解智能主體 Agent，請移步閱讀集智俱樂部推文《多主體智能與人工社會》

接下來研究人員構造智能主體來實驗，為了驗證「網格細胞是否支持基於矢量的導航系統」。通過將初始的網格網路和一個更大的網路結構相結合，形成了一個可以通過深度強化學習來訓練的智能主體（Artificial Agent），以便在 VR 遊戲虛擬空間環境中測試其導航能力。

這個 Agent 表現出了超人的能力，甚至超越了職業玩家。如果環境中存在捷徑，它也會「抄近路」，這展現了與動物相似的靈活的導航能力。

經過一系列的試驗，研究人員發現了網格表示對於基於矢量的導航系統的重要性。例如，當網路中的網格神經元被無效化（路徑隔斷）時，Agent 的探路能力也會下降。而且對於目標的方向和距離的衡量也會變得不準確。

同期Nature的另一篇文章展示了 Agent 如何「抄近路」。在哺乳動物的大腦中，當動物處在環境中的一個特定的位置的時候，位置細胞會激活。當頭朝向特定位置的時候，方向細胞會激活。

如果把環境構造成一個六邊形的網格，動物處於其中的一個網格的時候，網格細胞就會激活。研究人員利用神經網路訓練了一個 Agent 來模仿嚙齒動物的尋路過程，當然也包括了位置和方向細胞的活動。神經網路中的許多計算單元表現出了一種類網格式的激活模式。
a圖中，在學習導航的過程中，使用網格細胞的系統（紅色的線）和使用方向和位置細胞的系統（藍色的線）都走了相同的路線。
b圖中，如果存在捷徑，比如打開了那個之前關閉的門。只有使用網格的系統會去「抄近路」。這凸顯了網格細胞的靈活的尋路策略。

4.圖解：AI 如何帶你找到目的地

利用網格單元的基於矢量導航的示意圖。

底部的圈圈表示了不同尺度下的網格單元。有顏色的細胞表示激活的細胞。當 Agent 移動的時候，網格單元會激活，表示當前的網格編碼的改變，以反映進入了不同的激活區域。網格單元用來計算到目的地最短的路徑。

Agent 從右下的橙色點開始出發，左上的綠色點是目的地。當 Agent 探索房間的時候，網格單元會激活表示 Agent 的位置（橙色的橢圓）。這種網格單元在 Agent 當前位置活躍的模式就是「當前網格編碼」。

當 Agent 通過蜿蜒的路徑第一次到達目的地時，網格單元會激活成綠色表示 Agent 已經到達了目的地，目的地會存儲在目標網格編碼中，於是 Agent 現在就知道了目的地的位置了。

接下來當 Agent 再一次從起始點開始的時候，會從記憶中獲得目的地的網格編碼。然後計算一個從起點到目的地最近路徑的向量。Agent 會跟著這個計算出來向量走一個最短的路徑。

於是 Agent 就利用基於向量的導航系統到達了目的地。

5.人工智慧有望解出更多大腦謎題！

DeepMind的研究人員認為，他們的研究是理解大腦中網路細胞基礎計算功能的重要一步，這也凸顯它們對 Agent 的好處。這些證據有力支持了一種理論，即網格單元提供了一個歐幾里得的空間框架或者說一種空間的概念。這使得基於矢量的導航成為了可能。

更廣泛地說，先前研究人員的工作重申了利用大腦作為構建機器學習演算法靈感的潛力。之前廣泛的對於網格細胞的神經科學研究使得人工智慧具備了可解釋性。這便是人工智慧研究的一個主要的課題。當嘗試理解內部表徵時，通過給我們一些線索，我們更容易明白應該去尋找什麼。這項研究還展示了逼真虛擬環境下使用人工智慧積极參与複雜行為的潛力，這可以來測試大腦如何工作的理論。

進一步使用這個原則，類似的方法可以用來測試關於大腦區域的理論，這些區域對於感知聲音和控制四肢是很重要的。在未來，這種神經網路很可能為科學家提供一種新的方式來進行試驗，提出新的理論，甚至完成目前在動物身上做的一些研究。

來源：https://deepmind.com/blog/grid-cells/
翻譯：集智翻譯組成員夏佳豪

編輯：集智小仙女

集智團隊招新

多個崗位招募志願者、實習生，報名開放中。了解詳情：集智俱樂部團隊招新啦！

加入集智，一起複雜!

集智QQ群｜292641157

商務合作｜zhangqian@swarma.org

投稿轉載｜wangting@swarma.org

◆ ◆ ◆

搜索公眾號：集智俱樂部

加入「沒有圍牆的研究所」

http://weixin.qq.com/r/NDsxKXDEti3JrTRK924m (二維碼自動識別)

讓蘋果砸得更猛烈些吧！