「重磅」靈長類動物臉部識別演算法被破譯,大腦黑箱或根本不存在

新智元報道

不必花費太多心思就從人群中找到熟識的臉,對於絕大多數人而言都是小事一樁。人類的大腦已經這樣做了幾百萬年。

不過,這其中具體涉及的神經系統過程卻十分複雜,研究人員也對其傾注了很多年的時間。

6 月 1 日,在 Cell 發表的一項研究表明,獼猴依靠一個數百個神經元組成的集群相互協調,發現某些物理特徵,從而對動物的臉進行識別。這一發現也解決了一個多年以來一直困擾科學家的問題。

關於靈長類是如何識別其他動物,尤其是同類的臉,一直以來眾說紛紜。美國馬里蘭州貝塞斯達心理健康研究所的神經科學家 David Leopold 在接受 Nature 記者採訪時表示,最荒謬的觀點是,對於每個認識的人,都有單個的細胞專門用於識別那個人的那張臉。

其他理論則認為,多個神經元構成的集群一起工作,從而識別一張臉。

圖片來源:Nature

研究發現人臉識別新理論,單個神經元對一組特徵編碼

加州理工大學的神經科學家 Tsao 和 Le Chang 研究了兩隻獼猴(Macaca mulatta)的大腦,確定動物大腦中臉細胞(face cell)的位置。他們將人臉或其他物體的圖像,包括身體、水果和隨機圖案展示給這兩隻獼猴看。然後,使用功能核磁共振成像(fMRI)查看,當這兩隻獼猴看到「臉」時,哪些腦區會被激活(亮起)。

接下來,他們專註於研究被激活的點,也就是所謂的「臉細胞」。Tsao 和 Chang 使用了一組包含不同特徵的 2000 張人臉給猴子觀看,這些不同特徵包括眼睛之間的距離、髮際線的形狀等等。

然後,他們將電極植入獼猴的大腦中,比較各個神經元對面部差異的反應。

Tsao 和 Chang 記錄了兩隻獼猴間共計 205 個神經元的反應。每個神經元都會對一些面部參數的特定組合產生相應。

視覺皮層神經元針對特意設計的人臉不進行響應,證明了論文提出的 Axis Model 確實存在

西雅圖華盛頓大學視覺神經生理學家格 Greg Horwitz 在接受 Nature 記者採訪時表示,Tsao 和 Chang 兩人的工作可以簡單概括為開發了一個模型,讓人能從計算機屏幕上的圖像中看到,視覺皮層中神經元對臉部的反應。

Horwitz 說:「這是一個巨大的進步。」因為這個模型描繪了每個細胞是如何對所有可能的面部特徵組合產生相應的,而不僅僅是一個。

推翻此前假說,大腦不是「人臉識別機」,而是「人臉分析儀」

不僅如此,Tsao 和 Chang 還考慮了,在進行臉部識別,也就是識別各種面部特徵的特定組合時,每個神經元是否有「最擅長」的一個組合。

他們根據每個神經元對其特徵的反應,嘗試重現獼猴看見的面孔,從而驗證了這一想法。基於這些信號的強度,神經科學家幾乎可以完美地重現真實的面孔。

實驗中,當獼猴看到不同的臉部圖像,但這些不同是神經元「不關心」的組合時,單個臉細胞的反應保持不變。

打個比方,當獼猴看見兩張髮際線不同的照片,它們視覺皮層中關心眼睛大小的神經元不會產生變化。

換句話說,「神經元不是人臉檢測器,而是面部分析儀,」Leopold 告訴 Nature 記者,大腦「能夠意識到一些關鍵的維度(dimension),可以分辨出這是人 A,這是人 B」。

論文作者 Tsao 表示,人的大腦可能會使用這個代碼來識別或想像具體的面孔。

視覺皮層神經元針對特意設計的人臉不進行響應,證明了論文提出的 Axis Model 確實存在。來源:Cell 論文

每個臉細胞的調諧(tuning)都是面部維度的組合,是一個整體的系統,這也說明了為什麼當某人把鬍子掛掉時,他的朋友可能一開始注意不到,《紐約時報》的報道指出。

根據論文,需要大約 50 個這樣的維度來識別一張臉。

這些維度構建了一張精神上的「面孔」,可以識別無數張臉。

《紐約時報》報道還表示,可能存在一張平均臉(或類似的東西),新遇到的一張臉可能一個特徵(比如眼睛距離)在一個維度上平均偏離平均臉 5 個單位,而另外一個特徵(比如髮際線)在這個維度上則是偏離 7 個單位。

一張人臉可以分解為多個維度,而每個臉神經元大約會編碼其中 6 個維度的若干參數,整合在一起就形成了一張整體的臉。

Tsao 在接受《紐約時報》採訪時表示,她印象特別深刻的是,可以設計出一整套面孔,各種特徵組合,而給定的臉細胞都不會發生響應,因為這些設計出的面孔都不是細胞「擅長」識別的維度的組合。

這也排除了此前的一種人臉識別假說——臉細胞將輸入的圖像與一組標準的人臉數據進行比較,並從中尋找差異,而後者正是此前計算機識別人臉時常用的一種方式。

論文中提出的人臉識別模型的示意圖。來源:Cell 論文

不過,科學家目前仍然不確定一切是如何聯繫在一起的。

但是,能夠肯定一點,Leopold 在接受 Nature 採訪時表示:「這項研究為大腦實際上如何去分析單個的人提供了一個更實際的替代方法。」

《紐約時報》報道稱,機器學習給神經科學帶來了一種悲觀主義色彩,認為大腦類似黑箱,該論文則提供了反例:研究人員記錄了視覺系統最高級的神經元信號,可以看到那裡沒有黑箱。

也就是說,揭開大腦的奧秘是完全可能的。

接下來,就是人工智慧要做的事情了。

論文介紹:亮點及概要

亮點

  • 面部圖像可以使用大約 200 個臉細胞(face cell)的反應進行線性重建

  • 臉細胞顯示(display)與被編碼的軸在正交平面上平直調諧(flat tuning)

  • 軸模型比樣本模型更有效、魯棒和靈活

  • 面部結構(patch)ML/MF 和 AM 攜帶有關臉的補充信息

  • 概要

    靈長類動物以驚人的速度和可靠性識別複雜的物體,比如動物的臉。本文中,我們揭示了大腦進行面部識別的代碼。獼猴實驗表明,在面部結構中,面部和細胞反應之間存在著非常簡單的轉變。通過將動物的臉格式化為高維線性空間中的點,我們發現每個臉細胞的發射速率(firing rate)與入射面部刺激在該空間單個軸上的投影成正比,這樣一來,一個臉細胞就能對空間中任何位置的臉進行集合編碼。使用這個代碼,我們可以精確地解碼面部神經元群的反應,並預測關於動物臉的神經發射速率。此外,這一代碼推翻了此前由來已久的假設,那就是臉細胞會對特定的面部特徵進行編碼。我們的研究表明,其他對象也可以由類似的度量坐標系統進行編碼。

    編譯來源

    1. Nature 報道:http://www.nature.com/news/neuroscientists-rethink-how-the-brain-recognizes-faces-1.22091

    2. Cell 論文:http://www.cell.com/cell/fulltext/S0092-8674(17)30538-X?_returnURL=http%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS009286741730538X%3Fshowall%3Dtrue

    3. NYT 報道:https://www.nytimes.com/2017/06/01/science/facial-recognition-brain-neurons.html

    推薦閱讀:

    A -Star演算法
    AlphaGo背後的搜索演算法:蒙特卡羅樹搜索
    【學界】0-1背包問題的動態規劃演算法
    構建乘積數組

    TAG:動物 | 大腦 | 演算法 | 存在 | 破譯 | 算法 |