人類唯一的出路: 變成人工智慧 | 第二篇

中文官方內容將第一時間更新在Wait But Why官方公眾號(ID:wbwtimurban)

本文作者Tim Urban:

Wait but Why的作者Tim Urban 是埃隆馬斯克(特斯拉/SpaceX)創始人強烈推薦的科技博主。他寫的AI文章是全世界轉發量最高的。他的粉絲還包括:Facebook創始人馬克扎克伯格,Facebook COO謝麗桑伯格等。Tim也是TED演講平台上有史以來最受歡迎的演講者之一。

在一個由人工智慧和「其他所有生物」組成的未來, 人類只有一條出路:「變成人工智慧。」

本翻譯版本由謝熊貓君提供,全文共六萬字。兩百餘張圖片,分成六個章節,將分成五篇推送完成。

第一章:人類巨靈 (約7000字)簡述人類語言、智能和人類巨靈的崛起

第二章:大腦 (約8000字)簡述大腦結構,為了解腦機介面提供基礎知識

第三章:腦機介面(約12000字)講述腦機介面的基本原理和目前的技術水平

第四章:挑戰(約8000字)講述目前腦機介面跨越到全腦介面所要面臨的挑戰

第五章:魔法紀元(約13000字)全腦介面實現後未來的人類會是怎樣

第六章:大融合(約10000字)人類唯一的出路:變成人工智慧

本次推送是總共五篇推送中的第二篇,包括了以上第三章的內容,約12000字,40張圖,會佔用您5MB左右的流量,閱讀完全文預計15分鐘,本文閱讀難度較大,建議您先收藏,並選擇安靜的時段閱讀,如果您還沒有讀前面的第一篇推送,也推薦您收藏本文後先閱讀第一篇:

人類唯一的出路: 變成人工智慧 | 初篇 人類巨靈和大腦結構

03第三章

腦機介面

首先,讓我們回到公元前五萬年,綁架一個人,然後把他帶回2017年。

這位是老王。老王,我們很感謝你和你的夥伴們發明了語言。

為了感謝你,我們想帶你看看你們的神奇發明所帶來的成果。

然後我們帶老王看一下飛機,然後看一下潛水艇,然後去一下迪拜塔的樓頂。然後我們在看看望遠鏡、電視機和iPhone。然後我們再讓老王玩一下互聯網。

好啦,老王你覺得怎樣?

呵呵,我們猜到你會被這一切嚇尿的。好了,最後,讓我們給你展示一下我們現在是怎麼互相溝通的。

老王會被人類學會語言後發明的這些「魔法」所震驚,但是當我們真的用語言和彼此交流的時候,好像與老王那個時代的人彼此交流沒什麼差別。當人們說話溝通的時候,他們其實是在使用已經有五萬年曆史的技術。

同樣的,在一個充滿了神奇機器的世界,造出這些機器的人類日常的身體和老王那個時代的人的肉體也沒啥區別。為啥會這樣呢?

這就是為什麼腦機介面這個神經工程學的子領域(神經工程學本身是生物技術的一個子領域),會是一個這麼充滿誘惑的產業。我們用我們的技術反覆征服了這個世界,但是對於我們最核心的工具「腦」,整個技術世界好像沒有什麼建樹。

所以我們還在用老王那個時代就發明的技術「語言」在交流,所以當我寫這段話的時候,我的打字速度大概是我思考速度的二十分之一,也是為什麼大腦疾病對人們生活造成很大的困擾和影響。

但是在發明語言五萬年後的今天,這一切也許就將改變。腦的下一個大躍進,可能就將在它自身體現。

腦機介面有很多種,各自會有不同的功能。不過所有腦機介面領域的人,基本上都是在以下兩個問題上努力:

1)我怎樣把正確的信息從大腦里取出來?

2)我怎樣把正確的信息發給大腦?

問題一是關於接受大腦的輸出——記錄神經元的話

問題二是關於把信息傳入大腦的神經流,或者改變神經流,也就是關於刺激神經元。

這兩樣事情本身是在你的大腦內自然發生的。現在你的眼睛正在做一些水平運動,使得你能看完這句話。這就是大腦的神經元把信息輸出給機器(也就是你的眼睛),而機器收到了這些信息,做出了適當的反應。而隨著你眼睛的移動,光子進入你的視網膜,刺激枕葉里的神經元,使得這些字的圖像進入你的思想。這個圖像又刺激了大腦其它部位的神經元使得你能處理儲存在這些圖像里的信息,進而了解這句話的意思。

輸入和輸出信息是大腦神經元的本職工作,腦機介面領域就是想參與到這項工作裡面去。

粗看,這個事情好像不怎麼難。大腦不就是是個果凍球嘛,而皮質不就是塊餐巾嘛。而且這塊餐巾還很巧的就在腦的最外層,很容易就接觸到。皮質裡面有大約200億的神經元,如果我們能學會這200億個神經元的工作方式,與它們合作,就能讓我們從更高的高度掌控我們的生活、健康,以及這個世界。

我們能做到嗎?雖然神經元很小,但是我們連怎樣拆開一個原子都知道,神經元的直徑可是有原子的十萬倍大呢。如果原子是一個玻璃球大小,那神經元的直徑類比之下應該是一公里,所以尺寸應該不是問題對吧?

所以問題究竟是啥?

好吧,上面這段邏輯其實是有可取之處的,正因為這段邏輯中的那些想法,這個行業有著很大的前景。

但當你能夠真正理解大腦內發生的事情的時候,你才會意識到搞懂這一切可能是人類能做到的最難的一件事

在我們開始談論腦機介面之前,我們先來仔細看看這些試圖製造腦機介面的人面對的困難吧。最好的解釋方式就是先把大腦放大一千倍來看看。

回到我們的皮質餐巾的方式吧。

如果我們把這塊餐巾放大一千倍,那麼餐巾大概是六個曼哈頓街區見方,你繞著四周走一圈大概要花25分鐘。而腦本身大概會佔據一個兩個街區見方的空間,大概和麥迪遜廣場花園差不多。(註:此處指長度和寬度與麥迪遜廣場花園,放大一千倍的腦的高度應該是麥迪遜廣場花園的兩倍高。)

那我們就把大餐巾和腦鋪到曼哈頓吧。住在曼哈頓的幾十萬人大概是不會介意的......吧

我選擇一千倍這個倍率,一是因為計算方便,每一毫米的腦現在就相當於一米,而每個神經元現在大概相當於一毫米;其次,皮質這個時候就很符合人類尺寸了,原本只有二毫米的皮質,現在和一個二米高的人一般了,也就是說這塊餐巾現在是二米厚。

現在,我們從這塊餐巾裡面切出一塊一立方米的方塊來研究一下,幫助我們理解一立方毫米的皮質中所發生的事情。

我們在這一立方米的皮質中會看到一團糟,我們先把裡面的東西倒出來,然後再逐一放回去。

首先,我們把神經元的胞體們放回去。

胞體的大小各異,神經科學家們表示皮質里的神經元的胞體直徑一般是10-15微米,也就是說如果把7-10個神經元胞體排一列,這一列的長度大概會有頭髮絲的直徑一般。在我們放大一千倍的世界裡,胞體的直徑大概是1-1.5厘米,和玻璃球差不多。

整個皮質的體積大概是50萬立方毫米,這個空間中存在著約200億個神經元胞體,也就是說每立方毫米大概存在四萬個神經元。所以,我們的一立方米的方塊中大概有四萬個玻璃球。如果我們把一立方厘米的方塊均分成四萬份,每一塊約是三厘米邊長的小立方體,胞體就存在與每個小立方體的正中間,與周圍其它胞體的距離也正好是三厘米。

至今為止還聽得懂嗎?此時你的腦中是否能夠想像出一個一立方米的方塊,裡面懸浮著四萬個玻璃球?

下圖是胞體在皮質中的顯微鏡照片。

目前為止問題還不大。可是胞體只是神經元的一小部分,從每一個胞體出發的是彎曲分叉的觸突,在我們放大一千倍的世界裡,這些觸突會向不同方向伸展三到四米,而和觸突接觸的軸突可能有一百米長(軸突可能要直接延伸到皮質的其它部分),甚至一千米長(一些觸突可能要直接到達脊髓或者身體其它部位)。而每個觸突、軸突都只有一毫米厚,這些線狀物把皮質變成了一團雜亂又無法解開的毛線球。

而這團毛線球裡面有很多事情在發生。每個神經元會和上千個甚至上萬個其它神經元接觸。整個皮質裡面的200億個神經元,組成了大概20兆(20,000,000,000,000)個神經連接,而整個腦裡面的神經連接可以多達千萬億個(1,000,000,000,000,000)。在我們手頭的一立方米方塊中,大概會有2000萬個神經連接。

還不止如此,我們的四萬個玻璃球不只每個都會伸出多根毛線,還有成千上萬的來自皮質其它部位的毛線會穿過我們這個方塊。也就是說,如果我們試圖去記錄我們這個立方米方塊里的信號的話,會遇到很大的阻礙,因為在一堆毛線球面前,很難分清楚哪些毛線源自這個立方米方塊里的玻璃球。

當然,不要忘了神經可塑性這個東西。每個神經元的電壓是會不斷變化的,每秒鐘可以變化數百次。而我們的立方米方塊里那幾千萬個神經連接是會經常改變大小、消失或者出現的。

這還沒完呢。腦里還有一種叫做神經膠質細胞的東西,膠質細胞有很多類型,承擔很多不同的功能,比如清掃神經連接釋放出來的化學物質,或者把軸突包裹在髓鞘里,以及充當腦的免疫系統。下面是幾種常見的膠質細胞:

皮質里有多少膠質細胞呢?大概和神經元數量差不多。所以我們要往我們的立方米方塊中再加四萬個這些奇形怪狀的東西。

最後,還有血管。每立方毫米的皮質里,有大概一米長的毛細血管。也就是說在我們的立方米方塊里有一千米長的血管,看起來大概是這樣的:

神經科學界有一個了不得的項目叫人類連接組計劃。項目里的科學家在試圖創建整個人腦的詳細地圖,在此之前從沒有這樣規模的人腦圖譜工作。

這個項目把人腦切成了不可思議薄的切片,每片大約30納米厚,也就是一毫米的三萬三千分之一。

項目中產生了很多好看的代表軸突的絲帶圖。

人類連接組計劃幫助人們從視覺上理解腦內是有多麼的擁擠和繁雜。下面展示的是一小片小白鼠腦裡面包含的東西(還不包括血管哦) :

上圖中,E是整個切片的樣子,F到N是組成E的不同部分。

所以我們的立方米方塊非常擁擠,電荷亂飄,而且無比複雜。然後,讓我們提醒自己,這個立方米方塊裡面的一切,在現實的腦里,只是一立方毫米而已。

而腦機工程師們要做的是搞清楚那一立方毫米里的胞體傳遞的信息是什麼,或者用正確的方法刺激正確的胞體,來達成工程師們想要的目的。

祝這些工程師們好運吧。

即使在一個完全平鋪開,並且被放大一千倍的皮質餐巾是,做這一切都無比困難,而事實上,這塊餐巾是深深的摺疊在麥迪遜廣場花園上面的。只有不到三分之一的皮質是露在腦的表面的,大部分的皮質都被埋在深深的摺疊之中。

而且,工程師們可不是在一些被取出來的腦上工作,這些腦可是被俄羅斯套娃般一層層掩蓋起來的。如果把頭骨放大一千倍,就有七米厚。而且大部分人是不願意讓你打開他們的頭骨來研究的,工程師的工作得盡量無創。

然而以上說的這些,都是假設我們是研究皮質而已。而很多的腦機介面研究,都是研究更深層的結構,假設你站在麥迪遜廣場花園頂部的話,這些研究專註的是表面往下50-100米的東西。

更不要忘了,我們的立方米方塊,只是皮質的五十萬分之一而已。如果把這五十萬個立方米方塊排成一直線,大概能從曼哈頓排到五百公里外的波士頓。走完這段路程要花100多個小時,在這整段路程里,你隨時停下來,身邊都會有一個複雜無比的立方米方塊。這所有所有的複雜加起來,就是你的腦里正在發生的事情。

我現在確實很慶幸不用為這樣複雜的事情操心

那麼科學家和工程師是怎麼面對這些問題的呢?

他們用他們現在有的工具來盡量做到最好,這些工具用來記錄神經元信息,或者刺激神經元。

根據現在的工作進展,有三個標準用來衡量記錄工具的優劣:

1)規模——能記錄多少神經元

2)解析度——工具收集到的信息有多細。解析度有兩種,空間性(記錄的信息能多準確的反應單個神經元的動向),以及時間性(能夠多準確的確認所記錄行為發生的時間)

3)創傷性——是否需要手術,如果需要,到什麼程度。

遠期的目標是能夠同時達成三個目標。不過,現在的情況基本是「哪一個或兩個標準我們願意完全捨棄」。工具之間不是簡單的升級和降級,而是權衡取捨。

我們來看下目前使用的一些工具:

功能性磁共振成像(fMRI)

規模: 高,能展示全腦的信息

解析度: 空間性中低,時間性非常低

創傷性: 無創

fMRI通常不是用來做腦機介面研究的,但是它本身是個很好的記錄工具,它能夠給你提供腦內正在發生的事的信息。

fMRI使用磁振造影技術。二十世紀七十年代發明的磁振造影技術,是X光CT的升級。磁共振不用X光,而是用磁場(以及其它電波和信號)來生成身體和腦的影像。

挺厲害的技術。

fMRI使用磁振造影追蹤血液流動的變化。為什麼要這麼做呢?因為當大腦的特定部位變得活躍的時候,那個部位就需要更多的能量,也就需要更多的氧氣,所以那些部位的血流會增加來傳遞更多的氧氣。fMRI的掃描是這樣的:

當然,大腦的各處時刻都有血液流過,這張圖顯示的是血流增加的部分(紅橙黃)和減少的部分(藍)。因為fMRI掃描的是整個大腦,所以結果是3D的。

fMRI有很多醫學應用,比如告知醫生病人中風後腦的各個部位是否運行正常。它也教會了神經科學家很多東西,包括大腦的哪些區域參於哪些功能。fMRI掃描也能幫助提供整腦在給定時刻的整體情況,並且很安全,而且完全無創。

一個大的缺陷是解析度。fMRI掃描和電腦屏幕一樣是有個實際的解析度的,只不過像素點是3D的。

隨著技術的進步,fMRI的像素點也在縮小,不斷提高空間性解析度。現在的fMRI像素點能夠小到約1立方毫米。腦的總體積約是一百二十萬立方毫米,所以一台高性能的fMRI能夠把腦細分成一百萬個小方塊。問題在於,在神經元的級別上,這還是太大了,每個像素點包含了成千上萬的神經元。所以fMRI展現的,最好也就是每四萬個左右神經元區域的平均血液流量。

更大的問題是時間性解析度。fMRI掃描血液流量,這是很不準確,並且有大概一秒的延遲。一秒對於神經元來說是個太長的時間了。

腦電圖描記器(EEG)

規模: 高

解析度: 空間性非常低,時間性中高

創傷性: 無創

EEG有將近一個世紀的歷史,而它其實就是在頭上擺好多電極的那個東西:

對於一個2050年的人來說,EEG肯定是個很原始的科技了,但是現在來看,它是僅有的能夠無創的和腦機介面合作的工具之一了。EEG記錄大腦不同區域的電活動,然後把結果像這樣呈現出來:

EEG圖能夠獲取關於癲癇等疾病的醫學信息,追蹤睡眠規律,或者用來確認麻醉劑的效果。

不過和fMRI不同的是,EEG的時間性解析度很好,能夠即時的獲取腦內電信號的產生。當然頭骨對於時間性解析度的準確性還是會有一定影響,因為骨的導電性不好。

EEG的主要弱勢是空間性解析度,在這方面EEG基本談不上解析度。每個電極只是記錄一個很粗略的平均值,所有這個電極覆蓋範圍內的數百萬到數億個神經元的電量的矢量總和,而這個值還是受到了頭骨影響後的。

如果把大腦想像成一個棒球場,每個神經元是現場的一個觀眾,而把我們想要從腦獲取的電信息類比成每個觀眾的聲帶的振動。在這樣的情況下,EEG的效果就好像放在棒球場外的一堆麥克風,透過棒球場的外牆,麥克風可以聽到觀眾的歡呼聲,並且能夠大致推斷出他們為什麼在歡呼。你甚至能夠從一些蛛絲馬跡中聽出兩隊正在交換攻防,或者比分是否咬的很緊,你甚至能夠察覺到是否有不尋常的事情發生。

但也就止步於此了。

腦皮層電圖描記法(ECoG)

規模:高

解析度:空間性低,時間性高

創傷性:有創

ECoG和EEG類似,同樣是利用表面電極的,只不過它是把電極放到了頭骨下面,直接放到了腦的表面。

聽這樣的描述是不是有種說不出來的噁心?但是這個做法很有效,至少比EEG有效很多。沒有頭骨的干擾,ECoG能夠獲得更高的空間性解析度(精確到1厘米)和時間性解析度(精確到5毫秒)。ECoG的電極可以被放置於硬腦膜上方或者下方。

用回我們上面的棒球場的比喻。ECoG用的麥克風在球場裡面,而且離觀眾比較近,所以獲得的聲音也比EEG從球場外獲得的聲音更加清晰,並且ECoG麥克風能夠更好的區分各個獨立區域的觀眾聲音。

但是這種改進是有代價的,ECoG需要在有創手術的前提下操作。當然,在有創手術的領域,這還不是很糟糕,一個神經外科醫生的曾這樣跟我描述:「你能夠相對不那麼有創的把東西放到硬腦膜下面,雖然還是要先在頭上鑽一個洞,但是相對來說創傷不大。」

局部場電位(Local Field Potential,LFP)

規模:低

解析度:空間性中高,時間性高

創傷性:非常有創

從LFP開始,我們不再用表面電極,而是用微電極了,微電極就是外科醫生扎進腦裡面的小針頭。

腦外科醫生Ben Rapoport跟我描述過他的父親,一位神經學家,曾經是怎樣製造微電極的。

「我父親需要造微電極的時候,都是手工做出來的。他用的都是直徑只有10-30微米的非常細的金線、鉑金線或者銥線,把這些細線塞進直徑只有1毫米左右的玻璃毛細管中,然後他會把這塊玻璃管放在火焰上烤軟,然後他把玻璃管拉長到玻璃邊的非常薄,把這時候的玻璃管從火焰上移開,然後敲碎。

這時候的玻璃管內部就緊貼著裡面的細線了。玻璃是絕緣體,而細線是導體,於是完成品就是一個有玻璃絕緣外層的堅硬的電極,電極的尖頭只有幾十微米粗。」

現在,雖然有些電極還是手工做出來的,但新技術已經能夠利用硅晶元做原材料,製作工藝也是借鑒了集成電路產業的做法。

LFP的做法很簡單:把這些超級細的帶有電極頭的針插入皮質1-2毫米,這樣每個電極就能收集到附近一定範圍內的神經元電量的平均值。

LFP擁有fMRI般還可以的空間性解析度,同時又具有ECoG的高時間性解析度,在解析度這個角度來看算是魚和熊掌兼得了。可惜在其它標準上做的還是比較糟糕的。

與前面提到的fMRI、EEG和ECoG不用,微電極LFP的規模性很低,它只能採集電極附件一小塊區域的信號,而且LFP的侵入性非常強,它實際上已經進入了腦的內部。

用回棒球場的比喻的話,LFP就是一個懸掛在單塊座位上方的單個麥克風,它能採集到那塊區域的聲音,甚至有可能時不時採集到單個觀眾的聲音,但是大部分時間還是只能獲得一個大概。

這個領域最新的進展就是多電極陣列技術,本質和LFP一樣,區別是它會在單個皮質區域(大約4毫米見方)同時使用上百個LFP。

單細胞記錄(Single-Unit Recording)

規模:非常小

解析度:非常高

創傷性:非常有創

在使用LFP的時候,為了能夠收集到較廣的區域,電極的頭是略微磨圓了的,這樣能夠讓電極的表面積更大,把電阻降低(註:此處使用「電阻」便於讀者理解,實際的技術稱呼並不是電阻)。這樣能讓更大範圍內的弱信號都能被收集到,結果就是電極這個麥克風會收集到附近區域的大合唱。

單細胞記錄同樣使用針狀電極,但是把電極頭磨的非常鋒利,來大大提高電阻。這能夠阻絕大部分的噪音,使得電極幾乎採集不到任何東西,直到電極和一個神經元非常接近(大約相距50微米左右),在這個距離下神經元的信號足夠強,所以能夠越過電極頭的高電阻。因為能夠收集到單個神經元的信號,並且沒有背景噪音,這個電極現在能夠用來窺視單個神經元的「隱私」。這是最小的規模,也是最大的解析度。

有些電極技術則是更近一步,採用了一種叫膜片鉗的技術。膜片鉗直接去掉了電極頭,只留下個叫作玻璃微量吸管的小管子。膜片鉗會把神經元的細胞膜的一小塊吸進管子里,來達到更準確的測量。

不同於上面提到的所有方法,膜片鉗還有個優勢,那就是它和神經元產生了物理接觸,所以它不但能夠記錄,還能刺激單個神經元,比如通過輸入電流或者控制電壓來進行一些測試。其它的方法雖然也能刺激神經元,但是只能批量的做。

最後,還有些電極能夠直接穿過神經元的細胞膜,更進一步的侵入神經元,這種技術叫作尖銳電極記錄。只要電極頭足夠尖,就不會損傷細胞,因為細胞膜會在電極周圍閉合。這使得刺激神經元和記錄神經元內外電壓差變得非常容易。不過這種技術的使用時間有限,一個被刺穿的神經元是存活不了太久的。

在我們的棒球場比喻里,單細胞記錄是個掛在一位觀眾衣領上的指向性麥克風。膜片鉗就是一個在觀眾喉嚨里的麥克風,它能夠記錄聲帶的每個動作。這種技術能夠很好的記錄這個觀眾在球賽現場的體驗,但是卻記錄不到任何背景信息,並且你無從得知這個觀眾的聲帶發出的聲音和動作,和球場上正在發生的事情是否有關。

以上就是我們目前常用的所有技術手段了。這些對我們來說是難以置信的先進,但是對於未來人類來說,可能又像石器時代技術一樣原始——必須在解析度和規模之間做取捨,而想要真正高質量的讀取和寫入大腦信息,居然要打開頭骨。

我們已經有的腦機介面

雖然這些工具有它們各自的局限,但是它們已經幫助我們了解了很多關於大腦的知識,並且幫忙創造出了一些神奇的早期腦機介面。以下我們來看看我們已經有的腦機介面吧

1969年,研究員Eberhard Fets把一隻猴子腦中的一個神經元連接到了這隻猴子面前的儀錶轉盤上。當這個神經元觸發的時候,儀錶轉盤就會動。每當猴子的思考觸發了那個神經元,使得轉盤轉動的時候,它就會獲得一個香蕉味嚼片作為獎勵。

經過一段時間後,為了獲得更多的嚼片,猴子變的很擅長玩這個遊戲了。這隻猴子學會了怎樣讓那個特定的神經元觸發,並且不經意間成為了第一個腦機介面的使用主體。

之後的幾十年,這個領域的進展很慢,不過到了90年代中期,進展開始出現。從那時開始,這個領域一直在默默發力加速發展。

因為我們對於大腦的理解,以及我們的電極設備都還比較原始,我們一直以來所作的努力都是集中在建設與我們理解最透徹的大腦部位的介面,比如運動皮質和視覺皮質對應的介面。

同時,因為人體實驗只有在那些想要通過腦機介面來對抗殘疾的人身上才真的有可操作性,並且目前的市場需求也是這個方向,所以我們至今為止的努力也幾乎完全是關注於恢復殘疾人士的受損能力上面。

未來那些會給予人類魔法超能力並且改變世界的大型腦機介面產業,目前都還在孕育階段。我們現在可以先看看他們在做的事情,來體會一下2040年,2060年或2100年的世界可能會有多神奇。

比如,我們來看下這個:

這是圖靈在1950年建造的電腦,它叫作Pilot ACE,在當時真的是尖端科技。

再看看這個:

在讀下面的這些例子的時候,我希望你能夠一直做下面這個類比:

Pilot ACE 之於 iPhone 7

就好像

這個腦機介面 之於 ________

然後在做這個類比的時候,想想空格處的東西會是怎樣,我們會在後面再來討論空格處的東西。

根據我所讀到的,和與這個領域的人討論到的,目前腦機介面領域主要有三個大類的工作方向:

早期腦機介面類型一:把運動皮質變成遙控器

早期腦機介面類型二:人造耳朵和人造眼

早期腦機介面類型三:深腦刺激

早期腦機介面類型一:把運動皮質變成遙控器

防止你忘了幾千字前的內容,運動皮質是下面這個:

腦的所有部位對我們來說都是天書,但是運動皮質稍微不那麼難懂一些。更重要的是,它和身體各部位的對應關係很好,也就是說運動皮質的特定部位是對應特定身體部位的。(還記得前面那個噁心的何蒙庫魯茲嗎?)

同樣很重要的是,運動皮質是控制我們輸出行為的區域之一。當一個人做一些事情的時候,運動皮質幾乎都有參於,而且至少它會參於物理運動的那部分。所以,其實人腦不需要學習怎麼把運動皮質當遙控器用,因為一直以來,運動皮質都是人腦的遙控器。

試著舉起你的手,然後再把手放下。發現沒?你的手就好像玩具無人機一樣,而你的腦就是拿起來運動皮質這個無人機遙控器,在控制著你舉起和放下手。

基於運動皮質的腦機介面的目的就是能夠接入運動皮質,這樣當這個遙控器發出一些命令的時候,腦機介面能夠收集到這個命令,然後把命令傳達給一些機械,讓機械做出和你的手類似的反應。神經連接你的運動皮質和你的手,而腦機介面就負責連接你的運動皮質和一台計算機,就是這麼簡單。

一些雛形的腦機介面,能夠讓一個人(通常是高位癱瘓或者截肢人士)能夠通過意念就移動屏幕上的滑鼠。

這種效果的實現,基於植入使用主體運動皮質的100針多電極陣列來實現。一個癱瘓了的人的運動皮質通常是沒問題的,出問題的多是作為運動皮質和身體的中間人的脊髓。電極陣列植入運動皮質後,研究員會讓使用主體嘗試把手往不同方向移動。雖然他們的手不會真的動起來,但是運動皮質還是會正常觸發的。

當一個人移動他的手臂的時候,他的運動皮質會產生一系列的行動,但是每個神經元通常只關注一個類型的運動——某個神經元可能在這個人每次把手臂往右移的時候都會觸發,但是手臂往其它方向移的時候就不那麼活躍了。這單個神經元,其實就能告訴計算機這個人什麼時候想要把手臂往右移,什麼時候又不想。但單個神經元能做到的也就是這樣了。

不過隨著電極陣列的接入,100個單細胞電極各自採集100個不同神經元的信息。當研究員們做測試的時候,比如研究員讓測試主體把手往右邊移,假設100個電極中有38個採集到各自對應的神經元觸發,而當主體試圖把手往左邊移的時候,41個電極採集到各自對應的神經元觸發。經過一系列這樣的不同方向和速度的測試後,計算機能把從電極處收集到的信息分析合成為一種對於觸發規律的理解,知道怎樣的觸發規律對應怎樣的二維坐標系移動。

而當我們把這些合成結果連接到一個計算機屏幕時,測試主體就能通過「想」移動滑鼠,來真正的控制滑鼠,在實際操作中這種方法是可行的。經過運動皮質腦機介面的先驅BrainGate公司的努力,真的有人能夠靠「想」來玩遊戲。

100個神經元能夠告訴我們測試主體想怎樣移動滑鼠,它們也完全可以告訴我們測試主體想要拿起一杯咖啡喝一口。一個四肢癱瘓的女士可以在飛行模擬中控制一架F-35戰鬥機。最近,有隻猴子還用意念控制輪椅的移動。

而且這種控制 不止於手臂。巴西腦機介面先驅Miguel Nicolelis和他的團隊就打造了一整套外骨骼,讓一位癱瘓人士為巴西世界盃開球。

不要忘了本體感知

控制這些「神經義肢」的關鍵是記錄神經元信息,但是要讓它們真的高效運作起來,不能只倚賴單向的信息傳輸,需要一個信息採集和刺激的雙向閉環。雖然我們不會注意到,但是你能夠拿起一件物品,很大程度上依賴於手的皮膚髮送回腦的觸覺信息,也就是本體感知。

在我見過的一個視頻中,一位女士的手指麻木,但沒有其它殘疾,而當她試圖點燃火柴的時候,她做的非常困難。在另一個視頻中,一位有著完好的運動皮質但是失去了本體感知的男士,也有著很嚴重的不便。所以要讓仿生義肢真的能夠像人的手臂一樣運作,我們還需要讓這些義肢能夠把信息發送回腦里。

然而,刺激神經元比記錄神經元難多了。研究員Flip Sabes是這麼跟我解釋的。

「好比我記錄一些行為規律,但不代表我們能夠輕易重現把這些規律。就好像我們的太陽系一樣,你可以觀測行星的移動,並且記錄它們的軌跡。但如果你把太陽系打亂,然後試圖重現一個行星的原本軌跡,你可不是簡單的把這個行星放回它原本的軌道這麼簡單,因為它的行動受到其它所有行星的影響。

同樣的,神經元不是獨立工作的,這個過程本質上是不可逆的。同時,因為大量軸突和樹突的存在,要刺激你想要刺激的神經元而不影響到其它東西,也是很難的。」

Flip的實驗室嘗試讓腦本身來幫忙克服這些挑戰。前面提到了,如果每當猴子的一個特定神經元觸發後,你就給這個猴子一些獎勵的話,猴子最終會學會觸發這個神經元。這時,這個神經元就能被當作一種遙控器來用。也就是說,利用尋常的運動皮質的指令只是控制機制的一種可能性。

同樣的,在腦機介面技術足夠成熟到能夠進行刺激的時候,你能把腦的神經可塑性作為一個捷徑。如果讓一個人的仿生手指發送回觸覺信息太難實現的話,仿生義肢完全可以發送一些其它信息給腦。最初,主體對於這些信號可能不太適應,但是長此以往,腦會學會把這些信號詮釋成一種新的新的觸覺。這個把腦作為腦機介面的助手的概念叫作感官替代。

掩藏在這些進展之下的,是未來的技術突破,例如腦對腦溝通。

Nicolelis設計了一個實驗,試驗中有一隻在巴西的老鼠,這個老鼠能夠觸摸到籠子內的兩個開關,並且它知道其中一個開關能夠給它帶來一份小食。這隻巴西老鼠的運動皮質通過互聯網,連接到了一隻在美國的老鼠的運動皮質。美國的老鼠處在和巴西老鼠一樣的實驗環境和籠子中,只不過它並不知道兩個開關中哪個可以給它帶來小食,並且它能收到巴西老鼠的腦發來的信號。

在實驗中,如果美國老鼠做出了和巴西老鼠一樣的正確選擇,兩隻老鼠都能獲得小食,而如果美國老鼠選擇了錯的開關,兩隻老鼠都得不到小食。神奇的是,經過一段時間,兩隻老鼠學會了合作,雖然它們不知道彼此的存在,但是兩隻老鼠像同一個神經系統一樣工作。在完全隨機的情況下,美國老鼠的成功率應該是50%,但是因為它能收到巴西老鼠發來的信號,它的成功率達到了64%。

類似的實驗在真人測試中也可行。兩個待在不同樓里的兩個人,一起玩一個遊戲,其中一個人能夠看到屏幕,而另一個手握控制手柄。用簡單的EEG設備,能夠看到屏幕的那個玩家能夠在不移動手的情況下,用意念「想」按動射擊按鈕。而因為兩個玩家的腦設備在互相通信,手握控制手柄的玩家會感覺到手指的顫抖,然後按下射擊按鈕。

早期腦機介面類型二:人造耳朵和人造眼

讓失聰的人恢復聽覺和讓失明的人回復視力是比較可控的腦機介面領域,之所以這樣,是因為以下的原因:

首先,和運動皮質一樣,我們對感官皮質的了解也還不錯,這部分歸功於感官皮質和身體部位的對應關係也比較好。

其次,在很多的早期應用中,我們不需要直接和大腦打交道,我們只需要和耳朵/眼睛連接大腦的部分打交道就可以了,因為功能喪失基本都是在這些部位發生的。

同時,運動皮質相關的工作都是通過記錄神經元行為來把信息從腦取出來,人造感官則是另一個方向——刺激神經元,把信息發回腦中。

具體到人造耳的領域,近幾十年我們已經在人造耳蝸領域已經有了非常長足的進展。

當你以為你「聽到」聲音的時候,其實整個過程是這樣的:

聲音其實是你的頭附近的空氣分子的振動。當吉他的弦,或者某人的聲帶,或者風,或者其它任何東西發出聲音的時候,是因為發聲的東西在振動,使得其周圍的空氣分子產生類似的振動。這種振動於是以球形傳播開來,就好像你觸碰到水後,水面會擴散出圓形水波一樣。

你的耳朵就是把這些空氣振動轉化為電信號的機器。當空氣(或者水,或者其它分子會振動的媒介)進入你的耳朵時,你的耳朵把空氣振動的方式轉化成一種電碼轉述給相連的神經末梢。這使得神經產生一系列的動作電位,把這些信息傳送到聽覺皮質里進行處理。你的腦因此就會收到這些信息,而我們把接收這類信息的體驗叫作「聽到」。

大多數失聰或者有聽力障礙的人並沒有神經問題或者聽覺皮質問題,他們通常只是耳朵有問題。他們的腦和其他人的腦一樣可以把電子信號轉換為「聽」,只是因為耳朵這個電子信號轉換機器出了問題,導致他們的聽覺皮質根本就沒收到這些電子信號。

耳朵有很多部分組成,而耳蝸是做轉換的關鍵部件。當分子振動進入到耳蝸內的液體的時候,振動會帶動耳蝸內數千的小毛髮的振動,與這些毛髮相連的細胞會把振動的機械能轉化為電子信號,刺激聽覺神經。

耳蝸還會根據頻率對聲音進行分類。下面這個圖解釋了為啥低頻聲音是在耳蝸盡頭處理,而高頻聲音是在開頭處理,以及為什麼耳朵能聽到的聲音頻率會有上下限。

人造耳蝸就是一個小計算機,它的一端是個貼在耳朵上的小麥克風,另一端則是一條連接安裝在耳蝸中的電極的電線。

聲音進入到麥克風,然後進入那個褐色的組件,褐色組件會去除不是那麼有用的頻率範圍,然後把剩下的信息通過皮膚的電傳導傳到計算機的另一個組件,這個組件會把信息轉化成電子信號然後送入耳蝸。耳蝸里的電極和耳蝸里的毛髮一樣按照頻率過濾脈衝信號,然後刺激聽覺神經。從外面看,人造耳蝸長這個樣子。

也就是說,這就是一個人造耳,這個人造耳做「聲音——脈衝——聽覺神經」的處理,就和人耳一樣。人造耳的聲音一般聽起來都不怎樣,為什麼呢?因為要達到和人耳一樣的處理效果,需要大概3500個電極,大部分人造耳蝸只有16個電極,太粗糙了。

我們現在還處在Pilot ACE時代,當然會比較粗糙了。

能讓失聰的人聽到聲音,並且與人進行對話,這本身就是很大的進步了。

很多失聰嬰兒的父母都會在嬰兒一歲左右的時候把人造耳蝸植入到嬰兒耳中。

在視覺領域,同樣的革命也在發生,對應的例子就是人造視網膜。

失明通常是視網膜疾病造成的。這種情況中,人造視網膜能夠像人造耳蝸協助聽力一樣協助視覺。人造視網膜取代視網膜做眼睛本身會進行的操作,然後把電子脈衝信號傳達給視覺神經。

人造視網膜是比人造耳蝸更複雜的腦機介面。第一例被美國食品藥物監督管理局(FDA)批准的人造視網膜出現在2011年,它叫作Argus II,由Second Sight公司生產,它長這樣:

這個人造視網膜有60個感測器,相比人類視網膜的一百萬個左右的神經元,太粗糙了。不過能夠看到模糊的邊緣和形狀,以及亮、暗的差別,怎麼也好過什麼都看不見了。令人振奮的是,其實我們不需要一百萬個感測器來獲得還過得去的視覺,模擬運算顯示,600到1000個電極就能產生足夠閱讀和進行人臉識別的視覺。

早期腦機介面類型三:深腦刺激

早在上世紀八十年代末,深腦刺激就作為一個粗糙的工具開始改變很多人的生活了。

這個類型的腦機介面不和外部世界交流,它們是通過內部改造來治療或者改善人體機能。

深腦刺激通常有一到兩根電線,連接四個不同位置的電極,然後會插入到腦中,絕大部分會被插入到邊緣系統里。然後一個連接了這些電極的小起搏器會被安裝到胸口的位置,像下面這位:

當需要的時候,電極就能產生一些刺激,繼而引發一些比較重要的行為發生,例如:

  • 減低帕金森患者的抖動
  • 減輕癲癇發作的強度
  • 安撫強迫症

實驗上(因為還未經FDA批准),這些設備還能減緩一些慢性疼痛,比如偏頭痛和幻肢痛,治療焦慮、抑鬱和創傷後應激障礙,甚至可以結合身體其它部位的肌肉刺激來修復中風或神經疾病造成的神經損傷。

以上就是早期腦機介面行業的情況,也是埃隆馬斯克進入這個行業時候的行業現狀。對於埃隆和Neuralink來說,今天的腦機介面行業就是A點。我們講到現在都一直在講過去,一直講到了現在這個節點。下一步就是談談未來,聊一下B點是怎樣的,以及我們怎樣才能從A走到B。

"變成人工智慧"系列回顧:

人類唯一的出路: 變成人工智慧 | 初篇 人類巨靈和大腦結構

排版 | 小魚

譯者 | 謝熊貓君(ID:mrxiexiongmao)

想要繼續閱讀,請持續關注我們的公眾號Wait But Why(ID:wbwtimurban)


推薦閱讀:

TAG:AI技術 | 人工智慧 | 科技 |