人類大腦宇宙最複雜?據說機器學習有辦法
在過去的幾年裡,傑克·格朗特(Jack Gallant)的神經科學實驗室發表了一連串聽上去荒謬至極的研究論文。
2011年,該實驗室證明,光通過觀察人在看電影時的大腦活動來再創造電影片段是可行的。僅通過掃描人在看電影式的大腦活動,計算機就能再生成電影的畫面,從某種意義上說這是讀心。類似地,2015年格朗特的科學家團隊通過觀察大腦活動來預測人們在想像哪一幅名畫。
今年,該團隊在《自然》(Nature)雜誌中宣布,他們製造了有關1萬個以上的獨立單詞處在大腦什麼位置的「地圖集」——僅僅通過研究在聽播客的參與者,來做到這一點。
他們是怎麼做到這一切的呢?通過使用機器學習(一種人工智慧技術)工具來分析海量的大腦數據,發現大腦活動的模式來預測我們的感知。
他們的目標並不是打造一個讀心機器。神經科學家們無意從你的大腦竊取你的銀行賬戶密碼。他們也無意知道你隱秘的陰暗想法。他們的真正目標要宏大得多。通過將數據科學轉變成一門「大數據」科學,以及利用機器學習來挖掘那些數據,格朗特和該領域的其他研究人員有潛力徹底改變我們對大腦的理解。
畢竟,人類的大腦是整個宇宙中最複雜的東西,我們對它無甚了解。格朗特實驗室的瘋狂想法是一個有可能會讓神經科學走出初期發展階段的想法,它就是:也許我們必須得打造機器來理解我們自己的大腦。他們的希望在於,如果我們能夠解讀錯綜複雜的大腦,那當大腦遭受疾病的時候,我們就能夠知道如何修復它。
功能性磁共振成像(fMRI)——我們當前用來分析大腦功能及其剖析圖的主要工具——在1990年代才出現,而它能夠帶給我們的有用信息也非常有限。
具體來說,fMRI能夠檢測的大腦活動的最小單位被稱為體素。通常來說,這些體素的體積要小於1立方毫米。一個體素中可能有10萬個神經細胞。德克薩斯大學神經科學家塔爾·雅科尼(Tal Yarkoni)如是說,看fMRI圖像「就像是在空中俯瞰城市,看到哪裡的燈是亮著的。」
傳統的fMRI圖像能夠顯示對特定行為很重要的寬泛區域在哪裡——例如,你可以看到我們是在哪裡處理負面情緒,又或者看到當我們看到熟悉的面孔時,大腦的哪些區域會亮起來。
然而,你無法確切知道那一區域在行為中具體扮演什麼角色,也無法知道其它不那麼活躍的區域是否也扮演重要的角色。大腦並不像各個單元都有著特定功能的樂高積木,它是一個活動網格。「大腦的每一個區域都有50%的概率與大腦中任何其它的區域關聯。」格朗特說道。
正因為此,簡單的實驗——鑒別大腦的「飢餓」區域或者「警覺」區域——無法產生真正令人滿意的結論。
「過去14年,我們一直在研究這些大腦活動斑點,以為所有的信息都包含在裡面——就這些斑點。」美國國家心理衛生研究所fMRI方法部門主管彼得·班德蒂尼(Peter Bandettini)表示,「結果發現,斑點的每一個細微差別,起伏的每一個細微差別,都包含有關我們大腦活動的信息,我們還無法完全挖掘這些信息。因此,我們需要機器學習技術。我們的眼睛能看到斑點,但無法看到活動模式。那些模式實在太複雜了。」
舉例來說,對於大腦如何處理語言的傳統觀點是,它發生在大腦的左半球,兩個特定區域(布若卡氏區和韋尼克氏區)是語言活動的中心。如果那些區域受損,你就無法產生語言。
但格朗特實驗室的博士後阿萊克斯·胡思(Alex Huth)最近證明,那種理解過於簡單了。他想要知道是否整個大腦都參與語言的理解。
在實驗中,他讓數位參與者聽兩個小時的故事播客The Moth,在此期間,他和同事用fMRI掃描器來記錄參與者的大腦活動。他的目標是,將聽單個詞語的活動與大腦活動的獨特區域關聯起來。
格朗特說,該實驗產生了許多的數據,多到人工無法處理的程度。但接受過發現模式訓練的計算機程序能夠處理那些數據。胡思設計的程序能夠生成一個展示每個單詞「生活於」大腦哪個位置的「地圖集」。
格朗特說,「胡思的研究表明,大腦很大的一部分都參與了語義理解。」胡思還證明,意思相近的單詞——如「poodle」(獅子狗)和「dog」(狗)在大腦中的位置相鄰。
那麼,像這樣的項目有什麼意義呢?在科學當中,預測就是力量。如果科學家能夠預測令人昏亂的大腦活動如何轉化成語言理解,那他們就能夠就大腦如何運作建立一個更好的模型。如果他們能夠建立一個可行的模型,那他們就能夠更好地理解當變數改變(即大腦生病)的時候究竟發生了什麼。
什麼是機器學習?
「機器學習」是一個廣義的、包括巨大軟體陣列的術語。在消費級技術中,機器學習技術正在飛快地加速發展——例如,學習如何「看到」照片中的物體的能力已經接近人類的水平。藉助名為「深度學習」的機器學習技術,谷歌翻譯服務已經從一款普通的基礎翻譯工具,變成了一個能夠將海明威小說翻譯成多種語言,且水平不遜於專業人員的機器。
但從根本上說,機器學習程序就是尋找模式——X變數與Y有關聯的可能性有多大。
機器學習程序通常都需要先接受數據集「訓練」。在訓練中,這些程序會尋找數據里的模式。通常來說,訓練數據越多,這些程序就會變得越「智能」,越精確。完成這些訓練後,機器學習程序會接收它們之前從未見過的、全新的數據集。有了那些新數據集,它們就能夠開始做出預測。
一個簡單的例子就是你郵箱中的垃圾郵件過濾器。機器學習程序掃描過足夠多的垃圾郵件——學習它們包含的語言模式——就能夠判斷新郵件是否是垃圾郵件。
機器學習可以是只是計算數學問題的簡單程序;又或者是像谷歌DeepMind那樣,吸收數百萬個數據點。機器學習也解釋了為什麼谷歌能夠打造出計算機來在像圍棋這麼複雜的遊戲中擊敗人類世界冠軍李世石。圍棋擁有的潛在走法數量比宇宙中的原子數量還要多。
神經科學家正將機器學習擁有幾個不同的目的,其中包括兩個基本的目的:編碼和解碼。
通過「編碼」,機器學習技術嘗試預測刺激物會產生的大腦活動的模式。
「解碼」則恰恰相反:觀察大腦活動的區域,預測參與者在看什麼。
(註:除了fMRI以外,神經科學家還可以在其它的腦部掃描形式上使用機器學習技術,如腦電圖EEG和MEG。)
俄勒岡大學神經科學家布萊斯·庫爾(Brice Kuhl)最近利用解碼僅依靠fMRI數據來重構參與者在觀看的面孔。
庫爾在MRI圖像中鎖定的大腦區域長期以來被認為與鮮活記憶有關。「那個區域是不是代表你所看到的東西的細節——又或者只是因為你對那個記憶有信心而亮起來?」庫爾說道。機器學習程序能夠依據那個區域的大腦活動來預測面孔特徵,這表明那是「你所看到的東西的細節」信息所在的地方。
類似地,格朗特預測參與者在想像什麼名畫的實驗揭示了心智的一個小秘密:我們所激活的大腦區域,跟我們親眼看到那些名畫,記憶視覺特徵時所激活的大腦區域是一樣的。
記者採訪的神經科學家都認為,機器學習目前還不能顯著改變他們的研究領域。一大原因就是,他們沒有足夠多的數據。大腦掃描需要很多的時間,且成本高昂。另外,目前的研究通常僅使用幾十個參與者,而不是數千個。
「在1990年代,神經影像才剛剛開始流行,當時人們關注的是各類物品的呈現——大腦的哪個部分看面孔,看單詞、房屋或者工具的又是哪個大腦部分呢,都是些廣泛的問題。」匹茲堡大學神經動力研究員艾尼爾·古曼(Avniel Ghuman)指出,「如今,我們能夠問些更加精細的問題了。比如,『某人正在回想的這個記憶是不是就是他大約10分鐘前思考的那件事情呢?』」
他說,這種進步「更多是漸進的,而不是革命性的。」
機器學習或有助於診斷和治療精神疾病
當前,精神病醫生還無法僅僅根據fMRI圖像顯示的大腦活動來診斷人們是否患有像精神分裂症這樣的精神疾病。他們必須要依靠與病患之間的臨床會話來進行診斷。不過,更多地以機器驅動的診斷方法可能能夠將不同的疾病狀態區分開來,進而幫助提供更好的治療方案。為了解決這個問題,美國國家心理衛生研究所的班德蒂尼表示,神經科學家們將需要能夠訪問龐大的萬份fMRI掃描圖樣本資料庫。
機器學習程序可通過挖掘那些數據集來發現預示精神疾病的模式。「這樣你就能夠開始在臨床上更多的使用這種程序——例如,讓人接受掃描,之後得出診斷,『根據這個萬人資料庫生成的這個生物標記,我們現在診斷出精神分裂症。他說。這方面的研究還處於初期階段,還沒能產生重大的成果。
不過,要是對大腦的網路相互間如何運作有足夠深入的理解,那就有可能「設計出更加先進的干預措施來修復大腦所出現的問題。」麻省理工學院計算神經科學家丹·雅明斯(Dan Yamins)說道,「干預措施有可能會是,給你的大腦嵌入植入物來在某種程度上治療老年痴呆症或者帕金森病。」
機器學習可能也有助於精神病醫生預測個體患者的大腦會對抑鬱症藥物治療有什麼反應。「目前,精神病醫生只能夠從診斷角度猜測哪種藥物更有可能對病人有效。」雅明斯說,「原因是病人表現出的癥狀並不能足夠有力地反映其大腦內部的問題。」
他強調稱,短期內這一問題可能還無法解決。但科學家們正開始想明白這些問題。《神經影像》(NeuroImage)剛專門發表了一期期刊來呈現有關預測個體大腦區別以及僅依靠神經成像數據來診斷的研究論文。
這是重要的進展。因為在醫療保健方面,預測能夠在治療和預防方面帶來新的方法。
機器學習或可預測癲癇發作
癲癇症患者無法知道其令人衰弱的疾病什麼時候會發作。「它是你的生活中的一大損害——你不能開車,它是個負擔,你不能像普通人那樣正常生活。」美國國家衛生研究院神經科學家克里斯蒂安·梅塞爾(Christian Meisel)指出,「對你來說,有個預警系統就好了。」
癲癇症的治療方法也不完善。部分病患整天都需要服用抗癲癇藥物,但那些藥物會帶來嚴重的副作用。另外,有大約20%到30%的癲癇症患者吃什麼葯都沒效。
預測或許能夠改變這種情況。
要是癲癇症患者知道即將要發作,那他們至少可以讓自己提前去到一個安全的地方。預測還可以改變治療選項:預警會提示設備給患者服用快速起效的癲癇症藥物,又或者傳達電信號來阻止疾病的發作。
這是梅塞爾分享的來自一位癲癇症患者的腦電圖。「圖像顯示沒有發作。」梅塞爾說,「但問題在於,這種腦部活動離發作還有一小時,還是還有四個小時呢?」
他說,要作出這種預測對於臨床醫生來說非常困難。
不過,有關即將帶來的發作的信息可能隱藏在那些波動裡面。為了測試這種可能性,梅塞爾的實驗室最近參加了數據科學社區中心Kaggle舉辦的一項比賽。Kaggle提供了三位癲癇症患者數年的腦電圖記錄。梅塞爾利用深度學習技術來分析那些數據以及尋找模式。
該技術在根據腦電圖來預測癲癇症的發作上能起到多大的作用呢?「如果說你有個能夠預測一切的完美系統,那你拿到1分。」梅塞爾說,「如果你有個像拋硬幣那樣隨機判斷的系統,你有0.5分。我們現在有0.8分。也就是說我們現在的預測還無完美,但要比隨機系統好得多。」(那聽上去很不錯,但這種方法目前更多是理論上的。這些病患是通過侵入性的顱內EEG來進行監測的。)
梅塞爾是一位神經學理論家,在致力於繪製模型來呈現癲癇症的發作如何從小範圍的腦部活動發展成為令人衰弱的「風暴」。他說,機器學習正成為一項很有用的工具,有助於他改進他的理論。他可以將他的理論納入機器學習模型,然後看看它會提高還是降低該系統的預測準確程度。「如果該系統可行,那我的理論就是正確的。」他說道。
神經科學將需要成為一門大數據科學
機器學習不會解決神經科學領域的所有重大問題。它可能會因為來自fMRI和其它腦部掃描技術的數據質量而受限。(fMRI充其量只能帶來模糊的大腦圖像。)「即便我們有無限量的腦部成像數據,你也無法得出完美的預測,因為那些成像技術很不完善。」為神經科學家開發機器學習工具箱的計算科學家蓋爾·瓦羅夸克斯(Gael Varoquaux)指出。
然而,至少記者所採訪的神經科學家都為機器學習感到興奮,因為它能夠讓科學變得更加明晰。機器學習解決的是一個被稱為「多重比較問題」的問題,在這一問題中,研究人員實質上是在他們的數據中盲目尋找數據統計上顯著的結果(有了足夠多的大腦掃描,某個區域的某個地方就會「亮起來」)。而有了機器學習,要麼是你有關大腦行為的預測是對的,要麼預測是錯誤的。「預測是你能夠控制的東西。」瓦羅夸克斯說道。
大數據方案也意味著神經科學家或許能夠開始在實驗室以外研究人類的行為。「我們所有有關大腦活動如何運作的傳統模型都基於非常人工的實驗環境。」古曼指出,「我們不能完全確定它們在真實環境中會有同樣的成效。」如果你有足夠多大腦活動和行為方面的數據(或許來自可穿戴的腦電圖監測器),機器學習或許可以開始尋找大腦活動和行為之間的聯繫,無需任何人造的實驗。
機器學習在神經科學領域的應用還有一個可能性,它聽上去像是科幻概念:我們能夠將機器學習技術應用在大腦上,從而打造更好的機器學習程序。過去十年機器學習領域最大的進展就是一個名為「卷積神經網路」的概念。谷歌正是利用這種網路來識別圖像中的物體。這些神經網路基於神經科學理論。因此,隨著機器學習對大腦運作的理解的加深,它就會變得更加智能,會習得新的技能。那些有了改進的機器學習程序能夠反過來應用在大腦上,那樣我們就能夠進一步學習神經科學。
(研究人員還能夠從受訓複製像看東西這樣的人類行為的機器學習程序獲得洞察。也許,在學習那種行為的過程中,該程序將能夠複製行為發生時大腦的運作方式。)
「我不希望人們以為我們快要做出讀心設備了;這並不屬實。」瓦羅夸克斯說,「我們的希望在於,得到更加豐富的計算模型來更好地理解大腦。我認為我們將會做到這一點。」推薦閱讀:
※揭示你複雜命運的「十神」2:日元為己的十神例舉表-見海渝曦-搜狐空間
※職場中,如何處理複雜的人際關係?...
※八字中時辰的重要性和複雜性
※改名如此複雜
※權謀文化的流行與詭詐複雜的中國人(陶東風)