淺談聲音的加工
文/ @庚潤
我們為什麼能聽到聲音?如果你的回答是「因為有耳朵」,那就未免太片面了。耳朵只是「聽」這個過程的第一站,要識別聽到了什麼,聲音是誰發出的,還需要幾個非常關鍵的區域。下面,請各位看官坐穩扶好,我們即將進入聲音加工的世界。
簡單地說,耳朵在「聽」的過程中起到了提取聲音信號的頻率信息的作用(主要由耳蝸完成),即做傅里葉變換,雖然這只是「聽」的第一個階段,但耳朵的構造之驚奇、設計之巧妙(圖1),還是給我留下了非常深刻的印象。關於耳朵的構造和功能,並不在今天的旅行範圍之內,我們再找時間細細說來。
聲音信息經過耳朵之後又是如何被加工的呢?首先,耳蝸提取的聲音頻率信息經由聽神經傳遞到腦幹中一個叫耳蝸核(cochlear nucleus)的神經核團,耳蝸核中的神經細胞負責進一步的聲音加工,這些神經細胞有著不同的偏好,有的在聲音來臨時開始劇烈的放電,有的則在聲音結束時劇烈放電,還有的會對某個特定的聲音信號頻率有很強的反應。
接下來,耳蝸核中的神經細胞將信息傳遞給同樣位於腦幹的上橄欖核(superior olive)。由於這個神經核團的形狀很像一枚橄欖,故得名上橄欖核,基於核團的形狀對其命名是神經科學領域常見的做法,接下來的幾個聲音信息加工節點的名字都跟它們的形態有關,我們後面會提到。上橄欖核主要負責聲音的定位,由於雙側上橄欖核都會接收到來自於同一側的耳蝸核的信息輸入,依靠聲音信號到達雙耳的時間差,就可以定位出聲源的位置。
聲音信息傳輸的下一站是下丘(inferior colliculus),這一神經核團也是根據形態命名的,「丘」是小山包的意思,圖2中綠色的部分就是下丘。下丘的上面有兩個小突起,它們的名字是上丘(superior colliculus),上丘在視覺的運動信息加工中起到非常重要的作用。今天的主角是聽覺信息加工,我們繼續說下丘。下丘接收上橄欖核的輸入,對聲音的頻率信息進行更加細緻的加工,下丘中的神經元對聲音持續的時間和頻率都比較挑剔,比如某個神經元特別喜歡持續5ms,頻率為4Hz的聲音,而對其他持續時間和頻率的聲音信息置之不理。
下丘會將信息傳遞給位於丘腦的內側膝狀體(medial geniculate nucleus, MGN),內側膝狀體又是一個因形態而得名的核團,大概是為它命名的科學家覺得它比較像膝蓋吧(如果讓我去命名估計不會想到膝蓋,(*/ω\*)),圖3中綠色的區域就是內側膝狀體。內側膝狀體的兩側也有兩個小突起,它們叫外側膝狀體(lateral geniculate nucleus, LGN),是視覺信息傳輸的關鍵節點。內側膝狀體接收下丘的輸入,它對聲音信號的挑剔程度比下丘還厲害,其時間感受野更大,比如某個神經元特別喜歡持續15 ms,其中前5 ms頻率為4 Hz,5-10 ms頻率為3 Hz,10-15 ms頻率為2 Hz的聲音,而對其他持續時間和頻率的聲音信息置若罔聞。
信息在內側膝狀體加工完畢後,終於要到達大腦皮層了。初級聽覺皮層(primary auditory cortex)位於顳葉(圖4),聲音信息在這裡會被更加細緻的加工。聽覺皮層的神經元比內側膝狀體還要挑剔,它們的時間感受野更大,舉個例子,某個神經元會特別喜歡持續時間為25 ms的一段聲音,且這段聲音的前10 ms必須是2 Hz,後面的15 ms必須是4 Hz才能滿足它的歡心。一段聲音可以被分解成多個時間窗(比如1 s的聲音就可以分為40個長為25 ms的時間窗),每個時間窗內的聲音又是由不同的頻率疊加而成,在聽覺皮層中可以找到偏好這一時間窗內聲音信息的神經元,不同偏好的神經元在時間維度上整合起來,就知道這1 s的聲音到底是什麼了。
最後,我們再來回顧一下這次聲音加工之旅(圖5),聲音信號經過耳蝸、耳蝸核、上橄欖核、下丘、內側膝狀體和聽覺皮層的一步步加工後,我們就可以get到聲音的信息了。
參考文獻:
[1]. Paradiso M A, Bear M F, Connors B W. Neuroscience: exploring the brain[J]. Hagerstwon, MD: Lippincott Williams & Wilkins, 2007, 718.
歡迎閱讀我的其他文章:
大腦皮層中各層的分工
酒精成癮的神經機制
發現動作電位的發生機制——Alan Hodgkin & Andrew Huxley
也歡迎大家關注我們的其他平台:
- 微信公眾號:腦人言(ibrain-talk)
- 網易號、知識星球、新浪微博:腦人言
推薦閱讀:
※一個大腦,有沒可能同時容得下兩個人?
※互聯網大腦、大社交和虛擬現實夢境,2016年互聯網三大趨勢
※為何你睡一覺後你覺得腦子更好使了?
※人工智慧正在激活互聯網類腦系統,2018年,雲腦將成為新熱點
※我的大腦???