人是怎麼感知聲音頻率高低的?

聽到一個音,人能感受到一個音調。這個過程在腦中具體是怎麼發生的呢?網上有說法是人腦會把聲音的頻率數出來,我感覺這個說法欠妥:首先,高頻聲音每秒幾千次甚至上萬次的振動怎麼數的清?其次,今天我測試了在無干擾下,能在 440Hz 附近分辨出 0.4Hz 偏差的兩個音,這麼小的差別人腦不會數錯嗎?


我喜歡「人腦會把聲音的頻率數出來」這種說法。話糙理不糙。


解剖學的角度,人耳主要分為三部分:外耳——鼓膜腔體(Tympanic cavity)——內耳(下圖1,2,3);

信號轉換的角度,聲音被大腦感知走過:機械——神經電信號——中樞信息處理這一過程;

機械聲傳播的角度,聲音先後經歷了:空氣傳播——機械傳播——液體傳播

聽個聲音,也挺不容易的。

人耳構造 [https://en.wikipedia.org/wiki/Auditory_system]

一、外耳

外耳分為:耳廓,耳道和耳骨

  • 耳廓 (Pinna):對聲音的空間感知(Spatial hearing)有重要作用。比如,閉上眼睛,一個高頻聲音分別在前後方播放,由於耳廓的特殊形狀,聲音在耳廓上發生的反射不同,導致傳導到內耳的聲音不一樣,因此人能判定聲音的前後位置。這個叫做spectral cue。當然這只是對於高頻聲音,在低頻由於波長很大,閉上眼睛人很難分清前後。

YouTube上面有人做了個非常有趣的實驗:把他兒子的眼睛蒙上,他在周圍拍手,孩子總能指向正確的方向;之後,他用橡皮泥貼到孩子的耳廓上,然後孩子就迷失了。

用Spectral cue獵殺無人機

不止耳廓,人的頭部和上半身都會影響人對聲音的感知:他們聽到的聲音都不一樣!

  • 耳道 (Ear canal):外側連接耳廓,內部止於鼓膜。成年人的耳道平均長2.7厘米,直徑在6-8毫米之間。類似於1/4共振器,共振頻率在3kHz左右,這也是人耳最敏感的頻率部分。對f&>3kHz的聲音,耳道扮演著功放的角色
  • 鼓膜(耳膜, eardrum):類似於音響的振動膜(membrane),只不過小很多,只有85平方毫米,有效面積不過55平方毫米,厚度大約0.1毫米。外耳接收到的聲音,被鼓膜接收併產生振動,傳入下一環節——鼓膜腔。

二、鼓膜腔 (Tympanic cavity)

鼓膜腔中充滿空氣,為了平衡外界大氣壓,與耳咽管相連。從鼓膜到鼓膜腔中,依次連接三塊骨頭(聽小骨,Ossicles):錘骨,砧骨和鐙骨,這三塊骨頭將聲音傳遞給卵圓窗(oval window),進而傳導到內耳的耳蝸處。

其中,鐙骨連接鐙骨肌,起到「保險絲」作用。當傳入聲音超過85dBHL (HL為「聽力級」,聲壓級通過個體聽力敏銳度補償之後的值),這塊肌肉通過延遲來保護內耳。

體現人聽力系統敏銳度的雙耳Audiometry,表示不同頻率的純音最低多少分貝能被人聽見 [1]曾經見過一個玩搖滾的哥們,紅藍兩條曲線都在10dB以下,他知道之後很鬱悶……

從下圖可以看到,從鼓膜到三塊骨頭再到卵圓窗,他們從尺寸上是逐漸變小的。為什麼呢?因為耳蝸中不再是空氣,而是淋巴液。如果鼓膜腔和耳蝸直接相連,那麼人類的世界將會是安靜的——由於阻抗變大,加上鼓膜振動產生的壓力不夠大,聲音幾乎會被完全反射!而經過鼓膜-錘骨-砧骨-鐙骨-卵圓窗這一系列傳導,壓力被放大,以確保聲音能夠進入最後一道工序。這一過程也稱阻抗匹配 (Impedance matching)

鼓膜腔 [https://en.wikipedia.org/wiki/Eardrum]

聽小骨的振動以紅色線為軸 [2]

除了通過鼓膜腔傳導聲音至內耳,還有另一種傳導方式——骨傳導。最直觀的例子,把耳朵捂住(假設我們有萬能的大手),還能聽見自己的說話聲音。是不是含糊不清?那是因為骨傳導的聽覺敏感度遠比常規的耳道傳導低得多。

三、內耳

如果把人比作聽力系統(Auditory system),那麼內耳的重要程度相當於大腦。聲音將在這裡轉化成電化學信號,並被中樞聽覺系統處理,分析並感知。

內耳,尤其是耳蝸的構造讓我不得不感嘆,人的確是這個星球上最精密的機器。

鐙骨連接骨迷路 (bony labyrinth), 裡面充滿淋巴液,最→_→那頭蝸牛就是耳蝸 (cochlea)。把這頭蝸牛抻平,大約有30-35毫米,直徑0.3-0.9毫米。聲音在耳蝸中發生質變,終於從機械信號變成了電信號。簡單說,在耳蝸裡面,聲音走過了如下路徑:

—— 聲音從基底膜(Basilar membrane)上面的腔體進,下面的腔體出 ,引起基底膜振動

—— 毛細胞 (hair cell)上面的纖毛檢測到振動,轉化成電信號

—— 電信號通過軸突,傳遞給大腦處理

—— 咦,我好像聽見了什麼?

在柯蒂氏器(Organ of Corti)上面,分布著近2w個毛細胞,每個毛細胞上面又有50-150個纖毛(有密集恐懼症的就別細想了,耳朵里居然住著這麼個妖怪)。

骨迷路。那個蝸牛是耳蝸 [3]

耳蝸橫斷面 [3]

柯蒂氏器放大圖 [3]

耳蝸的另一個牛逼功能,是「傅里葉變換」,不同部位採集不同頻率。

耳蝸外部的基底膜剛度較高,因此只有高頻能激起這部分的振動,進而被毛細胞感知;而耳蝸內部相反,剛度較低,因此這部分毛細胞主要檢測低頻。這和音響同理,低音炮往往很大,剛度低; 而高音Tweeter則小很多,剛度高。因此,人類才得以區分各種不同頻率的聲音,比如貝斯比吉他更低沉,女人比男人語調更高等等。

耳蝸外圍(白框)接收高頻,中心部位(紫色框)接收低頻 [3]

另外,在同樣大小的空間,捲曲狀的耳蝸要比直版的耳蝸接收到更低的頻率,才讓人能聽到20Hz的低頻。

如果耳蝸是右圖曲線的形狀,人能聽到的最低頻率大概只能到100Hz左右。那麼重低音炮也就沒有了存在的價值。[左圖來源:http://www.davidrokeby.com/Culturall2/21_ear.html]

題外話,不得不吐槽中文的直觀性:

耳蝸=在朵內,形似牛的器官

cochlea=??

查過才知道,是從希臘語κοχλ?α? (kōhlias)引進過來的,直譯:螺旋的蝸牛形狀。英語在很多詞上都直接引進外來語,一點首創精神都沒有……

詞語的直觀性這一點,德語和中文一樣優秀:H?rschnecke。H?r:H?ren(Hear)的詞根,Schnecke=snail=蝸牛。


扯了這麼多,回到題主的問題:

聽到一個音,人能感受到一個音調。這個過程在腦中具體是怎麼發生的呢?

已解答。

網上有說法是人腦會把聲音的頻率數出來,我感覺這個說法欠妥:首先,高頻聲音每秒幾千次甚至上萬次的振動怎麼數的清?

數的清,只不過不適用大腦來數,它還有更重要的事情去做,這種糙活兒交給基底膜和毛細胞就可以了。

其次,今天我測試了在無干擾下,能在440赫茲附近分辨出0.4赫茲偏差的兩個音,這麼小的差別人腦不會數錯嗎?

Psychoacoustics(心理聲學)這本書告訴我們 [4]:

500Hz一下,人耳能區分差別1Hz的純音;500Hz以上,這個區分值(有專業稱呼,Just-Noticeable Frequency Differences,簡稱JNFD)為0.002*頻率值。比如,在1000Hz能聽出2Hz的區別。不過這些都是基於平均值。題主很可能基底膜剛度的gradient比較細分,外加多長了一些毛細胞;)

剛好趕在2018年的尾巴寫完這個回答。祝大家2019新年快樂!

想了解更多聲學的科普/獵奇/冷知識/工業應用/前景,歡迎圍觀我的專欄

可以聽的黑科技——聲學?

zhuanlan.zhihu.com圖標

以及我的公眾號

子魚說聲學


參考:

[1] Janina Fels. RWTH Course: Medical Acoustics

[2] Brandon Pletsch: https://www.youtube.com/watch?v=PeTriGTENoc (和交響樂結合的動畫演示非常生動)

[3] Jennifer Kincaid: https://www.youtube.com/watch?v=epjV4bD_8rU (分解圖做的很細緻)

[4] Zwicker, E., Fastl, H. (2013).Psychoacoustics: Facts and models(Vol. 22).


首先耳蝸對不同頻率的聲音在不同的位置有響應,不同位置的基底膜的振動(實際上是毛細胞的擺動),會由不同的聽神經細胞接收。

耳蝸展開頻率響應示意

聽覺神經(Auditory Nerve)對頻率的編碼有兩種方式:

1) 位置編碼(基於耳蝸基底膜振動所在位置的編碼),即不同的聽神經所編碼的頻率是不一樣的,簡單而言,大腦要知道是什麼頻率,只要知道是編碼什麼頻率的聽神經在放電就可以了。

聽神經的位置編碼

2) 時間編碼(數頻率),左邊第一列的圖是不同頻率的聲音信號,後兩列是聽神經的放電。可以看到,動作電位只在聲音信號sin波形的某一相出現,因此,這種情況下,神經元放電的頻率和聲音的頻率是正相關的。

聽神經的時間編碼

但是題主你也問了,神經元怎麼可能放電放的那麼快呢?人耳能聽到的聲音頻率高達20kHz,動作電位最快只有1000Hz。這時候我們就要祭出齊射理論了:簡單來說就是我有很多很多的聽神經,都編碼一個頻率,雖然單個神經元放電沒那麼快,但它們加起來就能趕上聲音的頻率了。

齊射理論(他們說名字其實來源於打排球???

但是,還有一個但是,題主你的感覺是對的,當頻率高到一定程度的時候,聽神經其實已經不會「數頻率」了,也就是對於高頻聲音,位置編碼更多而時間編碼很少。看下圖的單細胞記錄(這是在毛細胞的胞內記錄,而非聽神經,是聽神經的上游),可以看到在2000Hz以上,毛細胞就越來越少隨著聲音的相改變自己的電位了,到4000Hz就已經完全看不到sin波形,而只是平平的一條高電位來表示:啊有個4000Hz的聲音出現!(跟不上節奏了23333)

至於你說會不會「數」錯,在相對低頻的範圍內,時間編碼仍然生效,大腦要做的僅僅是比較聽神經放電的時間差就可以判斷出頻率上的區別,因此還是相當敏感的。然而頻率越高,雖然每條聽神經響應的頻率範圍變窄了,但是同時卻失去了時間編碼,因此,「數頻率」不再現實,更多的是依靠位置編碼以及其它一些線索來判斷頻率的區別啦。

大概就是這樣啦,頻率的區分在聽覺系統最基本的功能,所以幾乎用聽神經的放電就可以講清楚了。人工耳蝸目前發展的一個重要目標,就是復原對頻率的編碼。由於體積等等限制,人工耳蝸往往不能有跟耳蝸一樣多的信道(毛細胞)來傳遞頻率信息,雖然時間編碼有些能得到保留,但是聽覺神經的位置編碼不再有高的精度,因此佩戴人工耳蝸的人能夠聽懂語言,卻沒有辦法享受音樂的美好。

另外一說,是對頻率的時間編碼,從聽神經,中間經過中腦丘腦等等核團,一直到聽覺皮層,是層層遞減的。這些核團根據對聲音的不同需要,比如說判斷音色、區分語言中的停頓、欣賞音樂、感受節奏等等會將來自聽神經的信號進行很多不同的處理來提取其中的特徵,因此,對絕對頻率的判斷雖然重要,但已經不是那麼重要了。

與此同時,位置編碼仍然存在,不同頻率的信息直到聽覺皮層依然有由不同位置的神經元來進行處理。

參考:

Perception Lecture Notes: Frequency Tuning and Pitch Perception?

www.cns.nyu.edu圖標https://health.uconn.edu/meds5377/wp-content/uploads/sites/151/2017/07/PALMER-Auditory-Nerve-Physiology-ARP.pdf?

health.uconn.edu


我最喜歡 @王誒 的回答。因為他的回答是我在知乎這麼多年見到的第一個將耳蝸不同位置感受不同頻率這種很有局限性的回答拓寬到同樣在不同時間編碼頻率的。同樣重要的還有auditory pathway上的齊射理論。頻率的認知並非發生在聽覺中樞,而是有一個僕人屁顛屁顛跑來對聽覺中樞說:「主子,這個音高點兒」

插個題外話:通常如果我們附近有一個突發的很大聲的事件,我們往往先「嚇一跳」,然後才能意識到這個聲音的音色。這就是因為聲音的傳遞是從耳蝸到腦幹、中腦、最後才到達皮層的聽覺中樞。

Auditory pathway

近年還聽說一種所謂top-down process,意思是聽覺系統會自上而下對耳蝸的接收能力進行調整,以便能夠更好地接收周遭的聲音。我只知道有些人、有些動物能夠調整耳廓來感知聲音位置,但還不知道耳蝸也能「動」?感覺像是玄學。但應該是確有其事。誰比較了解,希望能給我講講,先謝謝了。

題主問到440Hz附近加減0.4Hz的聲音可以判斷。從音樂的角度來說,一個八度跨越2倍頻率,而一個八度內將音高分為1200個音分,假設人能夠分辨的最小頻率單位是1音分。那麼在440Hz到880Hz這個範圍內的1音分,和從4400Hz到8800Hz這個範圍內的1音分相比,顯然後者更大一些。這是因為人對聲音頻率的認知不是線性,而是對數關係。

不過我也要對題主的測試方式說兩句。通常我們進行聽音測驗要進行盲測,盲測不是說讓你閉上眼睛,而是要讓你在不知情的情況下來分辨聲音。所以要進行這種測試,你不能自己測自己,而是要請一個朋友來輔助,他來出題你來答(他選擇440.4或者439.6Hz的聲音,讓你來分辨),這樣才能避免自己的心理暗示對聽覺認知的影響。


耳蝸展開後是一個帶狀的結構,不同的位置響應不同頻率的聲音的。

下面這個視頻可能會更加直觀一些。前半段沒有聲音,後半段才有,為了保護耳朵,把音量調小些。


這個是聽覺生理的研究內容。

目前所知是耳朵內有很多小細毛,叫聽毛,這些小細毛連接神經。

不同的細毛粗細長短不同,對不同頻率振動的響應(共振)不同。

神經通過分辨不同聽毛的反饋,辨別頻率。


樓上的關於人耳答疑已經很詳細了,人腦肯定會出錯的,所以才有電腦的出現,還有更精準的儀器、聲壓級、頻譜分析儀來協助人們去分辨聲音的頻率


用專業的聲學測試儀器,通過測試分析頻譜是最科學有效的。


知道收音機嗎?他收的電磁波,人耳應該收的縱波(聲波),中間的調製解調應該可以類比。(個人推測)


您好!謝了,好好看看大俠子魚的精彩回答吧!


推薦閱讀:

感測器融合-任務篇
如何訓練你的感知思維!
任正非:人感知自己的渺小,行為才開始偉大
感知時間 感知生活
我們活著選擇堅持,某些時候經歷越多,感知絕望隨之到來,如果都選擇放棄會怎麼樣?

TAG:聲音 | 感知 | 認知神經科學 | 樂感 | 絕對音感 |