聲音的距離感是是如何產生的?

今天突然發現酷我音樂盒有一個美音的功能,開啟之後耳機內的聲音突然感覺被拉近了,感覺就歌手就在面前演唱。還有很多3D音頻也是一樣的效果。我想知道是什麼使人產生聲音的距離感?


聲源就像一滴水滴,空間就像池塘。

當聲源在空間中發聲,就像水滴滴在池塘里泛起的漣漪。
離水滴低落點越近的地方,波浪越大越快;
離聲源越近的地方,聲音越響。

水滴在水面二次彈起,引發第二輪漣漪(聲源在空間中引發回聲)。

漣漪(聲源)傳啊傳,越往外越是虛弱。

直到最後,漣漪泛得太遠而虛弱得退卻了(聲源傳得太遠而衰減了,因為能量完全散布到了很大的空間里)。

當然,這個比喻只是用二維的水面,而無法概況三維的VR。
—————————————————————————————————————
下面言歸正傳,分享一下在VR中,玩家判斷音源遠近的幾種途徑:
1、響度(Loudness)

響度是最直接、最明顯的拉開聲音距離的方法,比如我彈鋼琴的時候,以漸強開始,漸弱收尾,就是在營造這種距離感的變化,就好像一段聲音來了,經歷了一些波瀾起伏……又走了。)

現實生活中聲音的衰減是這樣的(很像上面池塘里泛起的漣漪吧?)

聲音的振幅

不過它也是最容易誤導我們的。如果只有響度,而缺乏其他的參考,我們不能判斷聲音從音源傳到這裡被削減了多少,然後判斷的距離難免有誤差。

不過還好隨著我們對身邊周遭的熟悉,人們的說話聲、狗吠貓喵、機動車的喇叭聲……這些都讓我們能夠很快地判斷出聲音距離的遠近。而我們周遭的這一切,生活中常聽見的聲音,構成一個可以參考的相對體系,你根據你過往在這裡的生活做出的判斷。

但是,碰到那些人工合成的或者從來沒有聽過的聲音,那我們就只有藉助於其他的輔助聲音暗示,比如音量的大小變化,來判斷了。

—————————————————————————————————————
2、初始時間延遲(Initial time delay)

當你走進一個空間時,先聽到聲源直接傳到你耳朵里的聲音——direct sound,然後再聽到的則是回聲(reflection),而你的房間越大,這兩個聲音的時間差越大。

比如你在一個很大的房間里,先聽到了聲源直接傳到你耳朵的聲音,然後過了很久才再次聽到這個聲源的第一次回聲,所以你的聽覺神經告訴你,這個房間很大。

(聲音的第一次反射對於判斷聲音的距離感是優先順序最高的,而其他隨後趕到的第三次、第五次、第七次反射後的回聲都沒那麼重要,因為現在計算性能不夠,所以只做第一次反射的回聲。)

而人聽到同一個聲源的這兩種聲音之間有一個時間差叫Initial time delay。

如圖,A和B的間隙越小,則聲音離我們越近。

不過在裝有消聲裝置的Anechoic ,或者沒有回聲(echoless)的開放環境里,比如一望無際的沙漠或大草原,Initial time delay這種判斷聲音距離的方式也失效了。

—————————————————————————————————————
3、混響(reverberant)

先來看看混響是怎樣產生的?
聲源發出聲音,在整個環境中擴散:

當聲音擊打在你的頭部時,你的頭部折射、反射、遮擋一部分聲音。

當有一面牆壁反射它的聲音,則形成了回聲(reverb)。
這些回聲告訴我們:

  • 這個空間有多大?
  • 這個空間的表面是什麼構成的?(比如石頭做的室內聽起來就和木頭構成的室內完全不同)
  • ……

聲音在很多牆壁、很多物體的表面產生回聲,匯合(重疊、覆蓋、交織)在一起則形成了混響,聽起來很像白噪音。

在一個充滿混音(reverberant)的環境里,聲音的渲染會很複雜,比如在某個音源,它的尾音拖得很長,迴音很遲鈍,然後瀰漫在整個空間里,還會影響到其它的聲音,在表面反彈,最後才慢慢衰減下來……

你聽到直接聲音(direct sound)之後隨後混響(late reverberation)越快,則說明離你越近。

—————————————————————————————————————

4、運動聽覺差(Motion parallax)

parallax這個詞我沒法翻譯,你看東西的時候左眼看到一個圖像,右眼看到一個圖像,左眼和右眼之間的差別叫做parallax,聲音同理……離你越近的聲源parallax越大,類比一下你左右眼看東西的時候,離你越近的東西,左眼右眼看到的圖像差別越大,而離你越遠的parallax越小。

而Motion parallax,則說明聲源是在運動的。我打個比方,近處的昆蟲可以很快地從你的左邊移動到你的右邊,而遠處轟鳴的飛機則可能要花幾十秒……或者說,如果一個運動的聲源相對於一個靜止的聲源又很快的移動的話,就相當於它離我們很近,就像那隻昆蟲。

—————————————————————————————————————
5、高頻衰減(High Frequency Attenuation)

經常受到溫度和濕度的影響。高頻的聲音比低頻的聲音衰減的更快,這一點可能從小練習音樂的人聽得更清晰,比如一個10Khz的聲音可能要經曆數千米才會有顯著的衰減(可被正常人發現的衰減)。

它用衰減(attenuation)的手法來表distance的感覺。聲音離你越近,你能聽到的細節也就越多。

空氣吸收(air absorption)效果。

—————————————————————————————————————
6、多普勒效應(Doppler Effect)

當一個音源靠近的時候音調變高,遠去的時候音調變低。通過計算聲源和用戶的相對速度,VR中也可以模擬出Doppler Effect。

(比如說話的人、汽車喇叭這些都是具有方向感的聲音資源(directional sound sources),它們的衰減也是定向衰減(directional attenuation)或者angle-based attenuation。)
—————————————————————————————————————
7、聲源被遮擋(occlution)

我們一般用低通道濾波器(low passed filter)模仿『遮擋』的效果:

當聲源傳播過來被物體遮擋時(相當於你的耳朵和聲源之間隔了一個東西)

低頻率的波段會被衍射(diffraction),然後才到達用戶的耳朵里。

所以叫低通道濾波器(low passed filter)。

比如你在場景里放了一把吉他

當你走到靠近牆壁時,聲音被牆壁擋住了

參考:

  • Localization and the Human Auditory System
  • https://www.youtube.com/watch?v=Na4DYI-WjlI

謝邀,這是個好問題。其實 @貝塞克 已經說得很清楚了。

更具體一點說,得弄點聲學資料了。

不過原則都是一樣的:通過模擬自然界情況,利用人耳對自然音的固有經驗,達到欺騙耳朵的效果。畢竟最後還是從兩個音箱(或耳機)的單元里發出來的不是?

【頻率】
這一塊應該是高中物理就有的內容,低頻振動慢,波長長;所以繞過障礙物的能力強。反之高頻則弱。自然界中的遠處聲音傳播到人耳中時,往往高頻成分會削減很多,不刺耳。

因此要表現距離近,提升高頻,反之衰減。但低頻並不是反過來的情況,這個後面講。


【響度】
很簡單的事情,隔得近就大聲,越遠聲音越小。這裡十分簡單不多說。
然而重點是等響曲線。
人耳在自然界進化出了一套保護措施,對自然界遍布的低頻噪音並不敏感(不然一天到晚耳鳴誰受得了),所以那些安靜的旅遊區山上河邊,雖然用專業聲壓計一般測出來有40-50db的噪音(a計權),但人耳是幾乎沒有感覺的。

物理聲壓和人耳實際聽到的響度對應關係如下圖。

可以看到20hz低頻對應的點上,物理聲壓在70db時,人的感覺只有10db不到。這個差距遠遠大於聲波衍射的衰減。

所以要表現距離遠,應該是衰減而不是提升低頻。如果只根據高中物理來判斷,得出來的結論就完全相反了。

【混響】
這裡內容較複雜,是講同一首歌中不同樂器距離感的塑造,非音樂生產者可以跳過。


這裡先以主流的hall room plate分類來講,其餘分法暫不討論;若有紕漏和錯誤請多指教。

pre-delay(預延遲),即直達聲和第一次反射聲到達人耳的時間差。好比在山谷喊話,迴音到達的時間很長,所以顯得山谷很大一樣;這個值越大,越顯得整體聲場龐大。通常配合中低頻足的hall類混響使用。

early-reflection(早反射),從字面理解,是反射次數較少,最早到達人耳的第一批混響聲,通常在50ms以內。早反射的量越大,聲源越靠後。room類混響比較強調這個。

plate類混響不產生聲場,對距離感並沒有直接影響,不過Plate偏中高頻,以上文頻率部分來看,影響就很容易理解了。

最後當然就是乾濕比例了,混響越小,通常說來越近;貼耳的效果幾乎只加一點點的plate,比如方大同很多歌曲的人聲。

最後回到題主的問題;酷我音樂盒的「美音」並不是把距離拉近了,而是用image類效果器把聲場左右寬度拉寬了,相對比之下,縱向(前後)的聲場就變窄了。

具體原理牽涉到相位,在此不細講,又是另一個領域了。總之,不建議這種無視創作者(混音師)混縮結果,用音頻效果器進行二次修改的行為;不僅會帶來更多的失真(那聽無損還有什麼意義),也違背創作者的表達初衷。


這個問題跟很多事情都有關係,從比較廣義的角度,我們需要考慮聲音的定位問題,不僅僅是距離,還有方向。影響人們對聲音位置判斷的因素從顯現特性來看有振幅強度、相位偏差、頻率響應曲線、回聲和混響等等,這些最終可以用頭相關傳輸函數(HRTF,Head Related Transfer Function)來概括和建模。
通過對原始音頻數據應用HRTF相關的演算法,就可以調整人耳對聲音的感受。這個技術好多人都在玩,我比較喜歡一個Dolby耳機的插件,可以掛在foobar裡面,在使用耳機聽歌的時候,可以有一定的音箱感(緩解頭中效應)。
說回這個問題裡面舉的例子。我基本沒有用過酷我音樂(可能幫家裡人裝過),聽說聲音被拉近了,我也很好奇,開始猜測也是是頻響曲線上做了調整,突出了人聲部分(不同的耳機頻響曲線不一樣,聽同一首音樂,人聲的距離感會略有區別)。
懷著強烈的好奇心,我下載並安裝了酷我音樂(版本號V8.0.3.1_BDS12,更新日期是10月30日)。

安裝過程很危險,差點被贈全家桶。以至於我差點兒有了跑題的衝動。
安裝完成後,我用這個軟體聽了一首朗嘎拉姆的《愛人》,耳機使用拜亞動力的DT880。打開美音效果後立刻有了感受。
聲音這個東西的奇怪就在於每個人的HRTF是不一樣的,所以我沒有覺得人聲變得更近了。
我的感受是聲場完全亂了,從聽覺上仔細體會,感覺是左聲道先出聲,右聲道隨後跟上(是的,用耳機仔細聽就能體會出來),頻率響應曲線沒有明顯可聞的變化。
這樣的處理手法使用音箱聆聽的時候,可能不會有這麼細緻的體會,因為左邊音箱的聲音會很容易進入右耳朵。當然,使用音箱聆聽與使用耳機的感受又會不一樣了。
為了驗證這個想法,我使用Audition軟體模擬了這個效果,把右聲道延遲30ms後播出效果基本一樣。參見下圖:

這種美音處理方式是簡單的,效果是有的。但我不覺得這是「美」的,當然也許大部分人已經覺得足夠「美」了,這個軟體的目的基本達到。
當然,也希望這個行業的大俠們能進一步鑽研,不斷的進步,把更美的聲音帶給每一位聽眾。


亮近暗遠;大近小遠;混響小近混響大遠


增強了立體聲效果而己,演算法不一樣,可以去了解一下3D人頭錄音相關。
至於混音中有這作用的,擴大聲場(立體聲擴展),lowpass,高低頻激勵,擴展,標準化壓縮,混響等等都能提高響度,擴大聲場。


聲音即有左右的聲向 也有縱深感,最簡單的 音量越大的越靠前 音量越小的靠後,混響小的靠前 混響大的靠後


通過音量大小


推薦閱讀:

男生聲音像女生怎麼辦?
關於計權網路測量聲壓級的問題?
為什麼自己演奏小提琴時,用耳朵直接聽與錄下來聽,覺得差別很大?
喇叭中間這個柱狀物體有什麼作用?
聲音好聽人丑是種怎樣的體驗?

TAG:聲音 | 增強現實AR | 虛擬現實VR | 音頻 | 空間音頻spatialaudio |