人耳 20kHz 封頂,為什麼數字音頻都要記錄和解析到更高的頻率上去?

人耳才能識別20Hz到20kHz。而且這個範圍隨年齡越大越窄,我現在只能聽到20Hz到17900Hz了。可以說20k以上幾乎沒有意義。但是44.1k和48k出來不是很浪費資源嗎?
我還不是很清楚每種音頻格式的存儲方式,但是,確實在日用流媒體(用來給人聽的音頻)上沒有必要記錄到那麼高頻去。另外做耳機的時候同樣可以不用到44k的晶振或IC,反正聽不到。
就像我們的圖片只記錄了rgb而不會記錄紫外線紅外線,有一些相機確實能拍到紫外線紅外線,礙於jpg裡面記錄不了外線所以會變別的色彩出來。
還是說我的理解是有誤的,48k不是指聲音頻率什麼的。不是這個專業的,只是好奇。


基本原理兩個:採樣定理(採樣定理)和實際的低通濾波器(低通濾波器)。

採樣定理很多人都已經提到了,當採樣頻率大於信號頻率兩倍的情況下,可以完美地從這些離散採樣里還原出原來的連續信號。這個定理很神奇,即使是看懂了數學證明很多人也還是覺得直覺上難以接受。沒有從根本上理解這個定理是很多所謂的音頻發燒友甚至是「工程師」經常犯錯(例如鼓吹什麼終端產品也要 96KHz 採樣率)的根本原因。這裡就不多扯了。

但是一個問題是,這個定理是有一個前提的——信號頻率必須有限、小於採樣頻率的一半。然而現實中,麥克風所能接收、採集到的空氣振動的頻率範圍是非常大的,遠遠超過人耳聽力。如果直接把這樣的信號採樣,會導致出現混疊。所以必須要先使用一個低通濾波器,把高於閾值的信號過濾掉。然而我們並沒有一個理想的低通濾波器!參考第一行的第二個鏈接,可以看到實際濾波器並不是以一條垂直的直線把信號攔腰砍斷,而是一個快速下降的曲線。

音頻採樣率略高於 40KHz 的原因並不是考慮到「異常聽力」——因為實際上 20KHz 這個頻率已經有不少冗餘了(看過一篇薈萃分析,這個數值是眾多心理音響學實驗的結果,互相交叉驗證了)。再考慮到成年後高頻率聽力快速下降,不可能有人能聽到 20KHz 以上的聲音的。

原因其實是給實際低通濾波器留出空間!使得那一段不怎麼完美的下降曲線落在 20KHz 之外,不影響音頻效果。這個應該是個工程選擇。 44.1KHz 被證明完全可以滿足需要,另一種常見的 48KHz 也並不會在這一方面有優勢。一開始的標準制定者在參考編碼等因素後確定了這兩大常見頻率,尤其是 44.1KHz ,也就一直沿用下來了。參見 @JerryJazzy 回答中引用的那段計算。

c.f. CDDA

另外推薦兩個很有幫助的視頻:Xiph.org: Video

P.S. 關於更高採樣率對於人耳聽音樂是否有意義,其實是在另一個知乎問題里討論的。我也寫了個回答:人耳的頻率範圍最高20kHz, 那96kHz,192kHz採樣率或更高有什麼意義? - 馬宏菩的回答

根據評論區的討論,補充一個要點:整個音頻製作流中是有出現(有必要)使用更高採樣率的地方的,一個肯定的地方便是播放時的 DAC 經常是 oversample 的(後者是 up-sample 到一個很高的頻率,然後進行線性插值、平滑恢復成模擬信號,這麼做的原因只是使用正弦函數在計算上困難,故而換做一個高效、numerically stable 的近似,並不是真的需要高頻信號,整個過程對用戶是完全透明的,不需要關心),另一個可能、也是更有實際意義的地方是音樂的採集、處理階段,可能需要加工頻譜,而這方面我就不熟悉了。正如上面鏈接的另一個答案所說的,消費者關心的最終產品(數字音頻文件)中,高採樣率是無意義(甚至可能有害)的。


寫這個答案,主要是為了銘記作為音頻演算法從業者,
居然一直犯著一個原則性的錯誤。
特此註明,警而示之。

錯誤發生在音頻採樣的基本定律,奈奎斯特-香農採樣定律上。
:如果信號是帶限的,並且採樣頻率大於等於信號帶寬的2倍,那麼,原來的連續信號可以從採樣樣本中完全重建出來。
:如果信號是帶限的,並且採樣頻率大於信號帶寬的2倍,那麼,原來的連續信號可以從採樣樣本中完全重建出來。

之前腦中一直留存著在恰好2倍信號頻率的採樣率下,信號振幅(或者說相位)無法被恢復的疑問...

看了下這個問題中的其他答案,發現很多人也和我有著同樣的錯誤認識,
警示一下我自己,也提醒一下大家吧。
感謝讓我注意到這個錯誤的 @Tsui Randy

----------------------------------------------------------------------------------------
更新1:
該定律的原始出處,香農的paper 中,寫的是信號頻率不高於採樣頻率的1/2,

Theorem 1: If a function x(t) contains no frequencies higher than Bcps, it is completely determined by giving its ordinates at a series of points spaced 1/(2B) seconds apart.

並且證明和討論中多次表示了2倍頻率就足夠的意思,可以認為,該定率最初提出時是錯誤的。
香農大人坑爹啊,原來我沒有錯怪你!把我們害慘了!
至於後來究竟由誰之手將等號去掉,鄙人才疏學淺,無法考證,
希望有識之士加以指出。。。

另,關於採樣頻率等於信號帶寬的2倍的情況下的討論,可以參考英文wiki
Nyquist–Shannon sampling theorem
的Critical frequency 這一條。


原理方面,可以參見 @iux001 的回答。

很多人沒注意到,44.1和48倆標準是咋來的?

當年兩大巨頭,索尼和飛利浦,對採樣率標準的問題爭鬥不休。

為什麼最後,市場上選擇了索尼的44.1KHz/16bit標準?連後來的數字CD都要卑躬屈膝?

在數字存儲媒介被發明之前,早期的數字音頻是要被錄製在模擬錄像帶上的,因為只有VCR帶能存儲一定長度的數字音頻信號。

出於對設備改動最小就能錄製數字音頻的願望,錄製數字音頻信號的錄像帶每分鐘跑的速度是和視頻錄像帶一樣的。

用過錄像機的童鞋都知道,當年模擬視頻信號的制式主要是NTSC和PAL,在錄製帶子的時候一定要看清楚錄像機的制式撥片撥到哪了,才能不出差錯。

由於世界各國制式不同,所以這種採樣率標準必須既兼容NTSC標準,又要兼容PAL標準,才能最大化兼容度。

飛利浦提出了44.056KHz的標準,不過並不能很好地被NTSC系統兼容,有一定的誤差,所以沒有被市場接受。

索尼提出了以44.1KHz/16bit的方式錄製,在數字信號和模擬信號的過渡期,大獲全勝。

首先普及個知識,非逐行掃描的信號是有上下場之分的。

NTSC每場掃描245線,每秒鐘60場,每條掃描線只需要存儲三個採樣就可以達到44100Hz。

PAL每場掃描294線,每秒鐘50場,每條掃描線也只需要存儲三個採樣就能達到44100Hz。

44.1KHz/16bit,這兩個神奇的數字,以自己寬廣的兼容性,以及對編碼採樣數的極少要求,奠定了自己在市場上,以及用戶中的使用慣性。

哪怕最後出現了數字CD,也沒有敵得過用戶的使用慣性。

44.1KHz的採樣率,真的包含了人類的全部可聽頻率嗎?它真的是音質之王嗎?

不一定。

不過對市場上的設備大換血更複雜,模擬時期到數字時期的過渡更複雜。所以大家都這麼湊合用了。

就是這樣。


關於為何選擇44.1KHZ作為產業(CD)標準:

1) 採樣定理 Sampling Theorem:
很多答案都提到了,簡而言之,採樣定理告訴我們:如果人耳的聽力上限在20kHz,那麼我們完美地還原20kHz以下的聲音信號,就需要用它2倍以上的採樣頻率來進行採樣(&>40kHz)。

2) 非理想的低通濾波:
採樣的前一步其實還要將信號進行一個低通濾波(anti-aliasing filtering)。但理論之外,工程中的低通濾波器並非理想的,意思就是,一個cut-off frequency設置在20kHz的濾波器,也並不會把20.05kHz的信號完全濾掉,本質上它只是很大程度抑制了20kHz以後的頻率,使得大於20kHz的那部分快速衰減下去(但嚴格講也還是存在的),因此如果嚴格用40kHz來採樣,那麼可能還是會造成結果的微小的失真,而非完美的還原。 另外補充一個例子,我們的電話、手機在進行通話的時候都是用8KHZ來進行採樣的,因為大致上4kHz以內的聲音信號就足以讓我們聽清人的說話語音,不過這裡採樣之前的低通濾波就並不是把截止頻率設置在4K,而是3k多Hz,就是因為低通濾波器不是完美地截住了所有高頻成分。

3) 技術歷史問題:

在數字存儲媒介被發明之前,早期的數字音頻是要被錄製在模擬錄像帶上的,因為只有VCR帶能存儲一定長度的數字音頻信號。

出於對設備改動最小就能錄製數字音頻的願望,錄製數字音頻信號的錄像帶每分鐘跑的速度是和視頻錄像帶一樣的。

(以上摘自 @劉潤澤 的答案 多謝指正!)

所以原因的核心當然是因為成本了,如果再發明一個載體專門存儲音頻,開發成本、普及成本都很大,而如果能用同樣的設備和載體來讀取音頻,就方便多了。

下面的兩個計算,大家也不必完全看懂,因為這裡面又涉及了視頻廣播的標準和一些參數,但結論就是,44.1kHz是同時滿足兩種視頻標準,且又滿足音頻需求的一個數字:

In the NTSC standard, a 60Hz standard, there are 245 lines per field, and 3 samples stored per line, so the sampling rate can be calculated:
60fields/sec * 245lines/field * 3sample/sec = 44,100 samples/sec = 44.1kHz.

In the PAL standard, there are 294 lines/field, 50fields/sec, and 3 samples/line enabled. So the sampling rate for audio is
294*50*3= 44,100samples/sec = 44.1kHz.

-----
另再提供一個理論和學術上的參考視頻,第19課正好是講到音樂中涉及的採樣定理應用:斯坦福大學公開課:傅里葉變換及其應用 。 說明一下,其中講44.1kHz的制定的部分比較模糊,可能那位老師不了解我上面第三條的這條理由吧,但我還是很確信這條理由才是最決定性的。
-----


最後,至於為何還有現在有48KHZ甚至更高,抱歉並不是很了解,但我猜應該是(1)由一些設備的標準決定 (2) 外加理論和現實之間的某些差距吧。 希望有高手把這個解釋解釋,也歡迎各種質疑和討論,我也在學習中。

-------

更新!
今日上課重新溫習一遍採樣定理之後,終於明白更加為什麼採樣率需要更高!!


第一,人耳的聽力極限是否是20kHz是存疑的!舉一個例子就是,10kHz的正弦波和方波的音色,人是能分辨出不一樣的,但這裡注意!正弦波的頻率是10kHz,然而方波除了基頻是10kHz,它包含了30kHz甚至50kHz的頻率分量(泛音),理論上應該聽不到,而如果聽不到30kHz那個分頻,方波的音色其實就跟正弦波一模一樣了,但有的人確實能分辨出兩音色的不同!


第二,更高的採樣率也為了服務於音頻後期處理,如混音、數據分析編輯等等,此時的任何動作都對高頻是有影響的,但如果採樣率將將到40kHz,那麼最後的產物很有可能在對接近20kHz的頻段的質量有損毀。


第三,再次回顧採樣定理!最最簡單是一個情況是,對於一個只有單個頻率的正弦波,至少在它一個周期內需要2個點來採樣。 但注意,僅僅2個點、甚至3個點都有可能是不夠的。如果2個點都落在了波形恰好到0的位置上,那麼就連波形的振幅都不知道了! 以此類推,即使採樣率大過理論值一些些,波形也有可能無法被完美還原,舉一個例子就是今天課上用matlab生成一個頻率為2.8kHz的正弦波,採樣率分別設定為44kHz, 10kHz,6kHz等,令人意外的是,採樣率為6kHz的時候,儘管產生的聲音頻率沒問題,但振幅相比44kHz採樣率的時候變小了!這正是因為上面提到的,不是所有採樣點都必然落在了最重要的位置上,也導致了生成的波形還是非完美的還原! 因此,44KHZ的採樣率,也許對於一些超高頻比如1.5KHZ以上的聲音信號就還原得不那麼準確,所以技術上還會用48KHZ, 96KHZ這種高出理論值很多的採樣率來進行錄音、合成。


(趁著剛上完課的熱乎勁兒趕緊把這些記了下來,哈哈爽)


I learned this shit in English and I have no idea how to explain it in Chinese. I apologize and I"ll assume you"re smart enough.

To sample free of aliasing, the sampling rate must be at least 2x the bandwidth of the function. Aliasing is the effect of misinterpretation of a signal, where a lower frequency signal gives the exact same sampled discrete signal as a signal of Nx frequency (N = 2,3,4...).

eg.

Both signals are sampled at f = 1, and both signals result in the exact same discrete signal, even though one signal has a 10x frequency with respect to the other.

So here we have a sinusoid:

Any sampling rate lower than 2F will result in a misinterpretation. Therefore the minimum sampling rate must be twice the highest frequency signal in the function. This minimum sampling rate is called the Nyquist rate.44kHz is approximately twice the upper limit for the human"s auditory system (each person has a different upper limit, while one person may hear up to 20.0kHz, another may hear up to 20.8kHz. Usually children have higher upper limits than adults), so 44kHz is a safe value for lowest alias-free sampling frequency. Hence, it is already the most economical solution.


錄音端用超採樣,因為物理低通濾波器不完美,可以超採樣後使用數字濾波完美濾除20k以上的頻率。而播放端使用96k採樣回放音質更好是就是玄學和心理學效應了。


假命題。20k 和48k 指的並不是同一回事。前者指聲音本身的頻率,後者指的是採樣率。也就是說,每秒對聲音採樣48k次才能還原20kHz的聲音


首先題主要區分你所說的人耳能聽到的20kHz這個頻率和你所說的數字音頻採樣48kHz這兩個頻率之間的區別。

前者是指聲音本身最高震動頻率。而後者是指錄音系統採集聲音信號的快慢。前者是用來聽的,後者只是一個指代速度的數值而已。

前者是:一個物體以每秒20000次的頻率震動,傳來的聲音中的主要頻率(說主要頻率,因為還有一些次要的泛音頻率)。

後者是:數字音頻系統記錄聲音信號時每秒採集的數據個數。

一次振動要有完整的波峰和波谷,否則不會被認知為聲音。所以要記錄一個完整的震動,至少要有兩個數據。然而看到這裡你也明白了,用僅僅兩個數據來描述一個波形,實在太糙了。然而這只是在達到了採樣頻率極限48kHz的時候的情形:所記錄的24kHz的聲音波形極端失真,已經到了再失真就沒有了的程度。

可以用像素有限的顯示器顯示一幅圖形的例子來幫助理解:每個像素點是一個單位,它只能顯示一個顏色,比這個像素點更小的圖形細節,這個顯示器就不能顯示了。

所以,當聲音頻率越高時,其實系統如實記錄和還原它的能力是遞減的。(顯示器的畫面里,越小的東西細節就越差)這就是為什麼我們要把採樣頻率推到48kHz甚至96kHz上去,因為這樣才能盡量提高還原後聲波內容里高頻部分的真實性。

其實儘管這樣,還是非常不夠的。就算是192kHz採樣頻率,理論上回放內容里確定包含了人耳可聽上限20kHz的頻率成分,有經驗的聽者——不論年齡——依然能夠聽得出其與現場演奏之間的區別。這種區別在高頻能量集中的樂器比如架子鼓的鑔上表現得尤其突出。這些能量集中在高頻的音色在數字音頻系統中失真依舊十分明顯。

所以,理論上採樣頻率應該設置為所需最高頻率的兩倍,但實際上,為了能夠讓回放的聲音盡量保真,就算設置為十倍也不為過。


首先,信號裡面有一個非常著名的定理,叫奈奎斯特定律。其內容就是:對一個信號進行採樣時,採樣率大於等於信號中最高頻率的2倍,就能消除混頻,還原出原信號。(這個……採樣你應該知道吧,模數轉換的第一步,原始的聲音是個模擬信號,要數字處理,肯定要轉換的)。所以說,為了還原聲音信號,採樣時必須大於等於信號中最高頻率的2倍。人耳能聽到的最高頻率是20khz,所以採樣頻率理論上至少要40khz,但是現有的濾波器不是完美的,不能真正做到濾乾淨,現有的設備並不能達到理論上的情況,包括考慮到萬一有什麼特異人士能聽到咧高於20khz的聲音,所以一般取44.1khz或者48khz。工程上大都是這樣嘛,留有一定的餘量。這兩個也算是行業標準。

如果你關注消費級聲音錄製、處理、回放設備,比如錄音筆 高保真音樂播放器,你會發現很多產品會宣傳自己支持96khz甚至192khz的採樣率,這樣做是出於什麼考慮,有什麼實際意義呢?

這個問題我諮詢過我的老師,老師的回答也不是特別讓大家信服,理論上也不過硬,對此我請教了國內某著名的HIFI廠商的工程師。

實際上44.1khz並不足以完美取樣22khz,因為在時域上,高頻的兩個採樣點是不夠的, 在頻譜上說,就會發現10khz以上高頻會產生大量的量化失真。

88khz已然足夠,但主流的音頻介面是48khz和整數倍,所以就採用96、192khz這樣的採樣率。在數字電路角度來考慮,高採樣其實是把大量的採樣雜訊向高頻轉移。反正高頻你聽不見,有雜訊就有雜訊唄~雜訊不能消除,但是巧妙的規避了。
這樣簡單的設計一個模擬濾波器即可濾掉集中在40khz以上的高頻噪音。
想要獲得更完美的信號,可不止是44.1 48khz就夠了哦

———————————————————————
所以說呢,紙上得來終覺淺,絕知此事要躬行。
以上。


1,至少兩個採樣點才能表現一次震動,至少兩倍以上的採樣頻率才能重建一段音頻。
2,至少兩倍以上採樣才能重建音頻,但不是說兩倍,或者比兩倍多一丟丟的採樣就可以完整重現音頻了。
(請原諒我的靈魂畫風)

採樣率越高,對高頻的重塑精度也就越高
如果加上高頻互相調製,互相干預形成的高次諧波,需要的採樣率就更高了

舉個不恰當的例子:
12幀的連續圖片看起來就是運動的,為什麼還有電影的24幀、30幀、48幀、60幀以及120幀?
雖然邊際效應很明顯,但的確有所提高


受不了上述答案了!!!
頻響範圍和採樣率完全是兩個概念啊!
形象點說是坐標橫軸與縱軸的關係。
頻響上限到20kHz和採樣率44KHz還是48kHz

沒!有!任!何!關!系!


我這邊要提一下熱門答案沒提到的點…大部分人耳是能聽到20khz以上的聲音的,我不知道題主的年齡,但隨年齡衰退沒有你想像得快而且是具有可恢復性的。相對於耳朵性能衰退,大腦的表意識感知可能衰退更快。在國外一些測試項目里,60歲以上少數人仍可以在大音量下感知高頻甚至超高頻聲音。
另外,你測試的耳機和回放設備可能沒有辦法真正播放20k以上的聲音,這在頭戴式耳機,特別是技術比較舊的耳機上尤為明顯,目前入耳式動鐵的高頻和超高頻單元用來測試20khz以上音頻才有現實意義,否則退回到兒童時代你也無法從耳機里聽到超高頻的聲音。


上面把採樣點用直線連起來的都有問題,這裡的頻率是傅立葉變換里的概念,是正弦波頻率。兩點直接連起來的直線看似簡單,在頻域里成分非常複雜,正確的做法是用正弦波連接採樣點


奈奎斯特定律什麼的其他回答已經解釋很清楚了。至於為什麼現在錄音的最高採樣率是192K的原因雖然有玄學的成分在裡面(「96K聽著就是跟48K不一樣」),我的一個猜測是可以參考《阿拉伯的勞倫斯》在那個回放不可能達到4K標準的時候就用4K膠片拍攝,當時看不了不代表以後看不了。

等待植入海豚神經中樞來發現更廣闊的聲音世界吧。


48kHz是採樣頻率,通信理論的基本定律,對於一個頻率為N的波形,如果想要精確採樣採樣周期至少需要為2N,所以48kHz的採樣頻率可以精確記錄下24KHZ以下的聲音.44.1Khz採樣頻率(CD)可以記錄下22050Hz以下的音頻.這個數字離人耳的20000Hz上限並不遠,雖然人類聽不見,但並不排除某些人可以感覺到,所以都錄下來也就完事了.


一派胡言

如果只播放定頻信號,20k可能很多人都聽不見。

但是如果是在音樂中混入20k信號,尤其是有規律或者樂器本身的諧波。

是一定能聽出區別的。

這部分諧波也是經常出現在各種我無法理解的玄學辭彙中。

這麼基本的原理。

以上。


@馬宏菩

現在delta-sigma的音頻ADC/DAC前端採樣頻率高達MHz級別。降採樣和升採樣基本都是FIR/IIR濾波器插值。建議多看數據手冊,再實際做做實驗。

還有目前DAC超採樣要麼用FIR要麼用CIC濾波器。用線性插值的RD早該開了


從聽力學角度來看。我認為市面上的耳機參數寫著20-20kHz都是吹的,或者說,在20kHz的時候,增益是非常非常小的。我們用於科研的一台價值過十萬GSI Grason-Stadler儀器。搭配專用的耳機

在20kHz的時候最大增益也只能開到10dB

實際頻響範圍的
以下內容來自百度,內容很詳細。分享給大家。侵刪
————————————————————
所謂頻響範圍,指的是頻率響應範圍。在音箱、耳機等音頻回放設備中一般會有標註20Hz-20KHz類似這樣的一個數字範圍的指標,此即是指該設備可以回放的有效頻率範圍。當然,與之相對應的是,人耳理論上可聽到的聲波範圍也是20Hz-20KHz。於是,就出現了該款產品完全恰合人聽音感受的假象。但實際上,這是將「頻率範圍」和「頻響範圍」混作一談,單純20Hz-20KHz的頻率範圍沒有任何意義。
在音響產品中,與頻率相關的一般會有兩個參數,一個是在-6dB下的頻率範圍(Frenquency range),而另一個是±3dB下的頻率響應(Frenquency response)。對於市場中主流2.1音箱來說,它們無論如何都不可能達到低頻20Hz的頻率,甚至100Hz以下都很難控制。如果一款產品的頻響參數是可信的,那麼從低頻部分看,60Hz甚至70Hz的底限並不能說明這款產品品質不好。同理,能夠將高頻延伸到18KHz,這款產品也足夠出色了。更何況,人耳並不一定能聽到這個頻率的聲音。
對於頻率範圍,標註20Hz-20KHz並無出格,理論上只要回放設備對相應頻率的信號有響應即可以為在其頻率範圍內。從這個角度,甚至低於20Hz或者高於20KHz也不奇怪,因為這組數據和聲強無關。當然,揚聲器對這個頻率段的信號有響應並不代表其能夠真實地還原聲音,更大的可能是其還原的是不相關的「信息」甚至雜訊。
而作為頻響範圍,規範的標註方法必須在這個頻率範圍後有聲強度大小的條件範圍,例如60Hz-20KHz (±3dB),否則該頻率響應曲線是沒有意義的。大家很少會在音箱或者耳機產品後面看到這樣與聲音強度相關的標註。
另一個值得注意的傾向是,在許多人認識到20Hz-20KHz的頻響範圍是完全不可信之後,有些「聰明」的音箱廠商從另一個角度來解決這個問題,他們開始把這個頻響範圍刻意的調整一下。例如,把低頻調整到30Hz或者40Hz,把高頻調整到18KHz,想通過這樣的數字遊戲來贏得大家的信任。但是,對於一款普通的2.1產品來說,20Hz和40Hz對它們來說有什麼不同,同樣是無法實現的一個頻率。
耳機是一個比音箱更加誇張標註「頻響範圍」的產品。一款產品動不動就可以超過20Hz-20KHz。例如某品牌耳機頻響範圍標註的是5Hz-30KHz,這就誇張到可笑的地步了,也許,一個50mm直徑的大震膜可以帶來較低的頻率,甚至低於20Hz的震動。但是5Hz,這意味著這片震膜要正確的表現出每秒5下的一個震動,實在有些不可思議。而30KHz的高頻,更是無從談起。正因為有了這組數據,我們也看到更多的相關資料這麼寫道:更寬的頻響範圍,適合還原SACD、DVD Audio等高保真音樂。


參考信號與系統之抽樣定理


高採樣率減少量化誤差啊,還有20k以上還是可能會有些影響的。


推薦閱讀:

為什麼喇叭或者揚聲器能還原出各種聲音(尤其音色)呢?
如果將「音頻毒品(I-Doser)」混入普通音樂,是否能被識別?
頻響曲線能多大程度上代表音質?

TAG:耳機 | 音頻格式 | 音頻編解碼 | 音頻 | 聲音處理 |