【IC.TECH】第二期 | 為什麼CD的採樣率是44.1KHz?
Compact Disc
日常生活中大家都接觸過CD,記得在2000年前後,當時MP3還未普及,IC當時聽音樂、歌曲主要靠購買CD。CD一般來說是Compact Disc Digital Audio的簡稱,翻譯成中文大概是緊湊型數字音頻盤的意思。最初由飛利浦和索尼在上個世紀80年代初以紅書(Red Book)的形式聯合發布,在1987年被標準化組織IEC接納為正式標準,編號為IEC 60908。這個標準最近一次修訂是在1999年。飛利浦和索尼出版了一系列以顏色命名的標準,全部都是關於Compact Disc的,紅書(Red Book)就是其中描述數字音頻CD的一本。
(CD Logo、CD盤面、早期的CD唱機、放大的CD表面紋路)IEC 60908整個標準還是挺繁雜的,我們只關注其中的編碼部分。簡單來說,存放於CD中的音頻編碼標準就是聲音通道數為2、採樣精度16位、編碼格式為線性PCM、採樣率固定是44.1KHz。
(適用於CD的音頻標準IEC60908)PCM Adaptor
在紅書(Red Book)發布之前的1970年代,還存在著一種錄音設備叫做PCM適配器。故名思義,它把模擬的音頻信號轉換成數字的PCM編碼,並提供錄製到視頻存儲設備上的介面。為什麼音頻和視頻攪和在一起?因為當時已有的音頻存儲設備帶寬不夠大,不足以提供16位的PCM數字音頻的存取帶寬,這個帶寬大概在1M~1.5M bit/s,這在當時是一個相當「高」的帶寬,只有視頻存儲設備才有如此高的存取能力。PCM適配器把音頻數據按特定的視頻格式打包,從而可以藉助於已有的「高帶寬」視頻存儲設備實現音頻數據的存取。
Video Format
當時大量存在的視頻存儲設備主要支持兩種視頻制式,一種是25幀制式(稱為CCIR 625/50,也叫PAL),一種是30幀制式(稱為EIAN 525/60,也叫NTSC)。當時世界上有電視普及的國家按這兩種制式分為兩個陣營。首先看30幀(即60場)制式,這種制式的一幀中,可利用來錄製音頻的視頻行最多能有490行,分到每一場(Field)就有245行。在每一視頻行可以平均存儲3個音頻採樣點,那麼音頻出現的頻率就是60*245*3 = 44100。這就是44.1KHz採樣率的由來的原因之一。
同樣在25幀(即50場)制式中,最大可利用的行數是588行,分到每一場有294行,同樣每一行存放3個音頻採樣點,那麼音頻採樣率就是50*294*3 = 44100 。這樣的音頻採樣率可以保證對兩種視頻制式的最大限度兼容。Prime Numbers
還有一種解釋說明採用44100Hz的原因是,44100可以分解成2、3、5、7四個最小連續素數的平方的乘積。聽起來有些神秘主義的傾向,IC推測這些素數因子有助於系統實現時的頻率合成。
(神秘數字44100可分解為素數平方積)Symphony No. 9 (Beethoven)
還有一種更為傳奇的說法,就是最初的CD設計團隊發現,如果用48KHz的採樣率的話,一張CD放不下74分鐘版的貝多芬第九交響曲。而採用稍小的44.1KHz,則剛好可以放下。IC感覺這種說法有點兒太傳奇太浪漫了,信不信由您。
(貝多芬第九交響曲手稿)
好了,看到這裡,想必您對CD為何採用44.1KHz的音頻採樣率已經有了一些了解。可以看出,任何一項新技術的發明和發展,都離不開對已有技術的依賴、消化和繼承。任何創新都不是憑空從頭腦中誕生的,而是一步一步腳踏實地的走出來的。這是IC在這個問題的探索中獲得的最大感悟,與諸君分享。敬請持續關注【IC.TECH】
推薦閱讀:
※Android Audio BSP工程師需要清楚的基本知識點
※Android音頻模塊啟動流程分析
※荔枝FM產品分析
※知識服務+付費+音頻,開啟內容生產新的產業級機遇,知識經濟10年千億級市場規模可期