AAC-LC 是什麼格式?和 AAC 有什麼區別?

Sony 的很多 MP3 播放器支持這種格式的音樂。

那麼它可以播放後綴為 .m4a 的音頻嗎?

如果可以,最高可以流暢地播放多少碼率的 .m4a 音頻呢?


1. 前言

如果說目前H.264是視頻CODEC的實際霸主,那麼AAC就是音頻CODEC的女王。主流的音視頻格式都是H.264搭配AAC,無論是非實時的媒體文件還是實時的媒體流。

2. AAC歷史

Advanced Audio Coding (AAC) 是一個有損壓縮的音頻編碼集(其實新的編碼工具也支持無損)。

其設計目標是替代原有MP3編碼標準,在與MP3在相似的碼率下希望質量優於MP3。這一目標已達到並且由ISO和IEC標準組織標準化在MPEG-2和MPEG-4中。

AAC已被廣泛支持並應用到各種設備和系統中 YouTube, iPhone, iPod, iPad, Nintendo DSi, Nintendo 3DS, iTunes,
DivX Plus Web Player and PlayStation 3. It is supported on PlayStation Vita,
Wii (with the Photo Channel 1.1 update installed), Sony Walkman MP3 series and
later, Android and BlackBerry等等。

1997年,AAC第一次出現在標準MPEG-2 Part 7,(ISO/IEC 13818-7:1997)。和視頻CODEC標準類似,AAC在MPEG-2 Part 7就有三個profiles他們分別是。

l Low-Complexity profile
(AAC-LC / LC-AAC)

l Main profile (AAC Main)

l Scalable Sampling Rate
profile (AAC-SSR)

從此可知AAC-LC出現最早,所以AAC-LC的應用最廣泛,兼容性最好。

1999年, AAC從原有標準升級並且合入標準MPEG-4
Part 3(ISO/IEC
14496-3:1999)

這次升級一個重要變化是引入Audio Object Types(AOT)並且把AOT概念合併到profiles中。這時profile也變成4個。

l Main (which includes most of the MPEG-4 Audio Object Types)

l Scalable (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, Wavetable Synthesis,
TTSI),

l Speech (CELP, HVXC, TTSI)

l Low Rate Synthesis (Wavetable Synthesis, TTSI)合成語音。

2000年,版本更新到2,MPEG-4 Audio
Version 2 (ISO/IEC 14496-3:1999/Amd 1:2000),標準定義了一種新的AOT, 低時延AAC,the low delay AAC
(AAC-LD)。

2001年,標準化High-Efficiency Advanced Audio Coding (HE-AAC) ISO/IEC 14496-3:2001。

2003年,標準化HE-AAC v2 Profile (AAC LC with SBR and Parametric Stereo) ISO/IEC
14496-3:2005

目前AAC的標準化的版本是 ISO/IEC 14496-3:2009。

從上面標準化歷史可知,AAC不在一單純的一個編碼器了,而是一個龐大的音頻編碼工具集合。

3. AOT

AOT就是MPEG-4 Audio Object Types的縮寫。能力集協商時用的是AOT ID。

也正是由於AAC的AOT繁多,導致識別使用AAC的用戶很困擾。

AAC-LC 可認為是AOT為2的AAC。

下表是AOT的對應表。

4. MPEG-4 Audio Profiles

MPEG-4在音頻編碼方向對音頻能力集合的描述稱為Audio Profiles,音頻能力描述基於AOT。

5. AAC-LC

基於AAC-LC的普遍和重要性,雖然上面有介紹,這裡還是單獨列出來。

Advanced Audio Coding Low-Complexity,(AAC-LC / LC-AAC)格式是MPEG-2格式,設計用於數字電視。AAC-LC用於存儲空間和計算能力有限的情況。這種類型沒有使用預測和增益控制這兩種工具,瞬時雜訊整形的階數也比較低。

AAC-LC是充分利用心理聲學原理,對人類對音頻信號的感知存在不相干性和統計冗餘的特性,最大程度的減少用於表達信號的比特數據 ,實現音頻信號快速有效地壓縮,而不再追求輸出信號和原始信號相似度。

AAC-LC的重要技術點有如下一些。

Temporal Noise Shaping:瞬時雜訊整形是用來控制量化雜訊的瞬時形態,解決掩蔽閾值和量化雜訊的錯誤匹配的問題。TNS利用時頻對偶性,即時域平穩的信號會在頻域上變比劇烈,而頻域平穩的信號會在時域上變化劇烈。對時域的瞬態信號可以對頻譜係數進行預測編碼。對頻譜係數進行預測,可以及時調節量化器以適應輸入信號的時域狀態,可以有效的控制量化雜訊,

Intensity Stereo:利用心理聲學原理提高編碼效率的一種方法。由於人耳對高頻信號的相位不敏感,只要信號的能量和頻譜相似,在感知上沒有什麼區別,所以當一對聲道的信號相關性較高時,可以對高頻部分進行一定的處理,只在一個聲道中編碼傳輸數據,而不會影響解碼後的重建音質。

AAC-LC把6kHz作為聲強立體聲處理的起始頻率,在這個頻率上的都進行聲強立體聲處理。計算出左右聲道各個子帶的能量和總能量,然後計算左聲道能量和總能量的比值並換算成一個強度因子,按照這個強度因子對了帶內的所有頻譜進行左右聲道求和並歸一化,右聲道的數據則全部置零,這樣只需要對左聲道數據進行量化編碼。

Perceptual Noise Substitution:感知雜訊替代用於頻譜成分分類似雜訊(功率譜密度是均勻的)時,用人造雜訊代替。當判斷某個頻帶需要進行感知雜訊替代後,只用把該頻帶的能量作為參數編碼傳輸,而不需要對子帶內的頻譜值進行編碼,解碼時解出子帶能量和隨機矢量生成函數產生的類似雜訊。

Middle/Side:立體聲編碼,是利用一對聲道的信號之間的相關性去冗餘,降低編碼比特率的方法。AAC-LD編碼器中對左右聲道的數據相關性較大時,可以用Middle=(L+R)/ 2,Side = (L-R)/2來代替左右聲道的數據進行編碼。這樣能量集中在一個聲道數據中,而另外一個聲道只要少量比特數據,這樣實現了數據壓縮。

5. AAC-LD

既然說了AAC-LC,再說說AAC-LD

AAC是感知型音頻編解碼器,可以在較低的比特率下提供很高質量的主觀音質。但是這樣的編解碼器在低比特率下的演算法延時往往超過100ms,所以並不適合實時的雙向通信。而基於G.722的語音編解碼方案因為其較小的演算法延時而適合於雙向通信。但是這種基於語音的編解碼方案只能針對語音信號提供較好的主觀質量,並不適合更為複雜的音頻信號,而且即使在很高的比特率下,該編解碼方案給出的結果也很難達到良好的音質。

常用的感知音頻編碼器的延時包括:

Framing delay:進行塊變換需要的塊長;

Filterbank delay:分析-綜合濾波器所需要的延時;

Look-ahead delay for block switching:塊切換為檢測瞬態而需要的延時;

Use of bit reservoir:比特池大小相對於平均比特率所需要的延時。

總延時計算公式:

如下面的AAC-LC為例:

在AAC-LD中,為了減少延時,將原來的1024的幀長改為512;沒有了窗切換功能,減少了為進行窗切換所需要的前瞻延時;同時為了增強對瞬態信號的編碼質量,引入了窗型切換機制,窗型包括一般的SINE窗和一個少重疊的窗,該窗與後面的窗有很少的重疊,這樣通過對TNS工具的優化來消除瞬態信號產生的預回聲效應。

MPEG-4 Low Delay Audio Coder (AAC-LD)是直接源於MPEG-2 AAC,並且結合了感知音頻編碼和雙向通信必須的低延時要求。它可以保證最大的20ms的演算法延時和包括語音和音樂的信號的很好的音質。現在的MPEG-4 AAC LD支持最大採樣率48kHz,最大聲道數目是2(可以擴展為多聲道)。

6. AAC封裝格式

以常用的兩個格式為例。

ADIF (Audio Data Interchange Format)

ADIF是MPEG2規定的AAC音頻封裝格式。這種格式的特徵是可以確定的找到這個音頻數據的開始,不需進行在音頻數據流中間開始的解碼,即它的解碼必須在明確定義的開始處進行。故這種格式常用在磁碟文件中。

ADTS(Audio Data Transport Stream)

這種格式的特徵是它是一個有同步字的比特流,解碼可以在這個流中任何位置開始。它的特徵是數據流格式。

幀同步目的在於找出幀頭在比特流中的位置,aac ADTS格式的幀頭同步字為12比特的「1111 1111 1111」.ADTS的頭信息為兩部分組成,其一為固定頭信息,緊接著是可變頭信息。固定頭信息中的數據每一幀都相同,而可變頭信息則在幀與幀之間可變。

固定頭信息

可變頭信息

合起來就如下表

7. AAC版權和專利許可

AAC的文件和碼流是不涉及版權和專利許可的問題,所以AAC文件比MP3格式更容易合法傳播和分發。AAC的版權和專利許可僅針對商業目的AAC編解碼器的廠商和開發者,所以FFMPEG和FAAC等包含AAC編解碼器軟體以開源的形式發布。

AAC的版權許可為5年一期,期滿重新評估後可以繼續5年一個周期。

AAC的版權費採取一次性入門費15000美元,不需要每年繼費。小企業的入門費可降為1000美元。對小企業的定義是少於15人僱員並且年收入少於一百萬美元。

AAC Licensors

l ATT Corp.

l Dolby Laboratories, Inc.

l Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschung, e.V.

l Koninklijke Philips N.V.

l Microsoft Corporation

l NEC Corporation

l NTT DOCOMO, INC.

l Orange SA

l Panasonic Corporation

l Telefonaktiebolaget LM Ericsson

8.最後

AAC-LC 是什麼格式?和 AAC 有什麼區別?

AAC是標準化在MPEG2和MPEG4的音頻編碼集合的總稱。

AAC-LC是標準化AAC中AOT為2的一種音頻編解碼,它的特點是運算複雜度低,對內存佔用小,標準化的時間早,對通性好,兼容性好,使用廣。不足是演算法時延高,不利於實時的音頻通訊。


AAC-LC是低複雜度的AAC

相應的還有AAC-HE(高效率的)

同等音頻,音頻文件體積(低碼率下比較明顯):

AAC-LC&>AAC-HE

演算法複雜度:

AAC-LC&AAC規格之間的音質對比:

AAC規格(LC,HE,HEv2)及性能對比


AAC在MPEG-2 Part-7和MPEG-4 Part-3中定義了多種規範,其中最常用的就是AAC-LC,因為複雜度低適用於性能不高的流式傳輸,同時可以更高碼率


完全可以,流暢播放一般在256kbps。


推薦閱讀:

mp3為何沒有被淘汰?
APE 格式和普通 320kbp MP3 格式的音樂有什麼區別?
魅族有沒有可能重新推出音樂播放器產品?
人能分辨出無損音樂與非無損的區別嗎?

TAG:音樂 | MP3 | 索尼Sony |