如何理解《混音指南》 3.1.4 中作者提出的四個問題?

  • 當音頻工作站軟體的總輸出音軌上顯示削波時,是應該將所有通道上的推子都向下拉,還是把總推子向下拉即可以?

  • 為了達到更自然的效果,可否使用一個或多個混響器?
  • 在壓縮器上,什麼時候應該啟用立體聲綁定(Link)功能?為什麼?
  • 什麼時候應該添加抖動(Dither)處理?


首先聲明沒看過此書,也沒計划去看。這裡解釋一下技術問題。

  1. Q:當音頻工作站軟體的總輸出音軌上顯示削波時,是應該將所有通道上的推子都向下拉,還是把總推子向下拉即可以? A:這個問題涉及到定點與浮點演算法的區別。一句話的答案是:定點演算法需要調整每個通道,浮點演算法無所謂。

    稍微詳細一點的解釋是,定點演算法就是普通的小數:0.000031415926....;浮點演算法就是科學計數法:3.1415926 * 10^-5。音頻信號0dBFS的浮點數是1與-1(波形正反兩極)。定點演算法的位數無法記錄超出部分,而浮點演算法不受小數點位置影響所以沒有任何影響。

    儘管如此,個人建議還是盡量不要讓每個通道的信號超過0dB,這樣同樣的工作流程也可以適用於硬體檯子。

    以後我會單獨寫一篇文章更詳細地解釋定點演算法和浮點演算法。

  2. Q:為了達到更自然的效果,可否使用一個或多個混響器?

    A:
    如果目的是追求最自然的混響效果,應該每個信號一個單獨的混響,因為信號在房間內的位置、距離、方向什麼的都不一樣,導致延遲、混響時間、高頻衰減之類的數據都不一樣。可惜目前計算能力跟不上所以只能妥協。妥協到什麼程度是個人選擇了。

  3. Q:在壓縮器上,什麼時候應該啟用立體聲綁定(Link)功能?為什麼?

    A:
    實際上沒有立體聲的概念。插件所處理的信號都是多通道的,區別是1個通道(單聲道),2個通道(雙聲道/立體聲)以及更多通道(5.1/7.1等)。對於識別多於1個通道信號的插件,尤其是非線性處理方面,n通道與立體聲什麼的區別在於信號識別鏈。n通道識別信號時會單獨識別每個通道的信號,而立體聲信號識別(link什麼的)會同時識別所有通道的信號。注意區別只是信號識別的時候,跟信號處理沒關係。

    舉個例子,壓縮哈。左右兩個通道(通道0和通道1),某一瞬間輸入音量分別是-10dB和-30dB。我們的設置是閾值-20dB,壓縮比例 無限比1,無Attack無Release,RMS=0,Knee=0。這樣不一定好聽,但是比較好理解,也就是任何超出-20dB的信號都瞬間輸出-20dB的信號。

    回到我們的輸入信號,如果我們用n通道的識別方式(un-Link),通道0信號超出-20dB,觸發了壓縮,變成了-20dB;而通道1的信號沒有超出閾值所以不觸發壓縮。如果我們開啟立體聲識別方式(Link),某個通道信號超出閾值,開啟壓縮,所有通道信號-10dB,結果通道0信號雖然同樣是-20dB,通道1的信號變成了-40dB。

    這種演算法在其他失真或者動態處理方面(比如說Dynamic EQ),尤其是側鏈用法更為明顯。

    實際使用的話,需要處理哪個通道的信號就處理哪個通道的信號,需要一起處理就一起處理吶...

    之所以說沒有立體聲的概念是指,Link之後兩個輸入通道變成了立體聲,3個4個5個6個通道(如果插件支持的話)演算法是一樣的。

  4. Q:什麼時候應該添加抖動(Dither)處理?

    A:
    這個應該是古今中外回答錯誤率最多的問題。短答案是:任何降低比特位深(bit depth reduction)的位置,包含但不局限於渲染、硬體輸出、凍結等時候。跟是否母帶環節沒有關係。 簡單來講,0.000031415926降低2 bit後成為0.0000314159,後面的信息被直接切掉,這個做法叫truncation,這是大部分daw的默認抖動處理方式。因為truncation演算法是以固定方式改變信號,所以會產生固定的失真,6.0206dB左右,並且每次都會疊加同樣的失真。也就是說你錄完人聲拼完未抖動導出,+6.0206dB失真,給別人修完音準後未抖動導出,+6.0206dB失真,混音後未抖動導出,+6.0206dB失真,總共24.0824dB左右的失真。失真位於信號最底端,會降低信噪比,24位有144dB的信號動態範圍,也就是說失真後信噪比不到120dB。但是因為是固定的所以其實聽覺上更明顯一點,更何況如果加了壓縮等非線性處理會造成noise floor更早地體現出來。而這個truncation失真正是很多人覺得數字信號沒有模擬信號好聽的原因。

    當我們在每個位深降低出增加了基礎抖動處理後(TPDF,演算法為生成兩個隨機數取其平均值),因為噪音是隨機的,所以疊加後的噪音會比非隨機的信號音量要小,而且是全頻段的。GS上有人說第一次Dither,noise floor增加4.8dB,之後每次增加3dB多一點。抖動實際上就是把數字信號變成了模擬信號,因為模擬信號自帶噪音。

    那麼DAW里到底什麼地方會出現bit depth reduction呢?..................其實差不多所有與外界銜接的地方都會出現。包括daw信號進插件、daw信號出硬體輸出、daw信號輸出成更低比特的定點音頻文件等等。原因是,DAW在運算的時候會把信號提升到內部運算的位深,當今通常48位定點或者64位浮點(或者sawstudio的64位定點)。內部運算是指...任何對音頻信號的改變,包括最簡單的改變音量。

    插件這塊兒比較複雜,而且通常插件和daw bit depth都比較高(32位以上,也就是信噪比192dB以上),而且有一些插件自帶某種程度的dither,所以通常需要手動添加dither的是在硬體輸出和渲染生成更低比特的定點音頻。

    硬體輸出方面,要麼在master軌結尾處添加Dither插件,要麼在監聽插件鏈內添加。如果遇到分軌道直接輸出至硬體輸出,那麼需要掛在分軌上輸出之前最後一個插件位置。

    導出音頻的話,所有的渲染都需要添加抖動處理,除非導出格式為浮點(32位浮點音頻之類的)。凍結(Freeze)其實也一樣,除非DAW對凍結的處理是生成浮點音頻(估計懸)。所以凍結之前得添加Dither呵呵呵。

    當然以上都是針對比較挑剔的人,或者說「正確做法」。數字音頻幾十年了沒多少人把抖動做明白的,甚至說你做母帶不加抖動影響也不大啊(雖然母帶過程中的抖動更多的是挑剔音色了,涉及到Noise-Shaping方面)。但是如果真的在意的話,還是認認真真按著之前說的去做:任何降低比特位深(bit depth reduction)的位置都需要添加抖動處理。

    以後會單獨寫一篇詳細說明抖動的文章,暫時先這樣。


既然邀請我來回答如何理解《混音指南》 3.1.4 中作者提出的四個問題?這樣一個問題,那我就真真切切地說一下我對這些問題以及文中的這段文字是怎麼理解的。

我認為,這四個問題並不是作者為了在後面的章節內容里仔細的講解這些所謂的「重點」而刻意留的懸念,而是為了論證他這一段文字的論述:

如果說每位混音師都知道上述這些問題的答案,這是在撒謊。這就如同在說你不懂得這些知識就不能做一個出色的混音,同樣是在撒謊一樣,在混音這個圈子中,有相當數量的成功混音師對很多理論性問題的答案都不太清楚。不過,如果說知道這些理論沒什麼意義顯然也是不對的。與天賦一樣,知識也是一種幸事。在這個競爭激烈的社會裡,知識能體現出兩個具有同樣天賦混音師之間的差別。有些知識可以通過教育類節目獲取,而有些知識——只能一點一滴去學習。但是,所有的混音師都患有「學習強迫症」。如果一個壓縮器的壓縮比設為1:1,有人可以花上好幾個小時去弄清楚為什麼其他的控制參數不起作用了。當然,相對來說,理解擱架式濾波器和帶通式濾波器之間的差別簡單一些。此外,抖動確實會影響到混音最後成品的質量。如果說,一位母帶工程師不知道何時應該添加抖動處理是不可原諒的,那麼作為一位混音師也必須同樣了解這些知識,特別是在他將要廣泛應用這些知識的時候。

相比於僅僅知道你做了什麼,你最好也能知道

你能做什麼,以及怎樣去做。

混音這個圈子非常大,但交流又並不像其他行業那樣廣泛。並且我們都有著同樣的目的:製作出好音樂。所以很多混音師的混音方法大相徑庭,今天你終於用單位的調音台混出了好東西,明天你的錄音棚里的朋友一臉驚訝的問你怎麼還用調音台?要求一名混音師掌握大多數的知識是完全不現實的,甚至你可以只掌握非常少非常狹隘的一部分知識——用於工作的知識。但是這往往是不太現實的,除非你有一位好老師,他將他自己多年摸索出來的知識中最有用的最直接用於工作的知識毫無保留地傳授給你。那麼你學會之後,也可以立刻上手工作了。但是這也會限制你的發展:很多年之內在你補全相應的基礎知識之前,你很難很難超越你的這位老師。

不過可能因為年代稍微久遠了一點,現在這個時代的業內人士鮮有不理解這些基礎問題的。有人給出的答案可能和其他人不一樣,也只是因為他們的工作方式不一樣。就像一位母帶工程師不了解抖動一樣,混音師不了解這幾個基礎知識實在是有點不可原諒。問題是

這些書中都有講啊?上知乎提問是鬧哪樣???

1.如實地說,我的確不知道第一個問題中這種情況是要動哪一個推子。這個結果和我的工作方式有關,我在混音的開始首先要整理素材,把它們的響度整理到一個非常低的程度,然後再提升自己的監聽音量,使其恢復到儘可能聽得清楚又不會過度受等響曲線影響到程度。之所以可以這麼做是因為每一首混音都要進行母帶處理,並且出於對母帶設備或者是母帶工作室的信任,提升的電平往往遠大於書中要求的3dB動態餘量(因為時代早就變了),達到了10dB左右甚至以上。所以我從來沒有碰到過「總輸出音軌上顯示削波」這種情況,甚至是其他軌道也少有碰到過。這是我的混音方式,也許別人和我不一樣。

如果在寫入自動化的過程中遇到這樣的問題的話,毫無疑問的是要修改分軌的自動化。

並且,書中對推子的使用和電平規劃有詳細的解讀,詳見書中P206 12.3推子的使用。

2.在混音的過程中混響是一個老大難的東西。有些人基本上只能使用一台混響器,因為他們只有一台硬體混響器。同樣的,面對這種問題,同樣也沒多有錢的我選擇的解決方案是退而求其次,使用軟體混響器。這裡的軟體混響器並非VST或者AAX Native的真正純軟效果器,而是使用一台單獨的伺服器來運算插件的Waves SoundGrid系統。用軟體效果器的好處就是你想掛多少就可以掛多少,而DSP運算又在一定程度上保證了密度和質感不會比硬體效果器差到天差地別的程度。所以在我的工作過程中的確不只會用到一個混響,H-Reverb,Abby Road Plate等等。每個混響各司其職有其強烈的作用性。

關於混響器的實際應用,書中P515 23.8混響器的實際應用 章節中有詳細的介紹以及關於數量的揭秘。

3.在需要對一個立體聲素材的左右聲道進行完全相同的處理(或者是完全相同的改變)的時候就要用到Link功能。具體請詳見書中P338 16.4.4立體聲綁定。

4.關於抖動處理(Dither),這是這四個問題里唯一一個書中沒有詳細講解的。因為這本書叫《混音指南》而不是《Mastering Audio掌握音頻藝術與科學》。但是對我們來說,也許在自己製作自己進行簡單的母帶處理的時候,抖動非常常見。它是一種添加的雜訊信號,用在高位深度向低位深度轉化的過程中,提高低位深度能表現的動態範圍。舉個簡單的例子:用16bit的工程混音的音樂,能展現的動態範圍也就只有16個bit。但是用24bit工程混音的音樂,在添加了抖動處理的信號之後,可以在降低bit的情況下略為保留後幾個bit的動態內容。關於抖動處理的原理,知乎上有人寫了文章,可供初學者了解:信號的抖動處理——Major。

另外,我對上一章節末的箴言也很有興趣。同樣引用到這裡:

行行皆通,樣樣稀鬆

這句話本身是廣義的,但是狹義地理解起來也同樣行得通。

謝邀。


問題1.

兩種做法會帶來哪些問題?

如果拉總推子,事實上,進總推子前的信號就已經過飽和了。注意這裡用的是過飽和而不是過載,因為現在的工作站在電平控制上是有保護機制的,大體上就是通過降低量化單位的層級來實現信號電平的不過載。因此拉與不拉,造成的區別只是總輸出電平上的區別,對因電平過大引起的損失沒有任何補救效果。

如果拉分推子,會帶來很多負面問題。比如如果在完成了多層次的複雜的自動化設定後,分推子狀態的改變可能會出現很多錯誤。但這個還好,只是操作和邏輯方面的問題。最大的問題是每條音軌的數位利用不充分。其實也是從另一個方式降低了量化單位。

當然,二者選其一,我覺得改分推子會好些,畢竟可以降低過飽和引起的過載失真的可能性。但是這個問題背後其實還是想要佐證合理規劃混音電平控制的重要性。

問題2.

這個題的題眼是「自然」。

何謂「自然」?是自然界天然存在的狀態,還是我們內心感知時最舒順的狀態?

這是聲音製作領域一個由來已久的哲學問題:即唯物還是唯心?個人覺得都各有各的道理和用處。比如我們在錄交響樂、室內樂等需要拾取較多反射聲的錄音時,自然存在的混響狀態會是我們調節混響器的重要參考。通常也以加單一的大廳混響為主。如果是拾取純粹以直達聲為主的錄音時,我們也要看作品的表達方式,如實況節目,那麼需要加更符合自然狀態的混響。但如果是純粹的單曲作品,則可根據作品的表達來調製混響器,以達到符合作品的,即更唯心的自然。

個人覺得「自然」這個概念中,實際的物理自然狀態,唯物的自然,是我們工作的重要參考,更是我們學習這行的開始。但做聲音工作的,是呈現聽覺的藝術,作品還是為了伺候耳朵的,因此最後還需要唯心的「自然」去統合唯物的「自然」。因此,是否用多台多種不同的混響器的衡量標準其實還是在於聽感和對作品的理解為主。

問題3.

在本身為立體聲信號或者在定位描述上有相關性信號的音軌內容上,接入的壓縮器需要為link狀態。因為如果不這麼干,那便是各壓各的,你方唱罷我登場,那便會讓該音軌的信號在聲像上顯得飄忽不定。

當然,如按上述做法做,你可能可以獲得一些更飄忽的迷幻的效果,如果作品的呈現有這樣的需求,這或許是可以嘗試的方法,因為這種不確定的隨機性的聲像飄忽狀態,比自動化處理聲像獲得得會更舒服流暢一些。

問題4.

一般在作品的最後的輸出環節去加,注意:最後環節,即包括母帶處理。因為母帶處理還有可能過動態處理,會破壞dither信號狀態,產生類似喘息的效果。

Dither信號的加入,在我理解下,其實就是為了增加低電平信號(甚至可以包括所有的數位信號中的低數位模式或低量化精度的情況)的數位深度。

關於抖動信號的問題這塊內容強烈推薦這篇文章:

信號的抖動處理(分享自知乎網)https://zhuanlan.zhihu.com/p/29285534?utm_source=com.tencent.androidqqmailutm_medium=social

有些問題在音頻的層面看可能不太好理解,升維到更廣的數位應用層面去看,可能立刻就明白了。

個人見解,僅供參考,也歡迎大家指正。


我正進行《混音指南》的拆書實踐,前幾天我剛帶同學們拆完這一章,有同學提到了這個問題,我是這麼回答的:

作者提出這幾個問題的目的,是告訴讀者,即使已經在混音的人對很多知識可能也是一知半解的,對一些基本問題認識不清楚,阻礙了你的水平提升。但這幾個問題你並不需要著急馬上弄清答案。

很多人第一次讀這本書,只停留在理解字面意思,並不會聯繫上下文以及全書結構去揣摩作者寫這一段的意圖是什麼,所以自然閱讀效果不好,我也是當了作者以後才領悟到這一點。

【1】當音頻工作站軟體的總輸出音軌上顯示削波時,是應該將所有通道上的推子都向下拉,還是把總推子向下拉即可以?

【2】為了達到更自然的效果,可否使用一個或多個混響器?

【3】在壓縮器上,什麼時候應該啟用立體聲綁定(Link)功能?為什麼?

【4】什麼時候應該添加抖動(Dither)處理?

之所以我不直接回答這幾個問題,是因為每一個問題背後都涉及眾多知識關聯,不是兩句話就能說清楚的。而且答案就在書里,等你把這本書後面章節的內容掌握了也就理解了。

這本書能有老師帶著讀最好,自學讀前面一兩遍。有時不太能理解作者想表達什麼。如果對混音指南拆書學習感興趣,可以私信我。不過參加我的訓練營稍微有一點門檻。


1. 可以拉總輸出軌道,但是動態範圍可能過大導致響度不夠,這種情況可能就得單獨拉低電平值最高的那個軌道之後再拉低輸出軌。

2. 不知道怎麼定義更自然,一般來講一個混響類型夠用,但是實際上有的風格鼓需要1秒左右的混響,而吉他Solo卻需要3秒以上的混響。這取決於作品風格。

3. 這個很簡單啊,你要壓的軌道是立體聲時自然要Link兩個軌道。或者兩軌直接發送到Aux上壓縮也是一個正確的approach。關鍵就在於節省系統資源以及左右聲道壓縮參數一致。

4. Dithering一般留給母帶工程師,做完處理,準備24bit轉成16bit Consuming時用作雜訊補償,混音工程師,錄製工程師一般不用管。


絕對不要動總軌,因為如果你到了0,往下拉匯流排,你整體的動態餘量還是沒有留出來。但是向下拉所有的推子,可以留出餘量給母帶。參考數值是-6lufs

混響主要看你想做什麼樣的效果,你是做空間感,就選擇方便只用早期反射,不用混響的尾巴的插件,再比如軍鼓類的板式混響用的多等。不同的樂器處理方法和混響類型都不一樣,處理方式也不一樣。

壓縮起立體聲連接的原因主要是在如果音頻信號的左右聲道動態不統一的時候使用。比如說如果是雙單聲道壓縮,動態大的一個聲道會被壓得比較重,而另外一個聲道則比較輕,這時候一般需要根據音頻信號和想要達到的效果來決定。

抖動一般交給母帶師。

學混音記得找好老師,不然走很多彎路,混音是在做碎片化一萬個小決定,最後很好的把他們柔和在一起。


別私信詢問樓上那個垃圾人的訓練營

十足的low b 一枚

沒一點真實實力還出來坑錢只會各種說沒真作品


推薦閱讀:

耳機和音響相比,在聽覺體驗上,各自有什麼優勢?
把悲傷留給自己是在怎樣的情緒下寫的這首歌?
作為獨立音樂人,該如何正確銷售自己的音樂?
音樂是不是向前進步的?為什麼經典老歌百聽不厭?
為什麼說許嵩、汪蘇瀧、徐良是QQ音樂三巨頭,聽他們歌很低端嗎,他們和其他音樂人的區別?

TAG:錄音 | 音樂製作 | 混音 | 混音師 |