「不同樂器的音色不同」是指什麼?

在耶魯的公開課里講到,不同樂器的泛音階什麼的原因決定了樂器和樂器的不同。沒看明白,能詳細解釋下不?


「怒答!」

首先, 要了解不同樂器的音色為什麼不同, 需要了解「泛音」是什麼。

比如說,用鋼琴彈奏出一個中音 do 和用吉他彈奏出一個中音 do 相比,為何大家可以輕易地分辨出哪個音是由鋼琴彈奏出的,哪個音是由吉他彈奏出的?從理論上講這兩個聲音的音調(頻率)不是一樣的嗎?

其原因就在於,樂器演奏出的聲音,並不是由單一成分的頻率構成的。事實上,他們是由一組頻率構成的,而這一組頻率,往往滿足倍數關係,即假設我們在用小提琴拉出頻率為 1000Hz 的音調時,其往往伴隨著 2000Hz、3000Hz、4000Hz ... 等一系列頻率的聲音產生。在學術上,我們將我們本來打算讓小提琴產生的音調的聲波稱之為基波【在樂理上稱之為基音】(因為這裡的 1000Hz 是整個音調的基礎);將由於小提琴自身的原因,同時伴隨發出的音調的聲波稱之為諧波【在樂理上稱之為泛音】(包括 2000Hz、3000Hz 等聲音的成分)。

接下來,要了解為什麼會出現「泛音」,需要知道樂器的發聲原理是什麼。

那麼為什麼這些諧波一定要是基波聲音的整數倍?這就涉及到樂器的發聲原理了。所有的弦樂器、管樂器和打擊樂器的發聲原理都是靠駐波來實現。駐波產生的原理就是,對於一根琴弦(比如吉他,小提琴)來說,由於琴弦的兩端被固定(當左手按弦時也是兩端分別被固定的),所以當我們用手(吉他)或者琴弓(小提琴)使琴弦振動時,琴弦被固定的兩端不能動,所以琴弦振動部分的長度必須是半波長的整數倍(這裡有些不太好理解,但是看看下面這張圖大家就懂了)

圖片來源:百度詞條 · 駐波 http://baike.baidu.com/view/166374.htm

該圖中最上方的那張圖的振動情況是最符合實際琴弦振動的情況(當然這也很好理解,想像一下用手指撥一下吉他的琴弦,琴弦的振動看上去就很類似)。這時琴弦的振動頻率剛好是與基音的頻率相同的(就是例子中的 1000Hz)。但事實上,如同第二張和第三張圖片所展示的振動情況,也伴隨著一起發生。

正是因為受到不同不同樂器構造,共振腔體以及製作工藝等的影響,當我們用手指撥動琴弦時,也許有 80% 的能量被轉換為整個琴弦的振動,產生了基音;但同時也會有 10% 的能量被轉換為 2000Hz 成分的頻率,5% 的能量被轉換為 3000Hz 的成分,但是 2000Hz 的成分從某種意義上來講也可以是基音,於是又可以轉換為 4000Hz,8000Hz 的成分,3000Hz 當做基音時...這麼推算,情況將是非常複雜的,也正是因為這種複雜性,才會導致樂器的家族是這麼龐大;才會導致每一個樂器都是獨一無二的存在,擁有他們獨一無二的音色。

然後,為了能讓大家有個更直觀的了解,我將簡單地使用 matlab 來演示一下當不同音調的成分加入到基音以後的效果。

因為這是從數學上隨意寫出的算式獲得的振動情況,所以請勿對號入座為某個樂器的聲音波形——實際上這些波形相對於實際的樂器振動情況已經簡單純粹到很難用一個真正的樂器來重現這些振動情況了。

正常的 1000Hz 波形——這是基音。

1000Hz,4000Hz 與 8000Hz 成分能量比為 8:1:1 時的波形——可作為樂器1的音色

1000Hz,2000Hz 與 4000Hz 成分的能量比為7:3:1時的波形——可作為樂器2的音色

1000Hz 與 12000Hz 成分的能量比為 9:1 時的音色——可作為樂器3的音色

看上去這些圖形已經十分複雜了,其實如果把這些波形還原為聲音,用耳朵聽上去就像你拿起電話時聽到的待機聲那麼簡單純粹。所以想像一下,如果我們將這些成分任意地調整,僅僅保留 1000Hz 的主音調還是不變,能產生出多少種音色呢?

最後,這裡僅僅討論了諧波對於音色的影響,實際情況中還需要考慮其他因素——因此,強烈推薦感興趣的知友研究一下 @pansz 知友的答案 :-)


如果你需要一個自己做實驗能得來的解釋,最簡單的方式是:用不同樂器演奏相同的單一音符,然後把它都錄製下來,用pc的音頻編輯器打開,查看其波形圖,以及頻譜分析圖。這可以得到最直觀的印象。

其他的大家都說了,我補充幾點。

不光是包含的頻率成分不同,還有信號衰減曲線的不同。而且每個頻率成分都不一樣。

非整數倍頻率可能出現,用個頻譜分析看看就明白了。


這個問題還是看我的視頻加動圖gif吧,清楚多了

圖解泛音及形成原理

視頻封面解讀泛音及形成原理【兼談氣泡音怒音嘶吼】視頻

視頻:解讀泛音及形成原理【兼談氣泡音怒音嘶吼】

首先,泛音到底是什麼,很多人都不知道。標準答案是:泛音是物體局部振動產生的。

啥是局部振動?

(知乎不支持gif,原圖是動圖,很清楚的,大家請到我的原帖觀看圖解泛音及形成原理)

非常清楚的局部振動,一根弦分成四段分別進行振動。這四段的振動頻率是一樣的。

我常講的第一泛音,第二泛音就是這樣的:

圖上依次是基頻,第一泛音,第二泛音。。。

可以看到,分的段越多,形成的頻率越高。比如分兩段,那頻率就是基頻的二倍。應該挺容易理解的吧。

真實的聲音就是這些振動的疊加,視頻里有展示。

泛音形成的原理:駐波

視頻里很好的展示了駐波形成的原理,同頻波經過反射形成了疊加。所以,能形成駐波,必須是物體長度是1/2波長的整數倍。這樣才能形成疊加。

這就是物體振動總是有固定頻率和固定音色的原因:只有一些頻率的波才能在物體中形成駐波,從而持續下去。其他頻率的波很快就會能量消散掉。

所以一個音叉,你怎麼敲它,它都是那個振動頻率,就是這個道理。

那怎麼調節音高?

參考弦樂,一根兩端固定好的弦,本身的頻率是固定的。改變音高的話:

1. 把弦拉緊一點。

2. 用手指按住一點,讓弦的一部分不振動,可振動部分長度縮短。

聲帶也是一樣的道理:

1. 拉長聲帶,可以獲得更高的音高。縮短聲帶,音高變低。

2. 捏住聲帶的一部分不發聲,讓另一部分發聲,這樣音高就提高了。這就是近年來所謂關閉唱法的基本原理。(關閉唱法的提法可能有問題)

人聲的情況

人聲的情況要複雜一些,因為聲帶不是一個簡單弦,它是一個立體的東西,更像這個圖:

立體的基頻與第一泛音。

人聲還有共鳴的問題,會大大改變泛音的構成。

可否存在這些頻率之外的波?

可以。有很多種情況,視頻里舉了主要的幾個。


音色的類型是由振源的特性和共振峰的形狀共同決定的。就振源來說,諧波衰減快,音色就很

柔和,聲音的融合性和穿透力好,例如人聲和弦樂器;諧波衰減慢,音色就很堅硬,聲音的融合性和穿透力差,

例如木管樂器(特別是雙簧管和薩克斯管)。就共鳴腔來說,共振峰出現在較低的頻率上,音色就暗淡,例如長笛;

共振峰出現在較高的頻率上,聲音就明亮,例如小號。某些音色具有多種特性,例如人聲的音色既柔軟又暗淡,

雙簧管的音色既堅硬又明亮,圓號同時具有暗淡和明亮的音色。

音色的不同取決於不同的泛音,每一種樂器、不同的人以及所有能發聲的物體發出的聲音,除了一個

基音外,還有許多不同頻率的泛音伴隨,正是這些泛音決定了其不同的音色,使人能辨別出是不同的樂器甚至不同的人發出的聲音。每一個人即使說相同的話也有不同的音色,因此可以根據其音色辨別出是不同的人。

(以上引用自http://zhiyeshengya.blog.sohu.com/164747896.html)

耶魯大學公開課 聆聽音樂(Listening to Music)04課中有講到的是上面提到的泛音

就是說每個樂器彈奏同一個音,都會有一個基本音(圖中第一個高峰),而與此同時也會有許多其他泛音(後面的N個高峰)。樂器的音色主要是看後面的泛音。從圖中可以看出後面這些高高低低的沒什麼特定規律,不同樂器演奏出同一個音,第一個高峰基本相同,而之後的高峰差異很大,這就導致了不同樂器的不同音色。也就是說我們聽到一個音,不是單一的一個音,其實是很多分音的混合。所以如果調整後面的泛音,就可以把一種樂器的音色調整成另一種樂器的音色。 造成這種差異主要是樂器的構造、材質不同。


如果你寫過生成聲音的程序的話就知道了,一組表示音符的參數到波形的函數。

這個函數可能會非常複雜,不過對於大多數情況,可以去掉一些無關變數,比如時域平移不變性等。


音色的類型是由振源的特性和共振峰的形狀共同決定的。首先要了解不同樂器的音色為什麼不同,需要了解「泛音」是什麼。樂器演奏出的聲音並不是由單一成分的頻率構成的,而是由一組滿足倍數關係的頻率構成的。所有的樂器的發聲原理都是靠駐波來實現。駐波產生的原理是,對於一根琴弦,由於琴弦的兩端被固定,所以琴弦振動部分的長度必須是半波長的整數倍,我們知道頻率等於波速除以波長。當我們撥動琴弦時,也許有 80% 的能量被轉換為整個琴弦的振動,產生了基音;但同時也會有 10% 的能量被轉換為 2 倍頻的振動,5% 的能量被轉換為 3 倍頻,但是 2 倍頻的成分從某種意義上來講也可以是基音,又可以轉換 4 倍,8 倍的成分……每種樂器的能量分配比例都不同,於是導致每一個樂器都是獨一無二的存在,擁有他們獨一無二的音色。


樂音的音色,應該包含該樂音的起振、穩態和衰減三階段,劃分三個階段的依據主要是頻譜。

其中,起振階段對音色起到非常重要的作用,起振階段不易收到演奏所在環境聲學特性的影響。而衰減階段只是影響音色感覺的因素之一。

一些心理聲學實驗表明,當樂音的起振階段和衰減階段去除後,聽音者很難辨別不同樂器的音色,例如,如果把錄製的小提琴的樂音和同一音符的小號錄音的起振階段和衰減階段去除,則聽音者很難將二者分開。

在樂器起振階段,弦樂器的弓弦摩擦聲、銅管樂器的輔音式起振、吹笛者的呼吸雜訊、簧片起振時的拍打聲、鋼琴琴錘發出的沉悶打擊聲,以及撥弦鍵琴的琴錘最終回落在琴弦上的聲音,都是人們辨別不同樂器聲音的「」「線索」。

Helmholtz關於音色理解的四條一般性規律為:

1)簡單的樂音,例如音叉在共鳴室產生的聲音,一般聽起來比較柔和,令人愉悅,不存在粗糙感,但欠缺強度,並且低音顯得單調;

2)包含中等強度的約6次以下的諧波分量的聲音聽起來更和諧,更具有樂感,並且月簡單樂音相比,音色豐富而華麗,在缺失高次諧波分量時,其音色十分甜美,柔和,開放式管風琴音和圓號發出的輕柔聲音屬於這一類;

3)如果聲音只包含奇次諧波分量(如狹窄的封閉式管風琴音管,單簧管),則音質較空洞,當包含大量奇次諧波分量時,聲音鼻音較重;當基頻較強時,音色較豐富,當基頻與高次諧波相比不夠強時,音質較差;

4)當高於六次或七次的諧波較顯著時,音色比較刺耳和粗糙。與其他類似音色較柔和的樂音相比,更適合產生力量感。


雖然系統+不系統地學音樂很多年了,但是一直卻沒思考過這個困擾多年的問題——音色是什麼?

(多圖預警)

.

.

1,聲音是機械波(Wave)

初中物理課說過,聲音有好幾種基本屬性:響度、音調(音高)、音色。然後聲音就是靠介質(日常生活里這個介質就是空氣)振動傳播到耳膜的,所以本質上聲音就是一種機械波(特指縱波,也就是壓縮波,靠介質局部密度變化來傳播)。這樣一來,聲音就可以用波形的形式來描述了。

既然選擇用波形來描述聲音,那麼一直困擾著我的問題就是音色好像沒有對應的物理/數學意義.

y = Acos(omega t+ phi )

響度嘛,好理解,不就是波形的振幅嘛。

音調,老師說就是頻率的高低嘛。

那音色肯定不關相位的事,那音色究竟對應什麼??(黑人問號.jpg)

.

.

2,搜索引擎怎麼說

[1]音色(Timbre)是指聲音的感覺特性。不同的人聲和不同的聲響都能區分為不同的音色。音調的高低決定於發聲體振動的頻率,響度的大小決定於發聲體振動的振幅,但不同的發聲體由於材料、結構不同,發出聲音的音色也就不同,這樣我們就可以通過音色的不同去分辨不同的發聲體音色是聲音的特色,根據不同的音色,即使在同一音高和同一聲音強度的情況下,也能區分出是不同樂器或人發出的。同樣的響度和音調上不同的音色就好比同樣飽和度和色相配上不同的明度的感覺一樣。

音色又名音品。音色的不同取決於不同的泛音,每一種樂器、不同的人以及所有能發聲的物體發出的聲音,除了一個基音外,還有許多不同頻率(振動的速度)的泛音伴隨,正是這些泛音決定了其不同的音色,使人能辨別出是不同的樂器甚至不同的人發出的聲音。每一個人即使說相同的話也有不同的音色,因此可以根據其音色辨別出是不同的人。

百度百科前一段比較划水,只說了普通樂器音色不同的成因,沒說到本質。後半段提到句比較本質的,別的高票答案也有提到:音色的不同取決於不同的泛音與基音的混合比例。

.

.

.

3,音調、音階、頻率、泛音

來扯一點小科普- -。現在用的最多的音樂定音高的辦法就是十二平均律(12TET,twelve-tone equal temperament),其實就是平常的CDEFGABC(do-re-mi-fa-so-la-si-do)為一個八度,一個八度有十二個半音的這種表示法。

國際標準的A4(第四個la)是恰好的440Hz,其他半音都可以根據這個標準的音來推得頻率。po張表,表中給出了半音和頻率的關係:

.

各個半音怎麼推呢?有個很兩個重要的定義要知道:

1,假設有兩個音高A與B,若B比A高八度,那麼B的頻率就是A的兩倍。

2,所有半音(semi-tone)對應的頻率的序列是一個等比數列,所以顯而易見的,相鄰半音的頻率比就是【2的12次方根】。

好像扯遠了,扯回來- -,某個音的泛音(Harmonic)就是某個音整數倍頻率的音。[3]例如f(A4)=440Hz,它的泛音列就是440x2=880Hz,440x3=1320Hz, 440x4 = 1760Hz, 440x5 = 2200Hz.....所以音色的不同就是因為某個基音和它的眾多泛音的混合比例不一樣

.

.

.

4,我自己來分析一波:先從數字音頻開始

現在是信息化時代,所有的媒體都能數字化了。數字圖片能用RGB或者RGBA等顏色系統來表示顏色,數字音頻能通過對聲音模擬信號的採樣(Sample)來記錄聲音的數字信息。

所以數字音頻本質上是一個一維離散函數,不僅自變數離散,連值域也是離散的,都因為計算機數據儲存原理的限制只能取有限個值。播放音頻的時候,一個Sample就對應著一個「聲源震動膜」的位置(註:這是我個人的理解,如有錯誤請指出),快速連續地播放,震動膜位置被精確控制著震動,就呈現出了多姿多彩的聲音了!

一般高質量一點的數字音頻,例如DVD每個採樣至少都是16 bit了,也就是2 byte,一共65536*0.5=32768個不同的響度任君選擇(因為數字音頻的振幅也可以落在正半軸和負半軸)。事實證明,反正大家其實耳朵對沒想像中那麼靈敏,分這麼多個響度級別完全是夠用的=。=

.

.

.

5,我們用Adobe Audition分析下同一個音高不同音色的波形

我這幾個月真是有那麼點不務正業,代碼不寫幾行跑去做電子音樂→_→電子音樂有個比較明顯的特色就是很多音色使用演算法或者公式合成的。例如完美的正弦波,估計自然界很難錄下這種完美的採樣吧,但是電子音樂就可以做到精準地合成,同時也就沒那麼的「自然」,而更多得有了「電子」的感覺。

分析開始,我們打開FL Studio 10,添加幾個channels。

這裡我添加了幾種音色,分別是:

  • 80年代遊戲機,也就是超級馬里奧BGM的音色,4-bit音色
  • TruePiano插件的大鋼琴音色
  • Fl Slayer合成器的電子bass預設音色
  • 還有完美的正弦波音色(聽起來像是嘟嘟聲)

這四種音色我都給他們的放置一個A4的音,分別導出.mp3文件。

然後我們打開Adobe Audition CS6,專業音頻處理軟體,看看各種音色的宏觀波形,微觀波形(這裡宏觀和微觀指的是時間尺度),以及頻譜(就像是頻率分布表):

(其中圖片上方綠色的是波形;下方紅黃紅黃的是頻譜,越亮的表示那個頻率的波形分量響度佔比越大)

  • 正弦波音色的宏觀波形與頻譜

微觀:

  • 貝斯音色的宏觀波形與頻譜:

微觀:

  • 4-bit音色的宏觀波形與頻譜

微觀:

這個音色用多了cpu的佔用率也會打打上升,難道是因為頻譜太複雜了嗎

  • 鋼琴音色的宏觀波形與頻譜

微觀:

所以可以發現,雖然大家都號稱發出了A4的音高,但是他們微觀的波形pattern和頻率分布是非常非常的不同的,所以也就造成了不同的聽感,也就是我們常說的,音色。

這麼說的話,我覺得甚至不需要提到泛音這個概念,乾脆說是一個較短時間內的頻譜的差異造成音色的差異(僅個人觀點)

.

.

.

6,我自己的想法

我覺得吧,我們拿441Hz的音來舉例子,普通的音樂採樣率是44100Hz,也就是這個441Hz的音每個周期就有100個採樣。一個周期里100個採樣估計能玩出花來啊!我覺得這樣的一個周期就基本上決定了音色。所以音色在時間尺度極小的時候談論是沒有意義的,它是頻率、振幅及其變化在更大時間尺度上的平均體現

或者從傅立葉變換的頻域的角度去看,我們對一段音頻進行傅立葉變換,得到這段音頻的各頻率上振幅的向量:

overrightarrow{A} =(A_1,A_2,A_3...,A_n)

這個向量維度這麼高,就是自由度也很高。這個向量玩出花來,就等於把音色玩出了花來。電子音樂的合成器和特效應該也是用了這些原理。

.

.

.

7,最後

最近偶爾就在寫音色合成器,看看能不能玩出花來。話說電子音樂和計算機圖形學這些科學、工程和藝術的結合體 真是很吸引人好吧!

.

——————————————————————

引用Reference :

1.百度百科-音色 http://baike.baidu.com/link?url=uK_uUqR2X6FJfrea8BlMYkQKlkw-6A3E_6hqcOP_qxmKJX9nFw2lBBJswO9uWvPxrj8-p3S9jwyiGeNC22mEx1ypUGOuVvjFHIqCBjqoPVu

2.八度音階和頻率的關係 http://www.cnblogs.com/cute/archive/2013/02/28/2937222.html

3.百度百科-泛音 http://baike.baidu.com/link?url=emTehxqJfsO3QuCiDhjD4UvW7cYieY_BLtxQl9nh9aAhP0eqkBhLVyINrPG2n_sINFipnftThYVIvERMMkhkPOmXeFvKWiCycmSG1hUIN2u


高票回答說得比較好,其他答案太多指東打西,各種數據理論搬上來其實也不是在說「音色」的問題。

我來補充一點大家都沒談到的。

其實日常生活中說的「音色」和聲學中的「音色」不太一樣。日常生活中「音色」除了受聽音環境,演奏方法等變數影響之外,音色與音色之間最大的差別,最大的供我們識別的特徵其實是「包絡」

「包絡」

即ADSR

ADSR (Attack, Decay, Sustain and Release)就是一個聲音的觸發、衰減、延續、釋放

通俗的也可以理解為「音頭」「音尾」等等

不同音色的ADSR圖形不一樣,不同階段時間不一樣,能量不一樣,有些甚至會缺少ADSR中一到兩種階段。 這個差異在我們日常生活中更多作為特徵被我們聽覺習慣提取。

所以在講完諧波(泛音)之後,用鋼琴和吉他來舉例顯然是不合適的。兩個擊弦式弦鳴樂器的諧波並沒有那麼大的差異。(甚至我個人覺得這個差異是人耳很難分辨的,不信可以把音頭音尾都剪掉做一下聽辯試試),兩個音色之間更大的差異在包絡。

總結,在日常生活中說的「音色」與聲學中的「音色」是不一樣的。日常中更多靠聽覺經驗,聲學中只聊物理特性(把其他變數排除在其他章節)。混淆了這兩者,可能是許多學習者不能很好的了解「諧波」(泛音)的原因。


呃,從吉他的角度來說,決定吉他音色的因素不外乎木材、琴弦、做工以及演奏者的水平。類推到各種樂器,應該還加上樂器結構以及演奏方式吧。

至於頻率、振幅之類,太複雜了吧←_←

好吧,我只是一個賣吉他的~


聲音是由發聲的物體振動產生的,當其整體振動時發出基音,但同時其各部分也有複合的振動,各部分振動產生的聲音組合成不同頻率的泛音,這些泛音決定了其不同的音色。


從信號處理的觀點看

演奏出的音樂可以看作譜子和(這個樂器的響應函數)的卷積,音色就是這個響應函數


其實就是共振峰不同


電吉他效果器可以說明音色的區別,很好理解


如果事前準備一本參考書。類似音色,其實節拍相同就行!


推薦閱讀:

女生聲音很低沉 可以怎樣改善自己的聲音呢?
音色一般就沒法超越那些音色好的人嗎?
Fender 的 Telecaster 和 Stratocaster 音色上最大區別是什麼?
音色有好壞之分嗎,如果沒有,那為什麼在挑選吉他的時候,會講究說這把音色好,那把音色不好?
張惠妹的唱功怎麼樣?

TAG:音樂 | 樂器 | 物理學 | 音色 | 聲學 |