什麼是Chroma Features?

最近再看音樂處理的東西,看到有人說到Chroma Features,但是自己翻來翻去不知道這個到底是什麼意思,有什麼作用,希望懂音樂和信號處理的幫忙解答下!


最近做畢設研究了一些和弦檢測的方法,發現題主說的chroma對於和弦檢測來說真真兒是一個非常有用的feature!我就根據看到的資料,按自己的理解幫題主解答下,有不對的地方歡迎指正^-^

如果非要翻譯,那我引用下論文"基於色度特徵和動態時間捲曲演算法的音頻與樂譜對位[J] 現代圖書情報技術, 2012(1):40-45」里的原話:

色度特徵是色度向量(Chroma Vector)和色度圖譜(Chromagram)的統稱。色度向量是一個含有12個元素的向量,這些元素分別代表一段時間(如1幀)內12個音級中的能量,不同八度的同一音級能量累加,色度圖譜則是色度向量的序列。

不知道題主是否清楚「音級」、「八度」等音樂概念, 以鋼琴為例,它可以被彈奏出88個音高(pitch),但我們可以發現這些音高都是以do, re, mi, fa, so, la, ti七個白鍵音符(及其之間的五個黑鍵)為一組「循環」出現的,某一組中的do和下一組中的do就是一個八度的關係,如果忽略組與組之間的概念,那麼這十二個音即構成十二個音級。

那麼拿到一個音頻文件,如何提取出它的色度特徵?看下圖~

這張圖截取自Automatic Chord Estimation from Audio: A Review of the State of the Art[J]. 2013. 論文中有對每一步驟的詳細說明~

簡單來說就是把音頻文件做傅里葉變換從時域轉變為頻域之後,做一些降噪處理,再「像給不同的鋼琴調弦到標準頻率」一樣做tuning;將絕對時間按照所選窗的長度轉換為幀,並將每一個音高在每一幀內的能量記錄下來,成為音高圖譜;在音高圖譜的基礎上,將同一時間、同一音級、不同八度的音符的能量(以響度計)疊加到色度向量內該音級的元素上,成為色度圖譜。比如看上圖色度圖譜的第一個大格,C E G這三個音級非常的亮,那麼我們可以判斷音頻的這一時間內有C大調主和弦(Cmaj)被演奏了!

具體有什麼作用……我只能說在目前和弦檢測的特徵提取中還是很典型的一種方法~還有什麼其他作用,還得看更多的資料才能回答啦……

希望對題主有幫助,以上!


推薦閱讀:

「兒子,『覺』、『就』、『舒』等部首是什麼啊?」——部首檢字法之議
在一千份判決書中找到你要的案例——法律檢索技巧要點(二)
「馬萊茲克模式」中的馬萊茲克,究竟是何許人也?
怎麼檢索某一年的主要新聞內容,或者是某一年某個領域的新聞內容?
如何進行完備而高效的法律檢索?

TAG:音樂 | 計算機 | 音樂檢索 | 檢索 |