剛Google了一下,有人thesis project 做過這個 Music In Images- Algorithmic music production from digital images 。按照他介紹的,基本思想就是講圖像pixel-level的一些屬性(brightness, saturation, hue, color variation etc.) 映射到音樂空間的一些屬性(melody,chord,duration,tempo etc.), 具體映射方式,應該他有一套自己定義的函數。然後播放的方式,是raster-scan 所有的像素。 還有一些用line-scan的: 1)Photosounder.com 2)SonicPhoto - Convert pictures to sounds! 上面兩個的demo是youtube上的,可能需要翻牆。 之前還看到過以色列一個科學家,把一些簡單圖片(數字,字母)轉換成不同的聲音,之後培訓盲人,讓盲人能夠分辨不同的聲音對應不同數字圖片,最後盲人也就基本能讀懂我們正常人看的書了。 這個牽涉到人類視覺感知和聽覺感知的轉換,特別是視覺感情和音樂感情的映射。感覺想要做好,需要了解一些認知科學,腦科學和心理學的一些知識。想法挺有意思的。
可以把圖像通過matlab轉換成頻譜,再用頻譜生成聲音。 但頻譜生成聲音的過程我也很想知道大概怎樣操作,這學年的project就是研究圖像轉換聲音,希望有想法和建議和我交流QAQ,謝謝啦!
色彩分割 圖形計算 生成byte數組 再通過各種本地方法轉化成音頻。
邊緣識別 + MIDI擬聲合成。
就這幅圖而言,估計是一段雜訊。
這家公司做的東西 http://www.muvee.com/en/ 和你想要的東西相近。我沒有用過,但聽過創始人 Peter Kellock 對此產品的介紹。你自己看看吧。
推薦閱讀: