日常民用方面，為什麼視頻技術年年有發展音頻技術卻好像一直沒有發展？

01-18

視頻技術年年有突破2K 4K 8K
但是音頻技術一直沒有聽到有什麼技術發展？

音頻是需要用專業播放設備來聽唱片才會感覺到有多好，而且還得有一副金耳朵，經過了壓縮的MP3是有損的音質，甚至再上傳到視頻網站的音頻會變成單聲道，就算做成7.1聲道，能用這些普通設備聽出什麼效果？而視覺上只要不是瞎子，哪怕是近視眼遠視眼都能看出來清晰度的提高，音頻工作者用高檔設備不斷提高音頻採樣率和採樣精度，而聽眾們不斷去壓MP3，用毫無低音增益或者低音誇張的廉價播放設備去聽，讓音頻工作者情何以堪？

偽命題。

首先，音頻技術並非一直沒有發展

視頻有2K4K8K

音頻也有High-Res Audio High-Resolution Audio

只不過音頻的市場沒有視頻那麼大，所以宣傳力度不夠，非愛好者可能還沒有聽說過而已。

其次，視頻技術同樣越來越難以突破

很多回答說96K和48K的音頻的差距人聽不出來云云，確實，效果差距比聽48K和24K的差距小得多，

但是去看2K4K8K的視頻和FullHD的差距，同樣要比和看FullHD和SD的差距小得多。

技術上，並不存在音頻劣於視頻。而是兩邊都到瓶頸了（音質畫質已經接近人能感知的極限了）

另外，消費者也並非不買賬。事實上High-Res Audio的設備賣得還挺不錯的。還是上面的話，只是宣傳力度不夠大，看起來沒有造成視頻的4K8K一樣的話題效應而已。

所以，對本題的回答是，音頻技術發展確實越來越慢了，但是和視頻比，僅僅是稍微慢了一點點，因為視頻技術的發展同樣越來越慢了。

下面是幾個關聯問題的解釋：

1，為什麼音頻視頻技術發展越來越慢了？

這個可能最不需要解釋大家都明白，一件事60分做到80分很容易，90分到98分很困難，98分到100分則是難於登天。而對於音頻視頻來說，如果以人的眼睛耳朵能夠感知的極限程度作為100分的話，視頻大概在90分，音頻已經在95分了，再提高已是難上加難。

現在大多數行業大多數技術，都存在著發展速度越來越慢的問題，這裡就不表了。

2，為什麼音頻視頻技術發展會比視頻技術稍微慢一點點？

因為視頻要比音頻複雜，一般說的視頻是2維平面加1維時間，音頻是1維振幅加1維時間，所以很多技術都是在比較容易實現的音頻上先完成，然後再移植到視頻上去的。

這就造成了音頻技術比視頻技術更接近那個理論上的極限。

上面的回答已經說過，人的眼睛耳朵能夠感知的極限程度作為100分的話，視頻大概在90分，音頻已經在95分了。

業內普遍認為視頻技術落後音頻技術10到15年，也就是說，哪天音頻技術完全無法進步了，視頻還可以吃音頻的老本繼續進步10-15年，當然，這10-15年的進步帶來的性能提升其實微乎其微（99分→100分）。

所以，音頻視頻技術發展會比視頻技術稍微慢一點點。

3，那音頻技術真的就發展到盡頭了么，未來的出路在何方？

其實，上面我說的所有的音頻視頻技術，包括提問者和大部分其他回答者口中的音頻視頻技術，所指的僅僅是視頻音頻技術中的一個分支---以提高畫質和音質為目的的音視頻技術。

在這個分支上，我們能做的確實已經不多了。

不過，還有其他很多有意思的分支，他們都是未來發展的方向。簡單介紹幾個。

① 3D音頻

視頻的3D可能很多人都知道，但是音頻的3D卻知者寥寥。

看電視時，畫面中人物說話，其他物體發出的聲音，其實並不是從面面中那個發出聲音的物體那里傳來的，而是從電視機的揚聲器傳來的。

或許大家已經習慣把揚聲器傳來的聲音腦補成畫面里的聲音，不過哪天如果你真正聽到人的說話聲真正從面面中那個人的嘴巴中傳出，每一個物體的聲音你都可以不看畫面就分辨出在哪一個位置，你會驚嘆，原來聲音還可以這樣的！（至少我在有幸聽過後，被震驚了）

② 有源降噪

不要以為名字叫降噪就真的只能去噪音。

確實，迄今為止的降噪功能僅僅是降低聽音樂時的環境噪音，不過，我們來想想有源降噪是什麼東西：把聲音先錄進設備中，然後把音樂留下，把噪音除去。其實，這是在做一件很有意義的事情---對聲音進行選擇！

這個技術發展下去，我們以後就可以對自己聽到的聲音進行篩選，只聽自己想聽的聲音，屏蔽其他所有聲音。可以在地鐵中把周圍嘈雜的聲音都濾過卻留下報站的聲音，在嘈雜的教室的後排照樣聽得清老師上課的聲音，在合唱中消去某個你不喜歡的歌手的聲音(這個比較難)，甚至換上你自己的聲音。創意無限，任你創造～

③ 語音技術

這個有很多人說了，我就不贅述了。目前公認最有前途的分支。

沒有經過訓練的耳朵，44100和48000，16bits和24bits有什麼區別是根本聽不出來的。

視頻技術的突破對於普通人來說意義都很大，而音頻技術的突破相對來說只對專業的音頻工作者意義較大。

一個東西受眾面小了，利益空間自然會受到壓縮，無疑會導致進步相對較慢。

但從技術上講，音頻技術的中的source separation一旦突破，將極具前景。

這是因為人眼比人耳更加敏感，你可以分辨出高清標清的分別，3D2D區別，但是很難分別48K96K採樣率的分別。聲音三要素：音色、音調（由頻率決定）、響度（由振幅決定）。從數字音頻說因為人耳能聽到的頻率撐死了也就是20-20khz，現在的數字音頻已經能夠滿足除了發燒友外的絕大多數人。除非你是蝙蝠啊啥的才需要更高的採樣率。響度就是振幅方面就要考慮比特率，現在很多技術都是針對比特率說的，比如說16bit和24bit，1bit數字流，仔細聽是有很大差別的，但是24bit和數字流帶來的問題是音頻文件太大，對於現在的傳輸和存儲是很不方便的，性價比太低，又不是很明顯的提高，因此多存在於專業音頻製作中。而環繞聲技術的發展也是更多地運用在影院里，你不會天天背著好幾隻音箱出門。很多電視節目比如訪談類的新聞類的能聽見就完了，誰還在乎環繞不環繞呢。

歸根結底還是需求。現在的音頻技術已經完全滿足老百姓的需求。實在要說發展我估計方向可能是更好的壓縮編碼技術。更好的音質和更小的容量。

手機碼字不請自來

音頻技術發展確實較慢，現在最流行的話筒還是上個世紀的u87。當然，這些年也有新技術，比如杜比全景聲Atom、AAC編碼、現場擴聲的VENUE、後期的Nuage等等。

我覺得音頻技術已經相當成熟了，視頻要走的路還很遠。。

看到前面朋友的回答說到人耳解析度的問題，以及音頻製作的技術瓶頸等，我來補充一下。作為一個音頻行業從業者，以及資深的音頻製作愛好者，我必須說音頻技術沒有發展這本身是個偽命題。因為我每天就在和最新的音頻技術打交道。

但站在普通消費者的角度，我也完全理解樓主的感受。身邊的攝影愛好者成群結隊，音樂發燒友卻只能孤芳自賞。最近很火的AR、VR、全息投影、曲面顯示屏都與視覺體驗提升相關。但音頻技術的升級，尤其對個人移動端而言，似乎遙遙無期。雖然iPhone7為了薄機身捨棄3.5插孔，但新一代藍牙耳機在帶寬和音質方面表現如何還有待檢測。

對此現象，我簡單地從以下三個方面進行分析：

1. 相較於視頻，音頻市場較小，人們對好聲音的執著比不上對畫質和觀感的追求。

這個行內人深有體會。不可否認，人的視覺比聽覺更靈敏。有測試說，人對外界的感知能力，視覺能達到85%，而聽覺只能達到15%左右。即便這樣，現在的音頻技術也遠遠未達到15%的極限。很多視聽娛樂方面革新的音頻技術，例如DTS公司的新一代「以聲音為對象」的編解碼技術DTS:X（後面會解釋），以及它在移動端的沉浸式音頻技術拓展
DTS Headphone:X，普通人也能輕鬆分辨。而且，對於高品質多細節的聲音，聽得越多，耳朵的靈敏程度越高。「金耳朵」就可以通過後天訓練出來。

就算能聽出區別，仍有很多人對音質不屑一顧。花大價錢就不說了，隨意地壓縮、用廉價的設備播放，甚至有些人擔心手機內存不足，連免費的大尺寸音樂文件都不願意下載。音頻工作者不斷升級設備，提高環繞音軌的采編質量，無損輸出。但聽者卻把音源不斷壓縮，浪費采編者的心血。這種情況下，那些願意投入巨資研發新技術的音頻製作公司，簡直業界良心。

2. 從黑膠、卡帶、CD，到數字化甚至移動互聯網時代的音頻媒體，每次當人們認為當前的編解碼技術夠用了、音頻技術發展到頭了，新應用和技術升級依舊層出不窮。

下面科普幾個近兩年推出的民用音頻新技術。

先說最基本的聲道系統。7.1聲道環繞音大家都知道了，現在用這種布局的家庭影院也很常見。它其實有2個音區是虛擬的，只有5個實際音區。比起5.1聲道系統，它添加了左右兩個後中置的音響，讓音場的密度增大，音道之間銜接更順暢。簡單說就是因為聲音從更多方向來，所以聽起來環繞效果更強烈。

上圖可看到有左前、右前、中置（放在顯示器上方和下方均可）、左後、右後，跟從主音區分出的左、右環繞音箱。順便說一句，內容源也要選擇支持7.1聲道的，例如寫著DTS-HD-7.1的藍光碟。

但這只是二維平面的聲音，沒有三維空間的立體感。音迷們發現很多音效都不僅局限於平面，例如飛機的升降、炮彈的墜落、小鳥的飛行。所以新一代強調垂直方向的沉浸式環繞聲系統出現。

目前國內有多家公司發布了沉浸式環繞聲系統。這裡拿我比較了解的DTS做例子。以下是DTS 11.1聲道的音箱布局圖。可以看出在7.1的基礎上，添加了4個揚聲器。

除了音響數量更多，布局更為複雜，從內容源開始的編碼技術革新才是這次聲道系統發展的核心。很多音頻技術公司都推出了各自的三位音頻編碼技術。

例如DTS, 它去年發布了「以聲音為對象」的DTS:X編碼技術，音箱布局方式有更多選擇，兼容性很高。讓你不管坐在電影院哪個位置，聽到的都是聲音原本所處的位置。之所以DTS:X音頻能做到不受音響擺放位置限制，是因為它一開始記錄的就是每一點音效的坐標位置、音響大小和位移時間。

樓主如果不知道這項技術，有機會可以去DTS: X臨境音影廳體驗一下逆天震撼的音頻效果。

介紹完大眾影音的技術革新，再說說沉浸式環繞聲在個人移動端的延伸。目前關注度比較高的，應該是DTS Headphone:X技術。DTS Headphone:X是一項全新的用耳機模擬11聲道的環繞聲音頻效果技術。華為最新推出的nova手機和華碩新推的Zenfone
3 傲視手機都有搭載這個技術。與DTS:X不同，DTS
Headphone:X技術讓聽者只需通過移動設備和一副普通立體聲耳機，就能感受到剛才所說的沉浸式環繞聲效果。這項技術將於10月份在QQ音樂綠鑽會員專區試推行，樓主可以關注一下。

3. 談完這些先進音頻技術，我們再聊聊為什麼這些音頻技術不為人所知。

個人拙見，覺得最大的原因是之前許多音頻技術提供商，例如DTS，並沒有在大眾宣傳上用太多力，畢竟消費者不是它的直接客戶。但實際上，這個來自美國的經典老牌在歐美髮燒友心目中早已是殿堂級影音行業領航者，廣受專業人士追捧。而新秀杜比算是知名度比較高的，跟它進入中國市場較早有關。不過，自從移動互聯網普及，很多品牌也改變了他們的推廣策略。如DTS與QQ音樂的合作，不僅讓更多人對DTS音頻技術有直觀的認知，而且隨時隨地用簡單的設備就能享受沉浸式環繞音。對於一個積蓄不多的音樂發燒友而言，簡直不要太爽。

最後，希望未來音頻技術的發展越來越大眾化。大傢伙兒都能聽見好聲音。有任何意見也歡迎指出，我們多多交流。

因為信息量的差異。音頻很早就出現了「高保真」「無損」這樣的概念，說明那樣的條件已經達到或者接近人耳的分辨極限。雖然現在也有很多新技術出現，但從「高保真」的主流往上，消費者投入增加並沒有獲得更好的回報。反觀視頻，立體顯示現在也沒有完全進入百姓家，全高清流行時間也不長，極清也剛剛出現，視網膜屏幕也只是近幾年才有的。視頻技術發展的空間顯然更大。要知道，立體聲可早就是基礎配置了。

因為你聽不出來。

神啊，摺疊吧！

不是聽不出來，而是多數時候即使完全沒有聲音也能忍受，所以不是必需品。

好的音頻設備並不是沒有，而是因為上不了量，價錢就降不下來，僅此而已。

為什麼現在科技都這麼發達了，人們吃飯都還在用筷子而不是《摩登時代》里設想的機器把麵包往人嘴裡塞？一句話，因為夠用。

音頻技術不是沒有進展，軟體上一張唱片可以擠滿一張藍光的編碼格式，硬體上信噪比壓縮到 -140dB 以下的晶元都製造出來了，問題是對聽連 64KBps 的 mp3 和 CD 無損都分辨不出來的絕大多數消費者來說，加錢去買搭載這些技術的產品有任何必要麼？

視頻技術目前還是開始。人們看清了屏幕里那是個人就要求看清人臉，等技術進步到能看清人臉的時候人們又要求能看清鼻毛，等技術進步到毛孔都展現給你的時候，消費者又要求能在網路上實時播放這樣的高清視頻……所以 @茆博文說得很對，音頻技術已經非常成熟了，視頻技術要想忽悠過人的眼睛還有很遠的路要走。

先問是不是，再問為什麼。

技嘉GAMING B8評測：新一代狙擊手燈帶更炫了

推薦技嘉帶「魔音」USB DAC功能的主板，音質提升明顯 - 台式耳機系統 - 耳機俱樂部論壇 -

PC主板的音質有明顯提升。

前者有 sony的4K，apple的視網膜等帶動消費者欣賞層次的進步

後者有山寨手機的最炫民族風，廣場舞的佳木斯快樂舞步等麻木著大眾的耳朵

你覺得哪個比較有市場？

音頻基本到頭了。目前相關的領域，可能語音合成和識別是新的熱點，其他的方向也有公司在做研究，但不太會有革命性的提高了，如樓上所說，沒必要了。