為什麼視頻放大尺寸後會有明顯的模糊,而音頻放大功率後音質幾乎無影響?

720P的電影在筆記本上看很清晰,但放在電影院的屏幕上將全是方塊無法接受;
320kbps的mp3在2.0箱上自己家聽和在聲學條件正常的大廣場上用專業舞台音響播放,音質並不會粗糙。
這其中是兩者本身就無可比性還是在哪些層面有差異?


這兩個本身就不是一個次元的東西,不能拿來一起比較。

要真的比較,應該是,視頻提高亮度(顯示功率)和音頻增加功率比。
你會發現,兩者差不多。

另外,指出一個錯誤,720P的電影放在電影院的屏幕上,依然不會很模糊。
先不論很多,超解析度,邊緣糊化之類的「偽」高清技術,
就算是單純的放大,720P的電影在電影院的屏幕上和你的電腦上也不會差太多。
原因就是距離。
人能感受到的解析度,是由可視角決定的。由於你在電影院里屏幕遠,家裡看電腦離屏幕近,
他們在你的眼中實際佔據的視野並沒有很大差距。
事實上,目前大部分的數字電影,也不過就是1080p,和720p只差1.5倍而已,如果720p全是方塊無法接受,1080p至少也是大部分是方塊無法接受了吧。那麼實際你在電影院看數字電影的感覺呢?

----------------------------------------------
添幾句:
所謂的圖像靠近看變得不清晰,離得遠就能變清晰,而聲音不會,
是基於人很容易就能判斷光的方向,卻很難判斷聲音的確切方向。

而更可悲的是,因為聲音的方向難以判斷,現在的播放設備,根本就完全把
聲音的方向這一重要的要素給丟了。
人家圖像在用1920*1080個點表現光的時候,聲音居然大多數只用2個喇叭!2個點!!
這還怎麼比。。。

當然,不遠的將來,大家可能就能感受到幾百幾千個喇叭構成的播放設備。
到時候,再來檢驗下聲音是不是和圖像一樣,靠近了解析度就會降低吧。

---------------------------------------------------
看來大家還是對幾百幾千個喇叭構成的播放設備(實際用到了音頻解析度這一參數的播放設備)比較難於理解啊,於是舉幾個實例吧
Four Audio | Wave-field synthesis 這是一個實例
The Game Of Life | About Wave Field Synthesis 實例2
https://www.youtube.com/watch?v=rxPOuWMIduQ 實例3 youtube視頻,需翻牆
https://www.youtube.com/watch?v=2JejZ0yWs2M 原理解釋 youtube視頻,需翻牆

--------------------------------------------------------
最後給一個音頻視頻參數名稱的簡單對照表


720P的解析度是1280 X 720 ,像素就這麼多像素,信息就這麼多信息,在高解析度顯示設備中如果中間不作任何處理的話那麼就是一個大方塊的區域顯示一個像素,所以看起來是一塊一塊的。

至於聲音,聲音的「解析度」在於採樣率,而不在於音量,記錄同一段聲音採樣率越高效果越好。

音頻和視頻共有的一部分「解析度」損失是壓縮參數的設置,基本上壓縮得越厲害,越失真。

回到本題,視頻的解析度被拉伸經常出現,音頻的「解析度」拉伸通過重採樣,這個基本普通用戶不會接觸,而縮放音量對聲音的「解析度」無影響。


與放大圖像大小對應的是拉長音頻的時間……
與提高音頻音量對應的是提高圖片亮度……


這個問題很有意思,我覺得題主想問的是:為什麼圖像記錄,在空間上被放大後不可避免的呈現細節上的損失,而聲音卻可以在無限大的空間放大卻沒有變化。

先來看聲音:聲音文件記錄的實際是聲音的播放過程中,空氣分子的運動。當通過還音設備回放的時候,空氣分子的運動被再現了。無論在什麼空間,作用於我們耳朵的其實還是空氣這個介質。

理論上說,我們通過喇叭聽到的鋼琴的聲音-空氣振動和真實的鋼琴-空氣振動是一樣的。

圖像呢?
當視頻以720P的格式被記錄下來後,我們的眼睛看到的實際是1280*720個點,多大的屏幕上都是這麼多個點。

真實的鋼琴是由分子構成的,我們通過影像再現所看到的鋼琴是由數量相當有限的像素構成的,當影像放大後,像素數量不變,但我們的視網膜會看到更大的像素顆粒。

真實的鋼琴聲音是由空氣分子及其運動形成的,喇叭播放的鋼琴聲音依然是由空氣分子及其運動形成的。當聲音在更大的空間播放,會有更大空間的空氣-更多數量的空氣分子再現出幾乎相同的振動,而作用於耳膜的空氣分子數目,及其振動狀態也不會有很大區別。

上面啰嗦這麼多,是想說清楚一件事,聲音和影像的再現方式是不同的,影像是化學的(有質變),聲音是物理的(沒有質變)。


功率和尺寸有可比性?放大視頻功率的話是亮度啊,瞎狗眼的節奏


類比的話應該是320k和32kbps的MP3。


你把顯示器調亮點也不模糊啊。。。


你把一秒的聲音按十秒播放試試,這才是能和你說的圖片放大效果一致,相信你能懂


打個比喻,為什麼我的身高180cm比你的體重90kg重這麼多,要不聰明的你解釋一下?


只要讓圖像像素密度大於視網膜感光細胞的密度就沒有顆粒感。

同樣,音頻採樣頻率高於88KHz就不會有失真。


樓主問題的根源在於,比較的完全不是同一個方面的內容。
---------
視頻圖像的最小單位是幀,通過前後幀中圖像的變化,表現視頻的內容。從維度上可以認為,視頻的每一幀是一個二維面,加上變化的時間,就是一個三維的體,可以表達的信息是巨量的。

而聲音,如果忽略人耳對聲音方向的敏感,那就只是一個橫軸為時間,縱軸為振幅的一維波(或者勉強可以稱二維),其中包含的信息量遠比視頻要小。

比方說,在一部電影里,隨機拿出200幀圖像,差不多能看明白點東西了,但拿出200個時間點,或者多說,拿出隨機200段長度為1秒的聲音,你能聽出什麼來?

(這裡,我忽略聲音的方向性是有根據的,比如樓主就認為2.0的箱子聽著和廣場箱差不多,但立體聲上實際是比不了的。如果考慮多聲道,比如最常見的5.1,7.1,聲音也只是6組或8組波形,在特定方向上的疊加而已。)
-------------------
因此,視頻畫面放大後模糊,實際上是指每一幀,也就是每個時間點上,某個二維面的問題。能提出這個問題,本身就說明,視頻的每個時間點上的信息已經足夠的多。

而聲音,在一個時間點上只有「振幅」這一個參數可言,你能提什麼問題?所以我們只會按時序聽下去,去了解聲音包含的內容。

(多說一句,大多數的人腦處理聲音,也只 會 按照正向+ (0.5~2)*正常速度 播放 這樣處理。如果超出這個速度範圍,很多人是根本聽不出來聲音中的內容的,倒著播放就更別提了,完全聽不出意義)
------------------
如果硬要比,我的想法是,只能按信息含量少的比,就像聽聲音一樣,只按時序看下去,了解時間方向上包含的信息。

這樣的話,從同一部電影中,視頻的每一幀不管放大到多大面積,或是多亮/多暗(不丟失細節的前提下),你都不會看到更多,或是更少的內容,因為每一幀畫面里包含的信息量是相同的。


把無損轉化成採樣率低的MP3。絕對是有差距的。使用靈敏度較高的耳機和優秀的回放設備就可以感覺的出。320k的MP3和無損的差距不是很大。電腦音效卡回放一般。音響的靈敏度低。。這些就使你不能直觀的判斷他們的區別了。可以試聽下母帶。這個有下載的。。用foobar2000看下他們的聲譜的區別。。。這個故事告訴我們。好的播放器才能體現資源的差距。。


感覺把聲音放大相當於視頻中的把屏幕亮度調高。。。。。都存在飽和失真的問題,但是不存在清晰度降低


放大會損失細節的圖像是由一個個像素組成的.圖像整體感官是由這些像素組合在一定的面積內.可以把音頻理解成一個個音調在一定時間內組成.把音頻時間拉長和圖像放大的感覺更相似.都是會失真的。


音響或者耳機有問題你會覺得聲音大了會模糊…要不你把音頻拉長放慢試試?


是時候裝一把了:實名反對目前所有答案!
問題的實質在於,題主比較的根本不是同一件事情。
聲音放大,放大的是信號強度。圖像的放大,放大的是空間尺寸。
如果圖像也放大信號強度,類比而言,對圖像的放大也應該放大光強,或者增強對比度和飽和度。這樣的話,在不超過人類眼睛的物理容限的情況下,一樣是不失真的。
同樣地,如果對聲音放大空間尺寸,因為聲音是時間信號,改變波長就會響應地改變頻率,一樣造成失真。

此外,在大屏幕上放720p其實也不是不能看,只是不能靠近了看。但是放大的聲音也不能靠近了聽啊。


音頻在放大後一樣會失真。只不過人耳對聲音的敏感程度很低,你聽不出來而已。


推薦閱讀:

揚聲器的發聲原理?
為什麼我們能從電話里很容易地分辨出某人的聲音?
兩個音箱和一個音箱播放效果有什麼不同?
在消回聲室(Anechoic chamber)中說話的體驗是怎樣的?
人的聲音是否有不隨年齡、狀態而改變的恆定屬性?

TAG:視頻 | 圖像處理 | 電子 | 聲學 | 音頻 |