數據壓縮有沒有可能發展到極限?

在各種數據類型中,最難實現的是數字機頻的實時壓縮,因為視頻信號尤其是HDTV信號所佔據的帶寬甚寬,實時壓縮需要很高的處理速度。在我看來,如何能提高數字機頻的實時壓縮技術,那麼數據壓縮技術也會向前一大步。

數據壓縮有沒有可能發展到極限

現在,視頻解碼以及音頻的編碼、解碼多依賴於專用晶元或數字信號處理器(DSP)未完成,並已有許多廠商推出了音視合一的單片MPEG-1、MPEG-2解碼器。我國在發展數據壓縮技術過程中,則充分利用了軟體人才優勢。

在軟體實現方面,由於PC主機的處理能力正在飛速提高,直接利用主CPU編程實現各種視聽壓縮和解碼演算法對於桌面系統及家用多媒體將越來越有吸引力。

數據壓縮有沒有可能發展到極限

1996年上半年,Intel向全球軟體界發布了它的微處理器媒體擴展(MMX)技術。這種技術主要是在Pentium或Pentium Pro晶元中增加了8個64位寄存器和57條功能強大的新指令,以提高多媒體和通信應用程序中某些計算密集的循環速度。MMX採用單指令多數據(SIMD)技術並行處理多個信號採樣值,可使不同的應用程序性能成倍提高。如:視頻壓縮可提高1.5倍,圖像處理可提高40倍,音頻處理可提高3.7偌,語音識別可提高1.7倍,三維動畫可提高20倍。

與Pentium完全兼容的P55C晶元是1998年3月正式推出的。以後推出的Pentium、Pentium pro或P7等CPU,均將支持MMX指令。

數據壓縮有沒有可能發展到極限

在數據壓縮的硬體實現方面,根本的出路是要有自己的音像壓縮晶元(特別是解壓晶元),不管是專用集成電路(ASIC)實現,還是藉助於通用DSP來編程。

而這一類晶元,目前還只是"霧裡看花"。不過我們相信,在不久的將來,這些也會成為現實



首先要了解數據壓縮的原理

數據壓縮的原理就是找出那些重複字元串,然後用更短的字元串去代替。

比如: asasas 就可以換成 3as 。這樣就少了3個字元。所以,內容越重複,就可以壓縮的越小。

數據壓縮有沒有可能發展到極限


而如果數據是均勻分布的隨機字元串,就很難壓縮了。壓縮就是一個消除冗餘的過程,好的壓縮演算法,可以將冗餘降到最低,以至於沒發再壓縮。所以,對已經壓縮過的文件再壓縮,就沒意義了。

數據壓縮有沒有可能發展到極限


好了,那壓縮的極限是怎麼樣的呢?

壓縮可以分成兩部:1.得到文件內容的概率分布。

2.對文件進行編碼,用短符號代替重複的部分。

如果: 文件只有兩種情況,1或0,那隻要一個二進位位就夠了。

文件包含三種情況,需要兩個二進位位。

文件包含六種情況,需要三個二進位位。

...

文件包含n種情況,每個部分在文件中出現的概率為分別為p1、p2、...pn ,那麼

log2(1/p1) + log2(1/p2) + ... + log2(1/pn)

= ∑ log2(1/pn)

數據壓縮有沒有可能發展到極限這就可以看做一個文件的壓縮極限了。



我覺得總的來說,這個還是有可能的,宿舍可能要受到很大的話要說到極限,應該還是可以的吧,因為數據這種東西嗎?那沒有你想不到,只有他做不到。


有可能,因為不論什麼只要有需要就能做到極限,現在科技很高級了,進步很快。所以有可能發展到極限。


推薦閱讀:

人人都是數據科學家?Airbnb數據大學開課了
5款高級圖表使用攻略,讓數據報表具備美感和深度!
IMDB Movie :Python數據分析報告
吉利帝豪GS--車主洞察研究
No4:我為什麼爬取各種數據?

TAG:數學 | 數據分析 | 大數據 | 物理學 | 數據壓縮 |