目前存在時間最長的文件格式是哪種?存在時間最長的多媒體格式呢?

在幾年前看到過一篇文章,寫的是照片是列印下來好還是存放在電腦里好。
文章最後得出的結論是,由於計算機發展至今還沒有一種文件格式可以存在n年,這個n是一個具體數字不過我忘記了。所以說,隨著時代的進步,有文件格式會被淘汰,也許現在存在電腦中的照片數據,再過個幾十年或許就無法打開,或者說就無效了。而現在有效的照片文獻都是列印出來的圖片,保存的更加完好。

所以我就想問,現在在計算機歷史上,存在時間最長的文件格式是?存在時間最長的多媒體格式是?另外大家如何看待照片保存方式的這個問題


這種情況的確有可能發生,尤其是當你使用一種比較小眾的文件標準時,很可能會發生兼容斷代的問題。


不過如果是通用標準的話,通常都能做到長期的向下兼容,比如說最早的jpeg在1992年發布,如今已經過去了22年,依然是主流標準。(其替代標準jpeg2000倒是沒有怎麼特別流行……)


前面有朋友說到把照片按照原數據保存生成raw就可以恆久遠,這是不對的。raw的標準幾乎是一家一個樣,佳能有佳能的,尼康有尼康的,Adobe倒是有通用的DNG標準,只是很多第三方軟家對Adobe DNG的支持非常差。標準之間是互不相通的,你只能轉換。

總之,不論如何,對於需要長期保存的舊檔案都應該定期更新維護,比如說翻拷,轉換到新格式之類的。


你之所以到現在還能買到上世紀前半頁的流行金曲的光碟,就是因為唱片公司進行了翻拷/轉錄/翻錄之類的操作。


照片是圖片,圖片裡面儲存了壓縮的圖像數據,數據直接就是以二進位的形式儲存的。

隨著時代的進步,有文件格式會被淘汰,也許現在存在電腦中的照片數據,再過個幾十年或許就無法打開,或者說就無效了。

文件格式淘汰了,那可能有一種更高效的文件格式取代了它,但不代表以舊格式儲存的數據丟失了。過個幾十年打不開,更應該擔心的是數據丟失了(硬碟壞了、光碟壞了等),而不是擔心因為文件格式的問題而無法打開,總會有辦法打開的!


其實文件格式不過是為了存儲信息而使用的某種編碼方式而已。按照這個理念,很難說存在時間最長的文件格式是哪些,畢竟人類歷史上最早的計算機到底是什麼都還有一定爭議。

一般認為世界上第一台機械計算機是 Charles Babbage 於 19 世紀設計的差分機,第一台圖靈完備的計算機是 Babbage 在此基礎上設計的分析機。它的數據輸入使用的是打孔卡,Babbage 給這些孔設計的用於表示數字的組織方式也可以算是一種格式,只不過這種格式只有這台計算機能打開。(p.s. 事實上直到1970年代計算機依然在用各種不同的打孔卡)

來源:http://en.wikipedia.org/wiki/File:PunchedCardsAnalyticalEngine.jpg

多媒體格式的歷史可以朝另一個方向追溯:比如唱片的格式。愛迪生在 19 世紀發明的留聲機所用的錫箔圓筒上面的紋路,也是一種物理可見的「格式」。音頻格式(包括模擬格式(analog)及數字格式(digital))的發展史可以看這裡:Timeline of audio formats。早期(1980s及以前)的能顯示圖片的計算機各有各的專用格式,最早的廣泛應用且可共享的圖片格式之一是1987年誕生的GIF [1]。

其實只要文件格式的標準作為一種知識依然存在於人類世界裡,那麼這種格式的文件還是能夠打開的。比如前面提到的 Babbage 設計的分析機,因為太原始,它的文件格式的標準是包含在機器設計中的。只要你能拿到它的設計,並且有足夠的財力將這台機器建造出來,那你也能夠得到它配套的打孔卡上存儲的數據。差分機就在1991年被試建了出來 [2],那些100多年前的古老的打孔卡照樣可以被讀取。

現代計算機的文件其實就是一堆用特定的編碼方式編碼過的二進位的0和1,只要這種編碼的標準還存在於人類世界,總是能夠讀取它們的。就好比拉丁文文字只是一堆點和線,但只要閱讀它所需要了解的字母、辭彙和語法作為一種知識依然存在於人類世界,再過幾千年我們還是能夠讀懂拉丁文。所謂的「過了幾十年就打不開」,只不過是到時候一般人很難得到能夠打開這些文件的軟體和硬體了,但它們的標準一般還會保存在世界上的某個角落,只要能得到這種格式的標準,並且原來的數據保存完好,你自己建一台機器,按照標準自己寫一個讀取程序,終歸是打得開的,只不過很少會有這種必要。

[1]: Wiggins, R. H., Davidson,
H. C., Harnsberger, H. R., Lauman, J. R., Goede, P. A. (2001).
Image file formats: Past, present, and future1. Radiographics, 21(3), 789-798.
[2]: A Modern Sequel


所以說向下兼容這種東西才會存在。

PS:我覺得純ASCII(不含擴展)的英文TXT是最安全的,幾百年不動搖。


txt純文本應該不會變吧。


個人覺得照片保存方式的選擇,還要考慮到是個人收藏,還是專業保存組織收藏,以及照片或文件的珍貴程度,以及各種成本。

首先說關於文件格式的保存時間,首先單一格式,肯定因為讀取設備及軟體的普及流行程度,會存在未來不能打開的可能,但是如果文件或照片非常珍貴,那一定會轉製成更加流行或者先進的格式繼續保存。所以如果只是考慮保存資歷,其實文件格式意義不大。(以上僅止大多數情況,如有朋友知道哪種以前的格式就是無法轉制,另請賜教)

但是如果作為實際應用,必然要考慮各種成本,以及保存難度

舉例子,你自己保存照片,可以列印成紙的,也可以電腦jpg。但是要考慮到作為個人來講,保存紙制照片其實很困難,時間長了會發黃褪色,一不小心還可能被水火熊孩子等各種因素毀掉,所以其實很難長久保存。但是數碼版本不同,萬一哪天jpg格式不流行了,多半會有轉制到新格式的軟體,到時候自己一轉,分分鐘的事。省時省力又安全。

但是做完圖書館,檔案處等地方,和個人收藏又安全不同。他們有轉人看管,保存環境,乃至列印用紙的材料都比私人要好上一些。這就保證紙質保存更久。而數碼的東西,他們做一次格式轉制,也許要花費大量人力物力。這就涉及到權衡成本的問題了。

最後個人覺得現在保存下來的照片或資料紙質居多有兩個原因。

第一 電腦數碼時代比較也就是幾十年的事,和人類歷史比太短

第二,紙質和數碼類存放有一個致命的區別,絕大多數戰爭以及平時可能遇到的傷害因素,比如火水高溫低溫等,多數不會對照片造成致命傷害,也就是說,哪怕你照片不清楚,褪色了,質量不好了,但是依然是能看的。但是數碼類不同,無論抗塵抗火做到什麼等級,壞了,就是完蛋。要不就是0,要不就是100


The wonderful thing about standards is that there are so many of them to choose from.


推薦閱讀:

TAG:操作系統 | 文件格式 | 計算機 | 照片 | 照片管理 |