標籤:

誰能簡單說下PDF格式標準?


這是一份用記事本生成出來的PDF文件,你只需要把下面的代碼內容複製粘貼到記事本裡面保存為」Hello Word.pdf」,然後你就可以用閱讀器打開查看了。

%下面是一份手寫PDF文件,你只需要用記事本保存這份文檔為PDF文件就可

%PDF-1.4

1 0 obj

&<&<

/Type /Pages

/Kids [2 0 R]

/Count 1

&>&>

endobj

2 0 obj

&<&<

/Type /Page

/Parent 1 0 R

/MediaBox [0 0 612 792]

/Contents 4 0 R

/Resources

&<&<

/Font

&<&<

/Font1 5 0 R

&>&>

/XObject &<&<

/Image1 6 0 R

&>&>

&>&>

&>&>

endobj

3 0 obj

&<&<

/Type /Catalog

/Pages 1 0 R

&>&>

endobj

4 0 obj

&<&<

/Length 0

&>&> stream

1 0 0 RG

0 792 m

612 0 l

s

BT

/Font1 10 Tf

100 700 TD

(Hello World!) Tj

ET

q

100 0 0 100 300 600 cm

/Image1 Do

Q

endstream

endobj

5 0 obj

&<&<

/Type /Font

/Subtype /Type1

/BaseFont /Helvetica

&>&>

endobj

6 0 obj&<&<

/Type /XObject

/Subtype /Image

/Width 8

/Height 8

/ColorSpace /DeviceRGB

/BitsPerComponent 8

/Length 0

/Filter /ASCIIHexDecode

&>&> stream

FF0000 C00000 A00000 800000 600000 400000 200000 0000FF

FF2000 C00000 A00000 800000 600000 400000 200000 0000C0

FF4000 C00000 A00000 800000 600000 400000 200000 0000A0

FF6000 C00000 A00000 800000 600000 400000 200000 000080

FF8000 C00000 A00000 800000 600000 400000 200000 000060

FFA000 C00000 A00000 800000 600000 400000 200000 000040

FFC000 C00000 A00000 800000 600000 400000 200000 000020

FFFF00 C0C000 A0A000 808000 606000 404000 202000 000000&>

endstream

endobj

xref

trailer

&<&<

/Size 0

/Root 3 0 R

&>&>

startxref

%%EOF

用PDF閱讀器打開,我們看到什麼了?

這段綠色的代碼在閱讀器的渲染後,我們看到了一條紅色的直線、Hello Word文本、還有一塊多彩的圖案~

參考自:揭開PDF文件格式的神秘面紗(二)


前面已經有人從技術角度談了PDF標準。我從PDF格式的國際標準地位和解決的問題角度回答一下吧。

開門見山,PDF現在是公開的ISO國際標準,不屬於任何公司或個人。

要深入了解PDF標準和解決的問題,需要先了解下PDF的起源,以及PDF的發明者,Adobe公司的歷史。

Adobe成立於1982年,創始人是John Warnock和Chuck Geschke。Adobe最初只作字體設計。現在大家都知道,Adobe擁有一系列的設計、出版和內容管理產品,比如說PhotoShop。

1985年,Adobe發布了PostScript(PS)頁面描述語言-Page Description Language (PDL)。PS用於描述文本、圖形和圖片的可視化展現,也用於控制列印設備。還是在1985年,Adobe公司發布了在蘋果 Macintosh 上運行的繪圖應用,Adobe Illustrator。它的文件格式,AI, 來源於PS格式。1989年,Adobe Illustrator的Windows PC版上線。

AI的PC版發布後,只要有電腦,任何人都可以創造高質量的和正式出版物相媲美的文檔。在當時,這是出版業的一場革命。但是Adobe的創始人認為還需要一樣關鍵的東西,才能帶來真正的革命。

1991年, John Warnock發表了著名的 「Camelot 論文」,其中的一個主要觀點是:

現在沒有一個統一的方法,將列印的內容,以電子的方式展示。這個行業急需一個能夠在不同的設備、操作系統和通訊網路上,交換文檔的統一方法。

我們來解讀下這段話的兩個關鍵點:

列印的內容,以電子方式展示

背後的含義是,保證列印的效果,和電子屏幕上的效果保持一致,反過來,也要保證電子屏幕上的效果,和在印表機上列印出來的效果一致。

不同的設備、操作系統和通訊網路上,交換文檔

背後的含義是,能夠被不同的設備上的不同的程序,理解和解讀。

如果只看第2點,PDF和HTML在解決同樣的問題。然而,第一個關鍵點,從來都不是HTML要解決的問題。這是理解PDF標準和作用的最關鍵的一點。

在這篇論文里沒有提到,但是也是PDF和HTML不同一個關鍵因素,就是PDF是一個自包含的文件格式。也就是說一個單一PDF文件可以包含這個文件的內容和精確定義展現形式的所有信息

請腦補這點的意義。

正是基於這篇論文的理念,Adobe公司起動了一個新項目,名為"Carsousel",也就是旋轉木馬的意思,以PS和AI技術為基礎,發明了一種新的文檔格式,最初叫做Interchange PostScript (IPS) ,不過隨後被改為Portable Document Format (PDF)。這就是PDF文件格式的起源。

在PDF取得巨大成功後,一直有呼聲,呼籲Adobe公司放棄PDF格式的所有權。2007年1月29日,Abode公司宣布,將PDF格式的所有權,逐步轉交給企業內容管理協會。原新聞稿如下:

SAN JOSE, Calif.—Jan. 29, 2007—Adobe Systems Incorporated (Nasdaq:ADBE) today announced that it intends to release the full Portable Document Format (PDF) 1.7 specification to AIIM, the Enterprise Content Management Association, for the purpose of publication by the International Organization for Standardization (ISO). Adobe Press Release

2008年7月1日,ISO組織正式發布PDF的國際標準。至此,PDF真正成為一項獨立公開的文檔標準。任何公司和個人,都能針對這項文檔標準,開發任何產品,不再需要擔心受到Adobde公司任何知識產權、技術和商業上的限制。這也是PDF繼續取得成功的最重要的因素。


為什麼我點擊這個參考鏈接就變成了127.0.0.1,然後就是拒絕了,我本身有翻牆可以訪問外網


pdf 文檔是我接觸過文檔格式里而最複雜的文檔之一了,之前解決問題還請教過 @王航 兄。

具體標準我建議您參考adobe 的 PDF Reference:http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf


推薦閱讀:

能替代acrobat的PDF編輯軟體有哪些?
有哪些好用的pdf虛擬印表機推薦?
在PDF中空白頁如何刪除?
哪一個android應用可以重排PDF, 讓手機可以看掃描版的PDF書?
為什麼 iPad 是閱讀文獻(PDF)的最佳利器?

TAG:PDF |