為何Adobe不出一個無限頁面長度的PDF格式?
PDF是目前市佔率最高的文件存儲和流轉的格式,它統一了各種文件格式,方便閱讀和傳播、不易修改、跨平台、體積可控。
隨著移動設備的興起、無紙化的普及和信息碎片化的趨勢,「流閱讀」逐漸成了重要的信息獲取和傳播方式,大家都習慣在手機、平板等便攜設備上閱讀新聞和小部頭文章。現在鎚子便箋、Zine等編輯器都支持將文章存為長圖片,可以分享到朋友圈、微博或群里等,方便大家流暢的閱讀。「長圖片」終究不是一個好的傳播方式,解析度、體積大小、不能選取等問題都使得圖片不是文字(或圖文混排)分享傳播的理想手段。
HTML或MHT部分解決了這個問題,但這種方式要麼依賴於網路,要麼不是很流行。於是自然而然想起了PDF。PDF是最合適的格式,但是PDF的分頁確實很讓人惱火;尤其遇到圖文表格混排的文件,分頁限制讓人不勝其煩。PDF仍習慣於電腦顯示和列印需要,缺乏對移動便攜設備的創新支持。
為何pdf不能出一個無限長度的(或者跟據內存限制盡量長),適合手機或平板瀏覽的頁面尺寸,這樣製作出來的pdf文件,拿著手機或平板閱讀就很順暢了,一路向下滑就行,不會出現「分頁」的打斷。英文名字我都想好了,就叫endless page。
其實現在需要一個生態閉環,我在手機上編輯,用notes也好,印象筆記也好,鎚子便簽也好,zine也好,等等各種編輯器;編輯完了,發布成長pdf(現在最多就是發布成長圖片),然後分享。
在中餐館點一份正宗的美式牛排可以么?大部分時候不可以。
因為中餐館是餐館,但不是西餐館。
回到題目上來,PDF在設計上,是一種頁面描述語言。
所謂頁面描述語言,主要就是面向印刷設備的。
Adobe家的,無論是PDF還是PostScript都是頁面描述語言。
PostScript誕生在1982年,PDF和HTML都誕生在1993年年中。
隨著移動設備的興起、無紙化的普及和信息碎片化的趨勢,「流閱讀」逐漸成了重要的信息獲取和傳播方式,大家都習慣在手機、平板等便攜設備上閱讀新聞和小部頭文章。現在鎚子便箋、Zine等編輯器都支持將文章存為長圖片,可以分享到朋友圈、微博或群里等,方便大家流暢的閱讀。「長圖片」終究不是一個好的傳播方式,解析度、體積大小、不能選取等問題都使得圖片不是文字(或圖文混排)分享傳播的理想手段。
所謂的「流閱讀」是個偽需求。不存在的。為什麼呢?因為計算機中沒有無限的概念,都是有限的概念。我們所見到的長圖,就圖片格式來說,都有物理級別的顯示上限。打個比方,比如說這個上限可能是10米。PDF本身也有一個頁面尺寸的上限:
就在這個上限內的頁面的尺寸都足以達到一個所謂的長圖「流閱讀」的效果。
世界上沒有新鮮事,我在2013年的時候就做過長度在1米左右的單個頁面的PDF來讀。生成上沒難度,但是沒必要。做個長的SVG不就得了。這些玩意,基本上是做PDL上的小題目了,跟創新不創新沒關係。大部分情況下,圖片格式其實是比較適合的,因為PDF需要解析再生成點陣圖,任何時候點陣圖都是需要的。
還是看目的需求了,PDF設計的目的就不是面向網路的,而是面向印刷的,不方便網路閱讀很正常。這麼說來,不如設計個更適合手機閱讀的新東西更好。
說回這個,其實不需要修改格式就可以大體上達到需求,就是在解析器和渲染的部分做點工作就好了。最簡單的,不要把頁面之間的間隔顯示出來就差不多了吧。複雜點渲染時就去掉頁邊距。再複雜點就重排一下(我似乎見過)。
至於HTML+CSS(EPUB),它不依賴網路的。不過也有缺點,裡面的東西不適合去印,有很多東西排不了。
所以目前常見的方式是從源文件(中間文件),輸出需要的印刷文件和網路閱讀文件。這樣可以滿足不同的閱讀環境的需求。
最後吐槽下,HTML對表格的支持實在太差了。
因為列印紙都有固定長度
- HTML + CSS 本身並不依賴於網路連接。
- 不知你有沒有了解過 epub?其實質就是標記文檔加樣式表,可以實現複雜的樣式,也能內嵌字體實現相對高保真的文檔外觀。而 epub 這個格式,已經足夠流行了。
- PDF 的最大尺寸是一千五百萬英寸。考慮到內存限制,加上矢量文字及圖形的可縮放性,這個尺度幾乎可以視作「能實現無限長度」了——事實上,即便是內存有 32 GB 的電腦,恐怕都載入不了那麼大的 PDF。
- 若目的是「優化移動設備閱讀體驗」,則必須要考慮文檔介質的可重排性,畢竟設備尺寸多種多樣。而這和 PDF 的版式高保真這個特性,在一定程度上是矛盾的。
搞清PDF怎麼來的,就好理解了。
PDF的全稱是Portable Document Format,即便攜文檔格式。要說起這個東西的歷史,那就不得不提到一個耳熟能詳的名字,就是喬布斯(Steve Jobs,1955-2011)。
1985年,火爆了幾年的Macintosh電腦開始出現頹勢,喬布斯需要更強而有力的競爭應用——於是他找到了兩個施樂研究院跑出來的工程師,掏出250萬美元(就是這個數沒毛病)拍在John Warnock和Chuck Geschke臉上,為他設計一個讓每個蘋果用戶都能列印漂亮彩色文檔的方案。
這兩個工程師沒有費多大力氣,因為他們在施樂中心的工作成果,就是這麼個東西。於是postscript誕生了,它是一個繪圖語言,也是一個標準。任何一款印表機只要配備了相應的適配器,就可以列印使用postscript生成的圖案。
這個語言非常有趣,它使用了一種模擬筆尖畫圖順序的方式來顯示計算機圖像。它是矢量的,而且人可以讀懂。
筆尖起始坐標 0,0
筆尖移動至20,20,開始繪圖
筆尖移動至40,40, 結束繪圖
畫出了一條線 : )
這種方式大致能夠幫助你理解postscript的工作原理。
兩個工程師和蘋果的合作非常愉快。愉快到什麼程度呢?
這兩個工程師的公司,名字叫adobe。
Apple,adobe,aldus(後被adobe收購) 三者的聯合,使得MAC上多了一個名叫pagemaker的應用。這個應用極大的增強了apple個人電腦的列印能力。Adobe也因此奠定了今天的行業地位。
沒有喬布斯,就沒有adobe,沒有adobe,我今天吃啥!
1992年,John warnock對postscript進行了改進,設計了PDF格式。
基於postscript的PDF格式文件,從誕生起就是以「代替紙張的電子文稿」概念出現的。它的一個重要特點,就是分頁——當時的計算機算力相當有限,多台計算機分別處理一份文件的多頁,最後再合併到一起,是十分有誘惑力的。時至今日,adobe依然在pdf中嵌入「手寫簽字」這種功能,可見它的定位始終沒有變過,就是「裝進電腦里的紙張文件」。
PDF今天的優勢顯而易見,就是在任何一個瀏覽器和工具里,外觀都非常統一。這正是因為adobe是數字圖像領域的大哥,不管你谷歌也好微軟也好,都要給我面子。而PDF本身的定位也絲毫不會損傷谷歌和微軟的利益。你搞你的文稿數字化,我搞我的html,webp,咱們井水不犯河水。
如果Adobe失了智,試圖把PDF搞成能夠在瀏覽器中輕鬆分發的標準格式,那無異於對谷歌微軟下戰書,虎口奪食。
另外,由於PDF的定位,本身講究的是圖像還原精細真實,因此文件本身個頭就很大,對陣html/css這種輕巧方便的標記性語言,在網路傳輸上毫無優勢。
所以,我們可能短時間內還看不到pdf變成標準格式。至於未來,誰說得准呢?
————————————————————————
其實PDF本身是支持頁面超長的,但一個超長的PDF,就算你用的是高配電腦也會產生嚴重卡頓延遲,更不要提用手機分享來分享去了。
感冒了,發著熱寫的,邏輯有點亂,意思清楚就好。
推薦閱讀: