1109 - PDF 標註導出,從入門到棄坑
02-02
這兩天,研究了如果導出 PDF 標註。沒搞定,大致列一些關鍵的點,供大家參考:
- PDF 標準是 Adobe 牽頭搞了,標準又老又長,一般還是別看了
- Apple 提供了 PDFKit;不過,十幾年沒更新了,功能比較弱
- 核心的,在解析標註文本時,會出現 Cmap 錯誤,但卻沒有任何可設置的地方
- 另外,WWDC 2017 新出了 PDFKit for iOS,沒去研究,估計重點在於展示,不在於編輯
- 對於第三方 PDF SDK:
- 有少量免費、或開源的,最知名的是 Skim;可惜的是,Skim 也無法解析標註文本,尤其是英文之外的文字、字體
- 而更大部分,則是商業 SDK;效果我不好說,因為動不動 $1000 一年的授權,試不起
- PDF Expert 果然還是厲害,在試過的這些產品中,最強悍;當然,價格也最彪悍
總的來看,PDF 還是一小撮玩家在玩的小遊戲。既得利益者,牢牢把握著市場;後來者,不太可能進入並有所作為。標準本身,也缺乏與時俱進的動力。我並不看好。
不過,我還是基於 Apple 的 PDFKit 做了個簡單的小工具,可以將 PDF 中的標註導出為 csv 文本。需要的朋友,可以單獨聯繫我。
博客原文:1109 - PDF 標註導出,從入門到棄坑
推薦閱讀:
※能替代acrobat的PDF編輯軟體有哪些?
※為什麼PDF里的中文字體看起來很平滑,很舒服?
※誰能簡單說下PDF格式標準?
※如何在ppt轉成pdf的時候不犧牲動畫效果?
※把文字從PDF里複製word, 怎麼有效消除每行末尾的換行空格?
TAG:PDF |