標籤:

1109 - PDF 標註導出,從入門到棄坑

這兩天,研究了如果導出 PDF 標註。沒搞定,大致列一些關鍵的點,供大家參考:

  • PDF 標準是 Adobe 牽頭搞了,標準又老又長,一般還是別看了
  • Apple 提供了 PDFKit;不過,十幾年沒更新了,功能比較弱
    • 核心的,在解析標註文本時,會出現 Cmap 錯誤,但卻沒有任何可設置的地方
    • 另外,WWDC 2017 新出了 PDFKit for iOS,沒去研究,估計重點在於展示,不在於編輯
  • 對於第三方 PDF SDK:
    • 有少量免費、或開源的,最知名的是 Skim;可惜的是,Skim 也無法解析標註文本,尤其是英文之外的文字、字體
    • 而更大部分,則是商業 SDK;效果我不好說,因為動不動 $1000 一年的授權,試不起
  • PDF Expert 果然還是厲害,在試過的這些產品中,最強悍;當然,價格也最彪悍

總的來看,PDF 還是一小撮玩家在玩的小遊戲。既得利益者,牢牢把握著市場;後來者,不太可能進入並有所作為。標準本身,也缺乏與時俱進的動力。我並不看好。

不過,我還是基於 Apple 的 PDFKit 做了個簡單的小工具,可以將 PDF 中的標註導出為 csv 文本。需要的朋友,可以單獨聯繫我。


博客原文:1109 - PDF 標註導出,從入門到棄坑

推薦閱讀:

能替代acrobat的PDF編輯軟體有哪些?
為什麼PDF里的中文字體看起來很平滑,很舒服?
誰能簡單說下PDF格式標準?
如何在ppt轉成pdf的時候不犧牲動畫效果?
把文字從PDF里複製word, 怎麼有效消除每行末尾的換行空格?

TAG:PDF |