多看對掃描版 PDF 格式的文件是如何實現智能排版的?

這可是對k3,k4的硬傷一大突破!以後看掃描版pdf不用再擠著眼睛看了。


koreader早就實現了,多看算是抄襲而已

原來叫kindlepdfviewer,開源的,原理應該差不多。

koreader/koreader · GitHub

其中重排用的是另一個開源項目K2pdfopt的技術

參考Kindle

Koreader的重排功能離不開另一個開源軟體項目K2pdfopt(GPLV3協議發布)。K2pdfopt也是為了解決PDF文檔在小屏幕Kindle上閱讀的排版問題而開發的。與其它PDF預處理軟體相比,它有很多獨一無二的特性,比如自動化程度很高,能夠自動識別多欄排版的文檔進行分欄,自動去除頁面白邊,自動對掃描文檔進行水平校正,以及最重要的基於圖像分割的重排版演算法。K2pdfopt使用完全基於圖像處理的方法對文字重新排版,軟體處理時會把原始PDF/DJVU頁面放大再分割成以詞為單位的像素區域,把這些像素區域重新排列到目標寬度的頁面中(原理如下圖),所以理論上只要能夠讀取文檔的頁面像素就可以對其中的文字進行重新排版。這個演算法的前提是頁面中的文字之間需要有一定的空隙,以提供分割像素區域的位點。更多K2pdfopt的處理效果請參考這篇文章用K2PDFopt重排版面,隨手解救掃描PDF 。

K2pdfopt被移植到Koreader/Kindlepdfviewer以後就可以在閱讀時讓PDF重新排版。實時重排可以省去電腦上處理PDF的步驟,並且可以在kindle上互動式地微調排版參數,儘可能地生成滿意的排版。使用Koreader的重排模式閱讀時,軟體會自動把當前頁和下一頁重排版成適應屏幕的尺寸。

K2pdfopt: Willus.com"s K2pdfopt

建議大家換裝koreader,是kindle原生系統下的一個軟體,個人感覺多看太坑了。


切割圖像,然後重組,這招遇到複雜的圖文混排掃描件也會失靈


在遇到公式、圖形或者距離稍微大一點的字體,都會出現問題,


應該是把字塊(中文)或單詞塊(英文)逐個解析出來,放大重排。這比OCR容易也可靠多了,因為只需要識別出圖像塊來,不必考慮具體是什麼字。


推薦閱讀:

如何將 pdf 轉換成 epub格式?
如何把 .mobi 格式的電子書轉換成 PDF?
怎麼把 PDF 版的電子書轉化成 TXT 格式?
用 LaTeX 撰寫的學術論文怎麼方便的供老師評註和修改?
下載了一個 PDF 文檔後,每次打開文檔都會彈出列印對話框,如何解決這個問題?

TAG:Kindle | 電子書 | PDF | 電子閱讀應用 |