ocr技術如何獲取圖片上的文字信息？

12-24

在日常生活中，我們總會碰到需要從紙質文檔、圖片上提取文字的操作。有時候對照一張圖摘抄裡面的內容可以說是一件非常煩心且效率低下的操作，如下圖：

由古至今，從過往而來的手寫摘抄、打字機、計算機、錄音機等可以說都是對文字信息保留的工作行為。當下信息時代，我們依舊保留了傳統的習慣，也在積極迎合最流行的工作方式。今天要說到的就是上述圖片最終解決問題的一套技術——文字識別技術！

文字識別技術亦可稱呼為「文檔識別技術」，區別於之前說到的「證件識別、發票識別、名片銀行卡識別」等應用。他的存在更多是無規格的，在以SDK的方式讓客戶離線部署過後，樣本是可以劃區域或作全文識別的。所以無論你拿過來的是電腦截圖照片、掃描件、拍照件等都有可以讓其做識別的功能。

文字識別SDK支持哪幾種語言的識別功能呢？見下圖：

備註：文字識別核心識別語言功能因操作系統而已，目前win32具備以上所有識別功能。具體識別要素請聯繫技術支持。

文字識別SDK識別率能達多少？見下圖：

文字識別支持TIFF,圖像PDF,BMP,JPG,PNG等樣本類型。也支持自動校正和自動旋轉功能。在識別區域能夠支持版面分析。因此識別率的問題受樣本干擾因素偏多，面對整潔如上的樣本，識別率能夠達到百分之百，當然通常情況下，樣本不同識別率能維持在95%以上。

總結文字識別SDK軟體功能特色：

1. 支持TIFF，圖像PDF，BMP ，JPG，PNG等格式圖像的讀取；

2. 支持對圖像由於掃描引起的傾斜進行自動校正；

3. 支持自動旋轉圖片至正向位置(自動旋正)；

4. 支持對圖像進行自動版面分析；

5. 支持GB_2312 碼(大陸使用)、BIG_5 碼(台灣使用)、GBK、JIS、Shift-JIS(日文使用)、KSC(韓文)內碼的輸出；

6. 支持少數民族語言UNICOCE轉碼輸出；

7. 支持識別純英文、簡繁體中文、日文、韓文、中英文混排的文本圖像；

8. 支持識別藏文、維文、哈薩克文、阿拉伯文、柯爾克孜文與中文、英文混排的文本圖像；

9. 支持移動端iOS以及Andeoid操作系統，支持中英文拍照OCR。