OCR 圖片文字識別圖解教程 - 藍色理想
一、什麼是OCR
很早之前就聽說有提取圖片中文字的工具和方法,這種文字識別技術稱為OCR(Optical Character Recognition)。OCR技術的出現,實現了將印刷文字掃描得到的圖片轉化為文本文字的功能,提供了一種全新的文字輸入手段,大大提高了用戶工作的效率。
二、OCR適合對象
1.印刷行業、文印店:經常會遇到客戶只給你一本厚厚的宣傳冊(因為客戶不知道電子稿保存的重要意義,甚至壓根就不知道什麼是電子稿),要你明天之前,必須把那本幾十頁宣傳冊上的文字,原原本本打出來。生意還是要做,沒有辦法,你只能再當一回為了打字而打字的工具了,除非你使用OCR;
2.辦公室工作人員:老闆某天拿了一張寫滿字的傳單給你,要求你馬上打成Word文檔,對於打字慢或是懶得打的你,為了完成工作任務,OCR就很適合你了;
3.其他對象:工作中、網路中、現實生活中,OCR對很多人都是有用的,能幫你輕鬆提高效率。
三、準確選擇OCR軟體
正常購買掃描儀的時候,配套軟體就會附有OCR功能,在網路上搜索,也會有一系列的OCR軟體可以下載,如:
1.清華紫光OCR V7.5 簡介:清華紫光 OCR支持Windows環境下的GB、BIG5、JIS和Shif。
2.ABBYY FineReader OCR Professional 7.0.0.963 簡介:一款OCR軟體。為用戶提供了現代OCR赤銅的全部功能,給予它們對信息管理的完全控制。
3.掃描小精靈 V1.30 Build 2003.03.21 簡介:針對OCR的圖像增強、虛擬TWAIN、批量掃描。
4.Mini Ocr 漢字顯示字體識別軟體 1.0 簡介:本軟體是飛濤軟體工作室開發的一款免費Ocr軟體,主要用於識別圖像文件之中出現的漢字。
5.Mini Ocr 漢字顯示字體識別軟體 V1.0 簡介:本軟體是飛濤軟體工作室開發的一款免費Ocr軟體。
6.奧普印刷體文字識別OCR系統 專業版
筆者從事互聯網行業也有三四年了,很早前就知道有OCR(文字識別技術),也曾花了好幾天的時間研究了不下十種的OCR軟體(包含以上6種),結果不是軟體安裝失敗,就是提取文字的識別率太低。過了好久,筆者下載了"尚書六號",才發現它就是多年來一直尋找的OCR軟體,並親眼見證了OCR的成果,識別率達到90%以上。欣喜之餘,寫了這篇"圖片文字提取(OCR)圖解教程",首刊在私房博客(http://www.fz10000.com)上,為所有在尋找OCR或想體驗OCR成果的人提供參考,歡迎各網站轉載。
"尚書六號"下載地址:http://www.csdx.org/soft/shangsu6.zip
四、圖片文字提取(OCR)圖解範例
1.從掃描儀導入圖片或截圖生成
[圖1] 截圖後,打開Photoshop,新建文件,解析度設:300像素/英寸
[圖2] 粘貼後,保存為.jpg格式
[圖3] 保存後的.jpg圖片
圖1、圖2、圖3是假設在瀏覽網頁時,遇到含有文字的圖片,利用騰訊TT截圖功能,在Photoshop粘貼生成.jpg文件;當然,也可以使用鍵盤上的PrintScan鍵截圖後,打開附件里的畫圖,進行粘貼生成.jpg文件。
2."尚書六號"的界面
3.導入需要提取的圖片
[圖5] 點擊"文件",選擇"打開圖象頁"
[圖6] 選擇剛才保存的sample.jpg並點擊"打開"
[圖7] "尚書六號"自動識別的三個選框
4.提取文字並保存文本
[圖8] 不修改默認設置,直接點擊"識別"後,彈出的界面
[圖9] 將框內的文字選中,並複製到文本文件或Word文檔進行個別錯字修正
推薦閱讀:
※千古奇文《璇璣圖》 - 釋放理想的日誌 - 網易博客
※什麼樣的人生目標算是好的正常的人生目標?
※為了理想,忍辱負重,不懈追求的精神一直為後人稱道.古今中外,這樣的例子不少,能舉出多少來?
※18歲女生如何改造自己?
※20歲了感覺人生很迷茫怎麼辦?