標籤:

最好的開源或開放API的ocr引擎是什麼?

想做點ocr的事情,goggles識別率很高,可是還沒開放API。tesseract識別率慘不忍睹,有下劃線就不識別,訓練起來還太麻煩。


最近公司有需要就調研了一波,在這兒分享一下:ps.由於公司OCR 識別需要支持多語種,因此國內的一些就不考慮了,百度的好像也已經沒了。

1.Google 的開源項目tesseract

谷歌的tesseract在OCR領域也是比較有名,支持100多種語言(如下)

但主要問題是它是開源項目,目前也沒有api介面平台,當然github里也有一些配置api的說明,網上有些博客也有說明,但是好像也是比較麻煩的。

2.微軟的Azure

微軟的Azure也已經出來很多年了,重點是提供API!官網上有具體的調製配置參數。中國區是由世紀互聯運營的。大家可以上官網(不是中國區的)上傳圖片體驗一下微軟的ocr識別。然後是語種,微軟暫時只支持22種語言(如下)。看官網應該是免費提供API的。

3.ABBYY Real-Time Recognition SDK

ABBYY相信很多人都挺過吧,網上好多人誇他家軟體識別率高來著呢,ABBYY也開始提供實時翻譯sdk了,安卓,iOS都支持,目前支持持63種識別語言,包括24種語言跟字典支持;而且還有中文網站,也是比較看重中國市場了~當然這個是收費的了,但是登記後可以免費試用一下

(截取部分支持語言)

4.ocr space

這個是無意中發現的,官網提供在線語音識別和免費API介面,當然也有專業版的付費API介面

了解了一下,發現這個網站是a9t9公司於 2016年研發的,但是a9t9公司也是德國剛成立不久的公司,之前的產品是kantu,好像用戶挺多的。試了下他們官網的在線語音識別,效果也還可以。對了,他們只支持24種語言,具體哪些可以上鏈接的官網上查看。

總結一下,要是想簡單配置,語種需求也不是很高的話當然是考慮微軟 Azure,如果是大公司,不在乎獨立配置,而且想支持更多語音的話,Google 開源的tesseract就是比較好的選擇了。當然我對OCR space也是感覺挺好,只是創立不久,真正使用起來不知道效果好不好~

暫時就查了這四個比較靠譜的~之後要是有新的再更新!


1. 開源的用的最多的是 tesseract

2. API,微軟ocr 可以試一試


微軟也有一個ocr識別,【Win10 應用開發】OCR識別


百度OCR文字識別


百度的有呀,只不是換成企業版的了,需要付費使用。百度OCR文字識別企業版


目前用過的就是tesseract,不訓練使用提供的語言包標準字體識別率還不錯,其它各種字體不訓練的話識別率會比較低。句號識別成O,一個漢字識別成了兩個字等。


同樣想知道


百度已經停止了 不知道是什麼原因 我也需要用這個服務 一起交流下


可以去試試leadtools


百度的已經停止了


推薦閱讀:

如何評價快速閱讀(speed read)技術?
語音識別開放化開發平台有哪些?

TAG:開放API |