最好的開源或開放API的ocr引擎是什麼？

01-24

想做點ocr的事情，goggles識別率很高，可是還沒開放API。tesseract識別率慘不忍睹，有下劃線就不識別，訓練起來還太麻煩。

最近公司有需要就調研了一波，在這兒分享一下：ps.由於公司OCR 識別需要支持多語種，因此國內的一些就不考慮了，百度的好像也已經沒了。

1.Google 的開源項目tesseract

谷歌的tesseract在OCR領域也是比較有名，支持100多種語言（如下）

但主要問題是它是開源項目，目前也沒有api介面平台，當然github里也有一些配置api的說明，網上有些博客也有說明，但是好像也是比較麻煩的。

2.微軟的Azure

微軟的Azure也已經出來很多年了，重點是提供API！官網上有具體的調製配置參數。中國區是由世紀互聯運營的。大家可以上官網（不是中國區的）上傳圖片體驗一下微軟的ocr識別。然後是語種，微軟暫時只支持22種語言（如下）。看官網應該是免費提供API的。

3.ABBYY Real-Time Recognition SDK

ABBYY相信很多人都挺過吧，網上好多人誇他家軟體識別率高來著呢，ABBYY也開始提供實時翻譯sdk了，安卓，iOS都支持，目前支持持63種識別語言，包括24種語言跟字典支持；而且還有中文網站，也是比較看重中國市場了~當然這個是收費的了，但是登記後可以免費試用一下

（截取部分支持語言）

4.ocr space

這個是無意中發現的，官網提供在線語音識別和免費API介面，當然也有專業版的付費API介面

了解了一下，發現這個網站是a9t9公司於 2016年研發的，但是a9t9公司也是德國剛成立不久的公司，之前的產品是kantu，好像用戶挺多的。試了下他們官網的在線語音識別，效果也還可以。對了，他們只支持24種語言，具體哪些可以上鏈接的官網上查看。

總結一下，要是想簡單配置，語種需求也不是很高的話當然是考慮微軟 Azure，如果是大公司，不在乎獨立配置，而且想支持更多語音的話，Google 開源的tesseract就是比較好的選擇了。當然我對OCR space也是感覺挺好，只是創立不久，真正使用起來不知道效果好不好~

暫時就查了這四個比較靠譜的~之後要是有新的再更新！

1. 開源的用的最多的是 tesseract

2. API，微軟ocr 可以試一試

微軟也有一個ocr識別，【Win10 應用開發】OCR識別

百度OCR文字識別

百度的有呀，只不是換成企業版的了，需要付費使用。百度OCR文字識別企業版

目前用過的就是tesseract，不訓練使用提供的語言包標準字體識別率還不錯，其它各種字體不訓練的話識別率會比較低。句號識別成O，一個漢字識別成了兩個字等。

同樣想知道

百度已經停止了不知道是什麼原因我也需要用這個服務一起交流下

可以去試試leadtools

百度的已經停止了