怎麼提高opencv3中場景文字檢測的速度?

opencv3中提供了場景文字檢測的功能,vs2010編譯的de ,運行速度好慢,運行opencv里給的例子檢測文字的例子,一幅大小800*600的圖像,得要一分鐘左右的時間,算不上實時性。怎麼能提高運行速度啊?


我猜題主也是看到裡面的這個real-time才去試一試的吧。。。

IEEE鏈接:Neumann L., Matas J.: Real-Time Scene Text Localization and Recognition, CVPR 2012。這是text detection庫參照的論文。

沒細讀這篇文章,但是知道是基於ER的方法。我想Matas大神既然說能實時,方法就確實應該能實時,所以也去試試(編譯opencv3 debug、release等了好久。。。)。然而事實證明這個庫的作者Lluis Gomez實現真的沒有到達實時。

這是我在x64 release下測試該庫在ICDAR13 rrc比賽的performance時的截圖,配置是i7-3770 3.4GHZ 內存16G

最慢的一張是3000*2000的圖是20s,其他都是2秒以內,一共233張圖8分鐘左右,雖然沒有題主說的「1分鐘一張」那麼誇張,但是也還是比較慢了,我覺得可能真正的工業應用上要把圖片先壓縮吧,800*600的這種一般0.6-0.7秒差不多,但是我覺得還是達不到實時性要求。

我可以說我的SWT都比他快嗎。。。

然而,我真正要吐槽的是,這個庫的效果....這是測試的performance結果

左中右分別是 precision recall F

他的F50出頭 (MSERs 、 MSER是另外的2個人跑opencv3的這個庫的結果,也差不多)

我的SWT + cnn 雖然離top差很遠 但是也好一些了

我覺得還要繼續改進吧。。。不然為啥還只是在opencv_contrib裡面呢。。


我是win32 debug版本下跑的,是很慢,效果也不好。用的海報圖,大約是1分鐘一張,看了樓上上的跑了半天,但是的確不是實時。

至於如何編譯版本,windows的可以參考這個鏈接 Windows環境下編譯OpenCV3.0和OpenCV_contrib【原創】


我也是沖著實時去的,事實證明實時還達不到。我的1280*720檢測一張速度大概在70-100ms,i7的本,我想放在嵌入式下,看來是不可能了


樓主是怎麼配置的?用哪個版本的opencv?急需教程。。感激不盡


我也重新編譯了 opencv_contrib ,但是 那個text detection 的demo還是跑不起來,請問一下具體怎麼配置的?有沒有鏈接發一下?感激不盡!!


推薦閱讀:

TAG:OpenCV | 文字識別技術 |