標籤:

簡單驗證碼識別

一套簡單但是通用的驗證碼識別流程,可以滿足大部分初級驗證碼識別。

原圖。黑底是因為PIL的塊讀取問題。

灰度化、二值化

做一次中值濾波。去除噪點。

識別、去除干擾線。這一步對於切圖很關鍵。

做一次腐蝕。去除干擾線殘留。

垂直投影,準備切圖

切圖完成

講切圖resize到一致的塊大小,然後用支持向量機識別單個字元圖片即可。

總體識別率在80%左右,主要問題是切圖錯誤。更精細的切圖可以使用CFS+垂直投影+drop fall,結合字元寬度閾值,這裡不繼續深入了。

推薦閱讀:

TAG:驗證碼識別 |