簡單驗證碼識別
02-24
一套簡單但是通用的驗證碼識別流程,可以滿足大部分初級驗證碼識別。
原圖。黑底是因為PIL的塊讀取問題。
灰度化、二值化
做一次中值濾波。去除噪點。
識別、去除干擾線。這一步對於切圖很關鍵。
做一次腐蝕。去除干擾線殘留。
垂直投影,準備切圖
切圖完成
講切圖resize到一致的塊大小,然後用支持向量機識別單個字元圖片即可。
總體識別率在80%左右,主要問題是切圖錯誤。更精細的切圖可以使用CFS+垂直投影+drop fall,結合字元寬度閾值,這裡不繼續深入了。
推薦閱讀:
TAG:驗證碼識別 |