现在时间是:
当前位置:首 页 >> 数据采集>> 文章列表

Requests 简单验证码识别总结

作者:   发布时间:2016-03-16 15:33:18   浏览次数:3101

    先说说写这个的背景

      下面图是摘抄别人博文的,但文字内容已经替换,思路不尽一致:

 

      再看看部分识别结果

      是不是看着很眼熟?

 

      处理第一步,去背景噪音和二值化

     

       降噪和二值化需要不断的迭代测试,一起同一批验证码达到一定的效果,初步处理的越好,后面形成的向量也就越准确。

 

 

      处理第二步,制作字符样本

      嗯,分割不需要太大的技巧,当然这只是针对扭曲不严重的,扭曲严重的图片,还需要做恢复调整,具体调整思路就是按照一个方向旋转图片,当图片的宽度达到min的时候就是正的,这里的问题就看整体旋转还是参照一个点旋转,后者比较难哦

 

      处理第四步,贴标

      已经分割好的图片就是形成要贴上对应的标签,以供机器识别参照。

 

      处理第五步,验证结果

     将图片形成0,1向量,整个训练集就是m*n的大矩阵,标签m*1矩阵。

 

      思考

      结果是出来了,但是个别字符还是有点问题,总体识别正确率达到97%,因为采用的是KNN所以速度上还是有点呵呵,稍后用其他算法进一步优化调整。







上一篇:没有了    下一篇:没有了

Copyright ©2018    易一网络科技|www.yeayee.com All Right Reserved.

技术支持:自助建站 | 领地网站建设 |短信接口 版权所有 © 2005-2018 lingw.net.粤ICP备16125321号 -5