当前位置:网站首页 > 技术博客 > 正文

拖动验证码的识别实现



验证码往往是爬虫路上的一只拦路虎,而其花样也是层出不穷:图片验证、滑块验证、交互式验证、行为验证等。随着OCR技术的成熟,图片验证已经渐渐淡出主流,而「滑块验证」越来越多地出现在大众视野。“这么厉害,这小子长啥样呢?”没错,它就长这损sai:

解决它的方法也很直观,首先找到缺口的位置(通常只需要X轴的位置),然后拖动滑块即可。今天kimol君将带领大家用python识别出滑块验证中的缺口位置。

识别图片中的缺口,主要是利用python中的图像处理库cv2,其安装方法如下:

注:这里并不是“pip install cv2”哦~

1.读取图片

滑块验证的图片分为两部分,一个是背景图片:

另一个是缺口图片:

利用imread函数将其读取:

2.识别图片边缘

为了更好地将缺口与背景匹配,我们首先得识别出图片的边缘:

这里得到了图片边缘的灰度图,进一步将其图片格式转为RGB格式:

转换后的背景图为:

转换后的缺口图为:

3.缺口匹配

利用cv2中的matchTemplate函数,可以在背景图片中搜索对应的缺口,具体代码如下:

res为每个位置的匹配结果,代表了匹配的概率,选出其中「概率最高」的点,即为缺口匹配的位置:

min_val,max_val,min_loc,max_loc分别为匹配的最小值、匹配的最大值、最小值的位置、最大值的位置。

至此,我们已经有了缺口的位置,其X轴坐标为:

为了更直观地展示缺口的位置,我们将缺口用矩形框标注出来:

结果如下:

完美~ 收工!!!

为了在实际应用中更方便的使用,我们将代码封装为一个函数:

这里选择了读取本地图片文件,在爬虫过程中其实不是特别方便。如果有感兴趣的小伙伴,可以自己改动一下,将输入改为图片流即可。

本文至此便告于段落了,如果需要完整源码或者有任何建议都欢迎私信。最后,感谢各位小伙伴的耐心阅读,咋们下次再会~

  • 上一篇: 源代码仓库
  • 下一篇: python argparse模块详解
  • 版权声明


    相关文章:

  • 源代码仓库2025-09-21 19:01:05
  • win7系统c盘哪些东西可以删除2025-09-21 19:01:05
  • win10怎么自动检测修复系统2025-09-21 19:01:05
  • http请求的几种方法2025-09-21 19:01:05
  • 非常值得一看的java面试题2025-09-21 19:01:05
  • python argparse模块详解2025-09-21 19:01:05
  • 计算机专业学生职业生涯规划2025-09-21 19:01:05
  • java匿名内部类格式2025-09-21 19:01:05
  • matlab函数介绍2025-09-21 19:01:05
  • css3的高级选择器有哪些2025-09-21 19:01:05