因为抓取提交的数据,有几个参数值不知道怎么算所以用了Chrome无头浏览器.

  • 原理

通过输入手机号并提交,如果手机号绑定了账户就会返回出用户名.

  • 分配线程

①输入完文件名和线程数量之后,获取一共有多少个手机号.用手机号数量/线程数量得出来的就是每个线程任务数量.
②如果有余数那么额外线程的任务数量就是手机号数量-线程数量*每个线程任务数量.

  • 线程处理

①每个线程都启动一个无头浏览器,禁止加载图片和滑动条(自动判断系统类型请把Chromedriver放在脚本目录下).
②根据每个线程任务数量循环(包括出错的任务).
③如果这个任务整体运行出错超过了6次就会被淘汰.
④接下来打开网页,获取网页源码,获取验证码并识别,赋值数据,点击按钮.
⑤因为提交之后不可能立刻就会响应,所以需要等待1.2秒种.
⑥重新获取网页源码判断是不是验证码识别错误,如果错误就重试(6次错误淘汰,自动变成整体运行错误).
⑦接下来就是判断是不是存在账户,如果返回的信息存在未知错误等就会自动变成整体运行错误.如果是存在或不存在则写入文件.

  • Chromedriver


Chrome与Chromedriver版本要一致.


仅供学习,禁止非法用途.

如需要源码请与博主联系.

Last modification:February 24th, 2020 at 05:07 pm
如果觉得我的文章对你有用,请随意赞赏