iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python怎么通过pillow识别动态验证码
  • 835
分享到

python怎么通过pillow识别动态验证码

2023-06-21 20:06:57 835人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要讲解了“python怎么通过pillow识别动态验证码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么通过pillow识别动态验证码”吧!生活中,我们在登录微博,邮

这篇文章主要讲解了“python怎么通过pillow识别动态验证码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么通过pillow识别动态验证码”吧!

生活中,我们在登录微博,邮箱的时候,常常会碰到验证码。在工作时,如果想要爬取一些数据,也会碰到验证码的阻碍。本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。

环境配置

  • Python 2.7

  • Pillow 模块

有个问题就是python2.7目前只能让使用到2020年,现在再利用2.7下载好多东西都会报错,也该是时候更新到python3.7了,本文还是依赖于2.7的环境。

python怎么通过pillow识别动态验证码

识别验证码的代码下载地址:python_captcha_jb51.rar

 安装 pillow(PIL)库

sudo apt-get updatesudo apt-get install python-dev libtiff5-dev libjpeg8-dev zlib1g-dev libfreetype6-dev liblcms2-dev libWEBp-dev tcl8.6-dev tk8.6-dev python-tksudo pip2 install pillow

识别过程

将验证码文件python_captcha下载到运行目录下,解压后,在 python_captcha 目录新建 crack.py 文件,进行编辑。

#-*- coding:utf8 -*-from PIL import Imageim = Image.open("captcha.gif")#(将图片转换为8位像素模式)im.convert("P")# 打印颜色直方图print im.histogram()

输出:

python怎么通过pillow识别动态验证码

颜色直方图的每一位数字都代表了在图片中含有对应位的颜色的像素的数量。

每个像素点可表现 256 种颜色,你会发现白点是最多(白色序号 255 的位置,也就是最后一位,可以看到,有 625 个白色像素)。红像素在序号 200 左右,我们可以通过排序,得到有用的颜色。

his = im.histogram()values = {}for i in range(256):    values[i] = his[i]for j,k in sorted(values.items(),key=lambda x:x[1],reverse = True)[:10]:    print j, k

输出:

python怎么通过pillow识别动态验证码

我们得到了图片中最多的 10 种颜色,其中 220 与 227 才是我们需要的红色和灰色,可以通过这一讯息构造一种黑白二值图片。

#-*- coding:utf8 -*-from PIL import Imageim = Image.open("captcha.gif")im.convert("P")im2 = Image.new("P",im.size,255)for x in range(im.size[1]):    for y in range(im.size[0]):        pix = im.getpixel((y,x))        if pix == 220 or pix == 227: # these are the numbers to get            im2.putpixel((y,x),0)im2.show()

输出:

python怎么通过pillow识别动态验证码

局限及遇到的问题

#-*- coding:utf8 -*-

此行命令流在windows环境下运行会报错,具体原因可参考python(2)中文编码乱码问题;

该命令流有很大的局限性,识别的动态代买也只有此类:

python怎么通过pillow识别动态验证码

感谢各位的阅读,以上就是“python怎么通过pillow识别动态验证码”的内容了,经过本文的学习后,相信大家对python怎么通过pillow识别动态验证码这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: python怎么通过pillow识别动态验证码

本文链接: https://www.lsjlt.com/news/300365.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python怎么通过pillow识别动态验证码
    这篇文章主要讲解了“python怎么通过pillow识别动态验证码”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python怎么通过pillow识别动态验证码”吧!生活中,我们在登录微博,邮...
    99+
    2023-06-21
  • python通过pillow识别动态验证码的示例代码
    目录环境配置 安装 pillow(PIL)库识别过程生活中,我们在登录微博,邮箱的时候,常常会碰到验证码。在工作时,如果想要爬取一些数据,也会碰到验证码的阻碍。本次试验将带领大家认识...
    99+
    2024-04-02
  • Python+Pillow+Pytesseract怎么实现验证码识别
    这篇“Python+Pillow+Pytesseract怎么实现验证码识别”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Py...
    99+
    2023-06-30
  • Python+Pillow+Pytesseract实现验证码识别
    目录一、环境配置二、验证码识别实例1实例2实例3昨天十行代码实现文字识别,感觉怎样,是不是很爽 今天咋们继续利用pillow和pytesseract来实现验证码的识别 一、环境配置 ...
    99+
    2024-04-02
  • Python通用验证码识别OCR库之ddddocr验证码识别
    目录前言传统验证码滑动验证码文字点选验证码总结前言 相信做自动化测试的同学一定不可忽视的问题就是验证码,他几乎是一个网站登录的标配,当然,我一般是不建议在这上面浪费时间去做识别的。 ...
    99+
    2024-04-02
  • Python怎么通用验证码识别OCR库ddddocr
    这篇文章主要介绍“Python怎么通用验证码识别OCR库ddddocr”,在日常操作中,相信很多人在Python怎么通用验证码识别OCR库ddddocr问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pytho...
    99+
    2023-07-02
  • python自动化操作之动态验证码、滑动验证码的降噪和识别
    目录前言一、动态验证码 二、滑动验证码三、验证码的降噪四、验证码的识别总结前言 python对动态验证码、滑动验证码的降噪和识别,在各种自动化操作中,我们经常要遇到沿跳过验...
    99+
    2024-04-02
  • Python通用验证码识别OCR库怎么使用
    本篇内容主要讲解“Python通用验证码识别OCR库怎么使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python通用验证码识别OCR库怎么使用”吧!传统验证码传统验证就是数字、字母、汉字等...
    99+
    2023-06-30
  • python简单验证码识别
    在学习python通过接口自动登录网站时,用户名密码、cookies、headers都好解决但是在碰到验证码这个时就有点棘手了;于是通过网上看贴,看官网完成了对简单验证码的识别,如果是复杂的请看大神的贴这里解决不了; 以上两张为网站的上...
    99+
    2023-01-31
    验证码 简单 python
  • python 验证码识别库pytesse
    笔者环境 centos7 python3 pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。   依赖安装 yum install-y auto...
    99+
    2023-01-30
    验证码 python pytesse
  • Python教学|Python验证码识别
    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 计算验证码 滑块验证码 识图验证码 语音验证码 这篇博客主要写的就是识图验证码,识别的是简...
    99+
    2023-09-01
    python opencv 开发语言
  • python简单验证码识别的实现过程
    目录1. 环境准备1.1 安装pillow 和 pytesseract1.2 安装Tesseract-OCR.exe1.3 更改pytesseract.py的ocr路径2. 测试识别...
    99+
    2024-04-02
  • Python怎么实现图形验证码识别
    这篇文章主要介绍了Python怎么实现图形验证码识别的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python怎么实现图形验证码识别文章都会有所收获,下面我们一起来看看吧。环境使用python 3.9pycha...
    99+
    2023-07-05
  • 如何使用Python实现极验验证码识别验证码
    这篇“如何使用Python实现极验验证码识别验证码”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“如何使用Python实现极验...
    99+
    2023-07-05
  • Python免费验证码识别之ddddocr识别OCR自动库实现
    目录安装过程:完成之后,找个参考图片附ddddocr-验证码识别案例总结需要ocr识别,推荐一个Python免费的验证码识别-ddddocr 安装过程: 1、镜像安装:pip in...
    99+
    2024-04-02
  • 爬虫Python验证码识别入门
    目录爬虫Python验证码识别 1、批量下载验证码图片2、识别代码看看效果 3、折腾降噪、去干扰爬虫Python验证码识别 前言: 二值化、普通降噪、8邻域降...
    99+
    2024-04-02
  • pytesseract+mechanize识别验证码自动登陆
    pytesseract+mechanize识别验证码自动登陆需要的模块安装Pillow,Python平台的图像处理标准库pip install pillow安装pytesseract,文字识别库pip inst...
    99+
    2023-01-30
    验证码 pytesseract mechanize
  • Python+Selenium+Pytesseract怎么实现图片验证码识别
    这篇文章给大家介绍Python+Selenium+Pytesseract怎么实现图片验证码识别,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一、selenium截取验证码import jsonfrom&nbs...
    99+
    2023-06-26
  • Python通用验证码识别OCR库ddddocr的安装使用
    Python通用验证码识别OCR库ddddocr的安装使用 一、前言二、Python安装(Python版本必须>=3.8)三、安装ddddocr3.1 解决ssl module 的问题3.1....
    99+
    2023-09-11
    python linux 开发语言
  • Python做简单的验证码识别(ocr)
    1、环境:系统:XPPython版本:2.7.52、所需文件:(1)、pillow地址:https://pypi.python.org/pypi/Pillow/(2)、tesseract地址:https://github.com/tesse...
    99+
    2023-01-31
    验证码 简单 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作