滑块验证码识别、破解-技术详解(JAVA)
lipiwang 2024-10-27 13:28 7 浏览 0 评论
滑块验证码是目前网络上使用最多的,也是体验相对来说比较好的一种验证码。但爬虫和反爬虫就像矛和盾一样的关系相互促进相互影响,互联网技术就是在这样的不断碰撞中向前发展。
结合我自己的个人工作经验,来聊聊滑块验证码,我们就拿京东登陆页面的滑块验证举例,进行详细分解学习。
目标:通过算法找到需要滑动的滑块(下文一律叫切片区)距离背景目标区域(下文一律叫背景区)的距离,然后自动拖动完成拼接。
一、利用Chrome-F12的开发者工具来定位滑块验证码的请求地址:
1、在google浏览器中打开对应的网站,进入到滑块验证码页面
2、在验证码页面按F12,进入Network区
3、点击验证码右上角的换一张(图中标号为1),目的是捕获验证码的请求地址
4、在name区可以看到多个情况地址,找到其中的验证码请求地址,这里是g.html(图中标号为2)
5、在Headers表头可以看到对应此链接地址的情况地址,以及请求方式,这里是GET请求
(注:后期可以通过JS或者Java等模拟网站GET请求来获取验证码信息)
二、分析、查找"切片区"和"背景区"的对应图片数据信息:
1、点击开发者工具中的Response来查看请求的返回值
2、这里是一个JSON串格式,其中bg对应的值就是背景图片区域的base64字符串值,patch对应的值就是切片区base64字符串值.
3、将这些base64字符串值转换成图片,我们看一下背景区和切片区字符串对应的具体图像:
//切片对应的base64String
String sliceImg="iVBORw0KGgoAAAANSUhEUgAAADIAAA.....";//内容太多省略,自己从浏览器中获取即可
//背景区对应的base64String
String bgImg = "iVBORw0KGgoAAAANSUhE....";//内容太多省略,自己从浏览器中获取即可
//背景区
BufferedImage biBuffer = base64StringToImg(bgImg);
//切片区
BufferedImage sliceBuffer = base64StringToImg(sliceImg);
//将图片输出到本地查看
ImageIO.write(biBuffer,
"png", new File("E:\\bgImg.png"));
ImageIO.write(sliceBuffer,
"png", new File("E:\\sliceImg.png"));
/**
* base64字符串转存图片
* @param base64String base64字符串
* @return BufferedImage
*/
public static BufferedImage base64StringToImg(final String base64String) {
try {
BASE64Decoder decoder = new BASE64Decoder();
byte[] bytes = decoder.decodeBuffer(base64String);
ByteArrayInputStream bais = new ByteArrayInputStream(bytes);
return ImageIO.read(bais);
} catch (final IOException ioe) {
throw new UncheckedIOException(ioe);
}
}
三、(重点,核心)利用orc模板匹配算法进行匹配,查找最相似区域,也就是我们的期望的坐标点:
废话不多说,直接上代码:
import static com.googlecode.javacv.cpp.opencv_core.CV_32FC1;
import static com.googlecode.javacv.cpp.opencv_core.cvCreateMat;
import static com.googlecode.javacv.cpp.opencv_core.cvMinMaxLoc;
import static com.googlecode.javacv.cpp.opencv_imgproc.CV_TM_CCOEFF_NORMED;
import static com.googlecode.javacv.cpp.opencv_imgproc.cvMatchTemplate;
import java.awt.Color;
import java.awt.Graphics;
import java.awt.Rectangle;
import java.awt.image.BufferedImage;
import java.io.ByteArrayInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.UncheckedIOException;
import java.util.ArrayList;
import java.util.List;
import javax.imageio.ImageIO;
import com.googlecode.javacv.cpp.opencv_core;
import com.googlecode.javacv.cpp.opencv_core.CvMat;
import com.googlecode.javacv.cpp.opencv_core.CvSize;
import com.googlecode.javacv.cpp.opencv_core.IplImage;
import com.googlecode.javacv.cpp.opencv_imgproc;
import sun.misc.BASE64Decoder;
public class Test {
public static void main(String[] args) throws IOException {
//切片对应的base64String
String sliceImg="iVBORw0KGgoAAAANSUhEUgAAADIAAA.....";//内容太多省略,自己从浏览器中获取即可
//背景区对应的base64String
String bgImg = "iVBORw0KGgoAAAANSUhE....";//内容太多省略,自己从浏览器中获取即可
// 背景区
BufferedImage biBuffer = base64StringToImg(bgImg);
// 切片区
BufferedImage sliceBuffer = base64StringToImg(sliceImg);
// 由于切片矩形区域存在透明区域,所以预处理将透明区域变成白色,方便后面对图片二值化处理。
// (重点:如果这里不对透明区域预处理,切片预处理后将只有一种颜色导致匹配失败)
int white = new Color(255, 255, 255).getRGB();
for (int x = 0; x < sliceBuffer.getWidth(); x++) {
for (int y = 0; y < sliceBuffer.getHeight(); y++) {
if ((sliceBuffer.getRGB(x, y) >> 24) == 0) {
sliceBuffer.setRGB(x, y, white);
}
}
}
IplImage sourceImage = IplImage.createFrom(biBuffer);
IplImage targetImage = IplImage.createFrom(sliceBuffer);
CvMat sourceMat = sourceImage.asCvMat();
CvMat targetMat = targetImage.asCvMat();
// 模板匹配算法,根据目标图片在背景图片中查找相似的区域
List<Rectangle> a = matchTemplateTest(sourceMat, targetMat);
// 取第一个值,也就是匹配到的最相识的区域,可以定位目标坐标
// 也是我们期望的坐标点
Rectangle rec = a.get(0);
// 下面是验证,将识别到的区域用红色矩形框标识出来,进行验证看是否正确
Graphics g = biBuffer.getGraphics();
// 画笔颜色
g.setColor(Color.RED);
// 矩形框(原点x坐标,原点y坐标,矩形的长,矩形的宽)
g.drawRect(rec.x, rec.y, rec.width, rec.height);
g.dispose();
//输出到本地,验证区域查找是否正确
FileOutputStream out = new FileOutputStream("d:\\checkImage.png");
ImageIO.write(biBuffer, "png", out);
}
/**
* 模板匹配算法,根据目标图片在背景图片中查找相似的区域
* @param sourceMat 背景区域图片数组矩阵
* @param targetMat 切片目标区域图片数组矩阵
* @return 坐标点集合
*/
public static List<Rectangle> matchTemplateTest(CvMat sourceMat, CvMat targetMat) {
List<Rectangle> rtn = new ArrayList<Rectangle>();
//对图象进行单通道、二值化处理
CvMat source = opencv_core.cvCreateMat(sourceMat.rows(), sourceMat.cols(), opencv_core.CV_8UC1);
CvMat target = opencv_core.cvCreateMat(targetMat.rows(), targetMat.cols(), opencv_core.CV_8UC1);
opencv_imgproc.cvCvtColor(sourceMat, source, opencv_imgproc.CV_BGR2GRAY);
opencv_imgproc.cvCvtColor(targetMat, target, opencv_imgproc.CV_BGR2GRAY);
CvSize targetSize = target.cvSize();
CvSize sourceSize = source.cvSize();
CvSize resultSize = new CvSize();
resultSize.width(sourceSize.width() - targetSize.width() + 1);
resultSize.height(sourceSize.height() - targetSize.height() + 1);
CvMat result = cvCreateMat(resultSize.height(), resultSize.width(), CV_32FC1);
//利用模板匹配算法进行查找
cvMatchTemplate(source, target, result, CV_TM_CCOEFF_NORMED);
opencv_core.CvPoint maxLoc = new opencv_core.CvPoint();
opencv_core.CvPoint minLoc = new opencv_core.CvPoint();
double[] minVal = new double[2];
double[] maxVal = new double[2];
//找出图片数据中最大值及最小值的数据
cvMinMaxLoc(result, minVal, maxVal, minLoc, maxLoc, null);
Rectangle rec = new Rectangle(maxLoc.x(), maxLoc.y(), target.cols(), target.rows());
//将查找到的坐标按最优值顺序放入数组
rtn.add(rec);
source.release();
target.release();
result.release();
opencv_core.cvReleaseMat(result);
opencv_core.cvReleaseMat(source);
opencv_core.cvReleaseMat(target);
source = null;
target = null;
result = null;
return rtn;
}
我们看一下识别到的结果区域(红色矩形标识就是有系统自动识别出来的)霸气不霸气:
四、根据第三步得到的移动坐标点进行坐标移动(这太小菜了,就不大篇幅在这里啰嗦了,可以使用你知道的任何技术进行模拟坐标移动),我用autoit进行举例;
//autoit代码块
//移动鼠标指针。
MouseMove ( x, y [, 速度] )
//参数说明:
x:要移动到的目标位置的 X 坐标。
y:要移动到的目标位置的 Y 坐标。
速度:鼠标移动速度,可设数值范围在 1(最快)和 100(最慢)之间。若设置速度为 0 则立即移动鼠标到指定位置。默认速度为 10。
相关推荐
- 《每日电讯报》研发数字工具,教你更有效率地报道新闻
-
为鼓励新闻编辑部持续创新,《每日电讯报》正在尝试有战略地研发数字工具。网站的数字媒体主任马尔科姆o科尔斯(MalcolmColes)表示,《每日电讯报》正试图去“创建一些可持续资产”,以便于让记者们...
- html5学得好不好,看掌握多少标签
-
html5你了解了多少?如果你还是入门阶段的话,或者还是一知半解的话,那么我们专门为你们收集的html5常用的标签大全对你就很有帮助了,你需要了解了html5有哪些标签你才能够更好的。驾驭html5...
- 前端分享-少年了解过iframe么(我想了解少年)
-
iframe就像是HTML的「内嵌画布」,允许在页面中加载独立网页,如同在画布上叠加另一幅动态画卷。核心特性包括:独立上下文:每个iframe都拥有独立的DOM/CSS/JS环境(类似浏...
- 做SEO要知道什么是AJAX(人能看到但搜索引擎看不到的内容)
-
一个明显的,人能看到但搜索引擎不能看到的内容是AJAX。那么什么是AJAX呢?其实,了解过的基本上也都清楚,AJAX不是新的编程语言,而是一种使用现有标准的新方法。AJAX最大的优点是在不重新加...
- 介绍最前沿的人工智能创新,‘无反向传播’神经网络训练方法?
-
图像由GoogleImageFX生成前言:本文整理自NoProp原始论文与实践代码,并结合多个公开实现细节进行了全流程复现。对神经网络训练机制的探索仍在不断演进,如果你也在研究反向传播之...
- 说说我们对HTML6的期许(对html的看法)
-
HTML5概述HTML5是HTML语言最受欢迎的版本之一,它支持音频和视频、离线存储、移动端、和标签属性等等。还提供了article,section,header这样的标签来帮助开发者更好...
- 浏览器中在线预览pdf文件,pdf.mjs插件实现web预览pdf
-
背景:本来只是淘宝上卖卖袜子,想着扩展一下业务,准备做同名“来家居”海外袜子馆外贸项目,碰到pdf在线预览的需求,就找了pdf.js插件进行实践后把此方法记录下来,可以通过多种方法来实现,每种方法都有...
- SVG 在前端的7种使用方法,你还知道哪几种?
-
本文简介点赞+关注+收藏=学会了技术一直在演变,在网页中使用SVG的方法也层出不穷。每个时期都有对应的最优解。所以我打算把我知道的7种SVG的使用方法列举出来,有备无患~如果你还...
- HTML5常用标签大全(html5em标签)
-
HTML前端开发最终取决于掌握标签的多少HTML大概有七八百个标签楼主这里给大家总结了下HTML常用标签标签描述<!--...-->定义注释。<!DOCTYPE>定义文档类型...
- "伪君子Snoop Dogg!"... WHAT?| MetroDaily 24/7
-
TUE.01-新作品-虽说年纪大了会有点糊涂,但是最近SnoopDogg的这波操作实在是让粉丝们有点迷,甚至有人表示没想到他是这样的"伪君子"......而这一切都源于他近日在IG上Po出的一...
- 莎夏·班克斯盼望表哥Snoop Dogg为其作出场曲
-
NXT女子冠军莎夏·班克斯(SashaBanks)近日接受了迈阿密先驱报采访,访谈纪要如下:关于她出众的形象:“我一向喜欢与众不同。为了能让人眼前一亮,我的装束总是非常前卫、非常抢眼,这样才能让观众...
- 喜欢Snoop!全球第一间「史努比博物馆」海外分馆在东京!
-
1950年起,由美國漫畫家CharlesM.Schulz創作的作品《Snoopy》史努比,其鮮明的可愛角色與幽默的劇情內容,至今仍成為許多大朋友與小朋友心中的最愛。為了紀念作者所設立的全球首...
- Vetements 推出 Snoop Dogg 肖像「天价」T-Shirt
-
Vetements的CEOGuramGvasalia早前才透露品牌经营策略的秘密–Vetements如何成为人人热议的话题品牌。但似乎他仍有更多需要解释的东西–这个法国奢侈品牌最新...
- 狗爷Snoop Dogg的《I Wanna Thank Me》巡回演唱会旧金山站
-
西海岸匪帮说唱歌手SnoopDogg在《IWannaThankMe》巡回演唱会旧金山站表演(图片来自ICphoto)西海岸匪帮说唱歌手SnoopDogg(图片来自ICphoto)西海...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)