深入虎穴：Python + OpenCV 攻克滑块验证码实战详解

- July 17, 2025

重要声明

本指南仅供技术学习与研究之用。旨在探讨计算机视觉和自动化技术在特定场景的应用，以帮助开发者理解滑块验证码的工作原理，从而构建更安全的验证系统。请勿将此技术用于任何非法或侵犯他人权益的活动。任何滥用本指南所含信息的行为，后果自负。

一、滑块验证码的“前世今生”

滑块验证码（Slider CAPTCHA）是一种常见的“行为式验证码”。它要求用户将一个拼图滑块拖动到背景图的缺口处，以证明自己是人类。相比于字符验证码，它提供了更好的用户体验。

其验证逻辑通常是：

前端: 用户拖动滑块，浏览器记录下最终的水平移动距离。
后端: 服务器端预先知道缺口的正确位置。当接收到前端传来的距离后，与正确值进行比对，如果在一定误差范围内，则验证通过。

我们的破解目标就是：自动计算出这个距离，并模拟人的行为将滑块拖过去。

二、破解策略总览

我们的“作战计划”分为四步：

获取目标: 使用 Playwright 打开目标网页，获取带缺口的背景图和独立的滑块拼图。
图像分析: 使用强大的计算机视觉库 OpenCV (cv2)，对比两张图，计算出滑块需要移动的精确像素距离。
轨迹模拟: 模拟人类的鼠标移动轨迹。这是成败的关键，直接匀速滑过去100%会被识破。我们需要一个变速的、略带抖动的轨迹。
执行操作: 使用 Playwright 驱动鼠标，按照我们生成的轨迹完成拖拽。

技术栈: Python + Playwright + opencv-python + numpy

三、代码实战

步骤 1: 获取验证码图片

首先，我们需要用Playwright定位到验证码的图片元素，并将其保存到本地。

# (部分代码，假设page对象已创建)

# 等待背景图和滑块图加载完成
await page.wait_for_selector('.captcha-background-image')
await page.wait_for_selector('.captcha-slider-piece')

# 获取图片元素的base64数据或URL
background_b64 = await page.locator('.captcha-background-image').get_attribute('src')
slider_b64 = await page.locator('.captcha-slider-piece').get_attribute('src')

# 将base64数据解码并保存为图片文件
import base64

with open('background.png', 'wb') as f:
    f.write(base64.b64decode(background_b64.split(',')[1]))

with open('slider.png', 'wb') as f:
    f.write(base64.b64decode(slider_b64.split(',')[1]))

步骤 2: OpenCV 计算缺口距离

这是整个流程的技术核心。我们将使用OpenCV的模板匹配功能来找到缺口位置。

# get_gap_distance.py
import cv2

def find_gap_position(background_path, slider_path):
    """使用OpenCV模板匹配计算缺口位置"""
    # 读取图片
    background = cv2.imread(background_path, 0) # 以灰度模式读取
    slider = cv2.imread(slider_path, 0)

    # 对滑块进行二值化处理，去除背景噪声
    _, slider_binary = cv2.threshold(slider, 127, 255, cv2.THRESH_BINARY)

    # 寻找滑块的轮廓
    contours, _ = cv2.findContours(slider_binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    slider_contour = contours[0]

    # 在背景图上进行模板匹配
    result = cv2.matchTemplate(background, slider, cv2.TM_CCOEFF_NORMED)

    # 找到匹配度最高的位置
    _, _, _, max_loc = cv2.minMaxLoc(result)

    # max_loc[0] 就是缺口的左上角x坐标
    distance = max_loc[0]

    # 可能需要根据实际情况微调偏移量
    # distance -= 7 

    return distance

# 使用方法
distance = find_gap_position('background.png', 'slider.png')
print(f"计算出的滑块移动距离为: {distance}px")

步骤 3: 模拟人性化移动轨迹

直接将鼠标从起点移动到终点是最低级的模拟，很容易被检测。一个更“像人”的轨迹应该具备以下特点：

非匀速，通常是先加速后减速。
路径不是一条完美的直线，有轻微的上下抖动。

# generate_track.py
import numpy as np

def generate_mouse_trajectory(distance):
    """生成一个模拟人类行为的鼠标移动轨迹"""
    # 总的移动步数
    num_steps = np.random.randint(25, 40)

    # 使用numpy的linspace来创建一个先慢后快的移动序列
    x_positions = np.linspace(0, distance, num=num_steps, endpoint=True)
    # 模拟一个缓动函数效果
    ease_out_positions = distance * (1 - (1 - x_positions/distance)**3)

    track = []
    for x in ease_out_positions:
        # 添加Y轴上的随机轻微抖动
        y_offset = np.random.randint(-2, 3)
        track.append((int(x), y_offset))

    return track

步骤 4: Playwright 执行滑动

最后一步，我们将计算出的距离和生成的轨迹交给Playwright来执行。

# (部分代码，在主脚本中)

# 1. 计算距离
distance = find_gap_position('background.png', 'slider.png')

# 2. 生成轨迹
track = generate_mouse_trajectory(distance)

# 3. 定位到滑块按钮
slider_button = page.locator('.captcha-slider-button')
box = await slider_button.bounding_box()

# 4. 执行拖拽
await page.mouse.move(box['x'] + box['width'] / 2, box['y'] + box['height'] / 2)
await page.mouse.down()

# 按照轨迹移动
for x, y in track:
    await page.mouse.move(box['x'] + x, box['y'] + y)
    # 模拟短暂的停顿
    await page.wait_for_timeout(np.random.randint(10, 30))

# 移动到终点
await page.mouse.move(box['x'] + distance, box['y'])
await page.mouse.up()

# 5. 检查验证结果
# ... 后续逻辑 ...

总结与反思

我们成功地通过结合Playwright和OpenCV，实现了一套破解滑块验证码的自动化流程。其核心在于“计算”和“模拟”：精确计算出缺口位置，并高度模拟人类的拖拽行为。

然而，道高一尺，魔高一丈。更高级的验证码系统已经开始引入更复杂的检测手段：

轨迹数据分析: 检测鼠标移动的速度、加速度、停顿点等，用机器学习模型判断是否为机器行为。
设备指纹: 采集浏览器、操作系统、字体等信息，识别已知的自动化工具。
加密: 对前端JS逻辑进行加密和混淆，增加逆向工程的难度。

因此，这场“猫鼠游戏”将持续下去。作为开发者，理解攻击的原理，才能构筑更坚固的防线。

Search This Blog

Tech Blog