---
type: concept
title: Adaptive Parsing
created: 2026-05-31
updated: 2026-05-31
tags: [adaptive-parsing, web-scraping, ai, element-tracking]
---

## 定义

Adaptive Parsing（自适应解析）是一种智能网页抓取技术，能在网站结构发生变化后仍准确定位目标元素，无需人工干预或修改选择器代码。

## 核心要点

- **问题**：传统 CSS/XPath 选择器在网站改版后容易失效，维护成本高
- **解决方案**：通过智能相似性算法，在网站更新后自动重新定位元素
- **核心算法**：计算元素与初始标记元素的相似度，找到语义一致的目标
- **代表实现**：Scrapling 的 `auto_save=True` 和 `adaptive=True` 参数

## 工作原理

1. **初始标记**：用户用 CSS/XPath 选择目标元素
2. **特征提取**：提取元素的 DOM 结构、文本内容、属性模式
3. **变更检测**：网站更新后，重新请求页面
4. **相似度匹配**：通过算法找到与原元素最相似的节点
5. **自动恢复**：返回更新后的元素，无需修改代码

## 不同来源的说法

| 来源 | 观点 |
|------|------|
| [[library/ScraplingdocsREADME_CN.md at main.md]] | 自适应解析是 Scrapling 的核心差异点，比 AutoScraper 快 5 倍 |
| AutoScraper（对比） | 基于机器学习的相似性匹配，但性能较 Scrapling 慢 |

## 性能优势

Scrapling 的自适应元素查找性能对比：

| 库 | 时间 (ms) | vs Scrapling |
|------|---------|-------------|
| Scrapling | 2.39 | 1.0x |
| AutoScraper | 12.45 | 5.2x |

## 相关实体

- [[entities/scrapling|Scrapling]]

## 参考来源

- [[library/ScraplingdocsREADME_CN.md at main.md]]