---
type: library
origin: ScraplingdocsREADME_CN.md at main.md
originPath: sources/ScraplingdocsREADME_CN.md at main.md
ingested: 2026-05-31
tags: [web-scraping, python, adaptive-parsing, mcp, scrapling]
---

## 摘要

Scrapling 是一个自适应的 Python 网页抓取框架，能够处理从单个请求到大规模爬取的一切需求。核心特点是使用智能相似性算法在网站结构变化后仍能重新定位目标元素。其 Fetcher 集成了高级反机器人绕过（Cloudflare Turnstile）、Proxy 轮换、Session 管理等功能。Spider 框架支持并发爬取、暂停/恢复、Streaming 模式，并提供完整的 CLI 和交互式 Shell。内置 MCP 服务器支持 AI 辅助数据提取。

## 关键要点

- **自适应解析**：元素选择器能跟踪网站变化，`auto_save=True` 模式下网站改版后无需修改代码
- **多层级 Fetcher**：HTTP（Fetcher）→ 隐秘浏览器（StealthyFetcher）→ 完整浏览器自动化（DynamicFetcher）
- **Spider 框架**：类 Scrapy API，支持并发、多 Session、暂停/恢复、Streaming
- **MCP 服务器**：内置 AI 辅助 Web Scraping，集成 Claude/Cursor，降低 token 消耗
- **性能领先**：解析速度比 BS4 快 784 倍，自适应查找比 AutoScraper 快 5 倍

## 本文件对 wiki 的贡献

- 新增实体：[[entities/scrapling|Scrapling]]
- 新增/更新概念：[[concepts/web-scraping|Web Scraping]]、[[concepts/adaptive-parsing|Adaptive Parsing]]、[[concepts/scrapling-mcp|Scrapling MCP]]
- 可能触发的 synthesis：Web Scraping 框架对比（Scrapy vs Scrapling vs Playwright）

## 相关页面

- [[entities/scrapling|Scrapling]]
- [[concepts/web-scraping|Web Scraping]]
- [[concepts/adaptive-parsing|Adaptive Parsing]]
- [[concepts/scrapling-mcp|Scrapling MCP]]