---
type: entity
title: Scrapling
created: 2026-05-31
updated: 2026-05-31
tags: [web-scraping, python, adaptive-parsing, mcp, open-source]
---

## 基本信息

| 属性 | 值 |
|------|-----|
| 名称 | Scrapling |
| 类型 | Python 网页抓取框架 |
| 作者 | Karim Shoair（D4Vinci） |
| 许可证 | BSD-3-Clause |
| 语言 | Python 3.10+ |
| GitHub | https://github.com/D4Vinci/Scrapling |
| 文档 | https://scrapling.readthedocs.io |

## 相关概念

- [[concepts/web-scraping|Web Scraping]]
- [[concepts/adaptive-parsing|Adaptive Parsing]]
- [[concepts/scrapling-mcp|Scrapling MCP]]
- [[concepts/mcp|MCP]]

## 最新动态（来自 [[library/ScraplingdocsREADME_CN.md at main.md]]）

- 2026-05-31：中文 README 摄入 wiki
- 框架支持自适应解析、反机器人绕过、Proxy 轮换、Spider 框架
- 内置 MCP 服务器支持 AI 辅助数据提取

## 核心功能

1. **自适应解析**：智能相似性算法，网站改版后仍能定位元素
2. **多层级 Fetcher**：HTTP / 隐秘浏览器 / 完整浏览器自动化
3. **Spider 框架**：类 Scrapy API，并发、多 Session、暂停/恢复、Streaming
4. **Proxy 轮换**：内置 ProxyRotator，支持自定义策略
5. **CLI 工具**：交互式 Shell，无需编程即可抓取

## 架构层次

```
Scrapling
├── parser        # 核心解析器，独立使用
├── fetchers     # 网站获取层
│   ├── Fetcher           # HTTP 请求
│   ├── StealthyFetcher  # 隐秘浏览器（反机器人）
│   └── DynamicFetcher    # 完整浏览器自动化
├── spiders       # 爬取框架
└── cli           # 命令行工具
```

## 历史记录

- 2024：首次发布
- 持续维护：92% 测试覆盖率，完整类型提示
- 2025-11：The Web Scraping Club 完整评测

## 参考来源

- [[library/ScraplingdocsREADME_CN.md at main.md]]