Files
nexus/wiki/concepts/Scrapy.md
2026-04-16 21:08:55 +08:00

609 B
Raw Blame History

title, type, tags, date
title type tags date
Scrapy concept
爬虫
Python
Scrapy
2025-11-11

Definition

Scrapy 是一个用 Python 编写的快速高级网页爬虫框架,用于从网站中提取结构化数据。

Key Features

  • 轻量高效、插件生态丰富、可 Docker 化部署
  • 对 JS 渲染页面支持弱,需要配合 Splash 或 Playwright

Role

在电商数据采集系统中Scrapy 负责结构化抓取、分页调度、下载媒体,输出 JSON 或 CSV 文件供 n8n 消费。

Connections