Files
nexus/wiki/concepts/数据管道-Data-Pipeline.md
2026-04-21 00:02:55 +08:00

1.1 KiB

title, type, tags, last_updated
title type tags last_updated
数据管道 (Data Pipeline) concept
automation
data-engineering
2026-04-17

Definition

自动化数据采集、清洗、转换和传递的工作流架构,将来自多个源头的数据按预定规则处理后输出到目标系统。

Components

  1. 采集层 (Collection) — 从 RSS、API、Web 抓取等源头获取原始数据
  2. 清洗层 (Cleaning) — 过滤无效数据、规范化格式
  3. 处理层 (Processing) — 去重、评分、分类、聚合
  4. 输出层 (Output) — 推送至 Discord、邮件、Telegram 等目标

Use Cases