title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| Amazon Redshift |
entity |
| AWS |
| Data-Warehouse |
| OLAP |
| Managed Service |
|
| ctp-topic-68-introduction-to-redshift |
|
2026-04-23 |
Overview
Amazon Redshift 是 AWS 提供的大规模并行处理(MPP)云数据仓库服务,支持 PB 级数据存储,面向 OLAP(在线分析处理)工作负载。完全托管,无需自行管理基础设施,具备自动备份、点时间恢复和跨区域灾难恢复能力。
Core Architecture
- Leader Node:协调节点,负责客户端连接(JDBC/ODBC)、Schema 管理、仓库元数据和查询计划生成,将查询指令分发至 Compute Node
- Compute Node:执行节点,根据实例类型决定节点数量,每个节点在 Slices 上并行处理数据,完成后返回结果至 Leader Node
- Slices:Compute Node 内部的虚拟分区,每个 Slice 独立处理数据子集,实现并行计算
Instance Types
| 类型 |
特点 |
适用场景 |
| Dense Compute |
高 CPU + 内存,适合计算密集型查询 |
大规模数据分析 |
| Dense Storage |
高存储,适合存储密集型工作负载 |
历史数据归档 |
| RA3 |
性价比最优,AWS 托管 NVMe 存储,可独立扩展计算和存储 |
大容量数据仓库(推荐) |
Key Features
- MPP(大规模并行处理):跨多个 Compute Node 并行执行查询,显著提升查询速度和响应时间
- 列式存储(Columnar Storage):数据按列存储,适合聚合查询和全表扫描,相比行式存储 I/O 效率更高
- 行式存储(Row Storage):适合少量行的精确查询和点查询
- 数据压缩:采用 ZSTD/LZO 等压缩算法,减少存储空间和 I/O 开销
- Sort Key(排序键):决定数据在磁盘上的物理排序顺序,优化范围查询和过滤操作
- Distribution Key(分布键):决定数据在 Compute Node 间的分布方式,影响数据倾斜和跨节点数据传输
Comparison with Other AWS Databases
- vs Amazon RDS/Aurora:RDS/Aurora 面向 OLTP(事务处理),Redshift 面向 OLAP(分析处理);RDS/Aurora 适合写入密集型,Redshift 适合读取/分析密集型
- vs Amazon DynamoDB:DynamoDB 面向 NoSQL 键值/文档场景,Redshift 面向复杂 SQL 分析查询
- vs Amazon Aurora:Aurora 共享存储架构(6副本跨3 AZ),Redshift 独立 Compute Node 架构;Aurora 适合 10TB 以下场景,Redshift 适合 PB 级分析
Related Entities
Aliases
- Redshift
- Amazon Redshift
- AWS Redshift
- Redshift Data Warehouse