55 lines
2.9 KiB
Markdown
55 lines
2.9 KiB
Markdown
---
|
||
title: "Amazon Redshift"
|
||
type: entity
|
||
tags:
|
||
- AWS
|
||
- Data-Warehouse
|
||
- OLAP
|
||
- Managed Service
|
||
sources:
|
||
- ctp-topic-68-introduction-to-redshift
|
||
last_updated: 2026-04-23
|
||
---
|
||
|
||
## Overview
|
||
Amazon Redshift 是 AWS 提供的大规模并行处理(MPP)云数据仓库服务,支持 PB 级数据存储,面向 OLAP(在线分析处理)工作负载。完全托管,无需自行管理基础设施,具备自动备份、点时间恢复和跨区域灾难恢复能力。
|
||
|
||
## Core Architecture
|
||
- **Leader Node**:协调节点,负责客户端连接(JDBC/ODBC)、Schema 管理、仓库元数据和查询计划生成,将查询指令分发至 Compute Node
|
||
- **Compute Node**:执行节点,根据实例类型决定节点数量,每个节点在 Slices 上并行处理数据,完成后返回结果至 Leader Node
|
||
- **Slices**:Compute Node 内部的虚拟分区,每个 Slice 独立处理数据子集,实现并行计算
|
||
|
||
## Instance Types
|
||
| 类型 | 特点 | 适用场景 |
|
||
|------|------|----------|
|
||
| Dense Compute | 高 CPU + 内存,适合计算密集型查询 | 大规模数据分析 |
|
||
| Dense Storage | 高存储,适合存储密集型工作负载 | 历史数据归档 |
|
||
| RA3 | 性价比最优,AWS 托管 NVMe 存储,可独立扩展计算和存储 | 大容量数据仓库(推荐) |
|
||
|
||
## Key Features
|
||
- **MPP(大规模并行处理)**:跨多个 Compute Node 并行执行查询,显著提升查询速度和响应时间
|
||
- **列式存储(Columnar Storage)**:数据按列存储,适合聚合查询和全表扫描,相比行式存储 I/O 效率更高
|
||
- **行式存储(Row Storage)**:适合少量行的精确查询和点查询
|
||
- **数据压缩**:采用 ZSTD/LZO 等压缩算法,减少存储空间和 I/O 开销
|
||
- **Sort Key(排序键)**:决定数据在磁盘上的物理排序顺序,优化范围查询和过滤操作
|
||
- **Distribution Key(分布键)**:决定数据在 Compute Node 间的分布方式,影响数据倾斜和跨节点数据传输
|
||
|
||
## Comparison with Other AWS Databases
|
||
- **vs Amazon RDS/Aurora**:RDS/Aurora 面向 OLTP(事务处理),Redshift 面向 OLAP(分析处理);RDS/Aurora 适合写入密集型,Redshift 适合读取/分析密集型
|
||
- **vs Amazon DynamoDB**:DynamoDB 面向 NoSQL 键值/文档场景,Redshift 面向复杂 SQL 分析查询
|
||
- **vs Amazon Aurora**:Aurora 共享存储架构(6副本跨3 AZ),Redshift 独立 Compute Node 架构;Aurora 适合 10TB 以下场景,Redshift 适合 PB 级分析
|
||
|
||
## Related Entities
|
||
- [[Amazon RDS]]:托管关系型数据库,面向 OLTP
|
||
- [[Amazon Aurora]]:云原生关系型数据库,共享存储架构
|
||
- [[AWS]]:云服务提供商
|
||
- [[ctp-topic-68-introduction-to-redshift]]:Redshift 入门介绍
|
||
- [[ctp-topic-51-purpose-built-databases]]:AWS 专用数据库选型全景
|
||
- [[ctp-topic-66-rds-vs-aurora]]:RDS 与 Aurora 对比参考
|
||
|
||
## Aliases
|
||
- Redshift
|
||
- Amazon Redshift
|
||
- AWS Redshift
|
||
- Redshift Data Warehouse
|