--- title: "Amazon Redshift" type: entity tags: - AWS - Data-Warehouse - OLAP - Managed Service sources: - ctp-topic-68-introduction-to-redshift last_updated: 2026-04-23 --- ## Overview Amazon Redshift 是 AWS 提供的大规模并行处理(MPP)云数据仓库服务,支持 PB 级数据存储,面向 OLAP(在线分析处理)工作负载。完全托管,无需自行管理基础设施,具备自动备份、点时间恢复和跨区域灾难恢复能力。 ## Core Architecture - **Leader Node**:协调节点,负责客户端连接(JDBC/ODBC)、Schema 管理、仓库元数据和查询计划生成,将查询指令分发至 Compute Node - **Compute Node**:执行节点,根据实例类型决定节点数量,每个节点在 Slices 上并行处理数据,完成后返回结果至 Leader Node - **Slices**:Compute Node 内部的虚拟分区,每个 Slice 独立处理数据子集,实现并行计算 ## Instance Types | 类型 | 特点 | 适用场景 | |------|------|----------| | Dense Compute | 高 CPU + 内存,适合计算密集型查询 | 大规模数据分析 | | Dense Storage | 高存储,适合存储密集型工作负载 | 历史数据归档 | | RA3 | 性价比最优,AWS 托管 NVMe 存储,可独立扩展计算和存储 | 大容量数据仓库(推荐) | ## Key Features - **MPP(大规模并行处理)**:跨多个 Compute Node 并行执行查询,显著提升查询速度和响应时间 - **列式存储(Columnar Storage)**:数据按列存储,适合聚合查询和全表扫描,相比行式存储 I/O 效率更高 - **行式存储(Row Storage)**:适合少量行的精确查询和点查询 - **数据压缩**:采用 ZSTD/LZO 等压缩算法,减少存储空间和 I/O 开销 - **Sort Key(排序键)**:决定数据在磁盘上的物理排序顺序,优化范围查询和过滤操作 - **Distribution Key(分布键)**:决定数据在 Compute Node 间的分布方式,影响数据倾斜和跨节点数据传输 ## Comparison with Other AWS Databases - **vs Amazon RDS/Aurora**:RDS/Aurora 面向 OLTP(事务处理),Redshift 面向 OLAP(分析处理);RDS/Aurora 适合写入密集型,Redshift 适合读取/分析密集型 - **vs Amazon DynamoDB**:DynamoDB 面向 NoSQL 键值/文档场景,Redshift 面向复杂 SQL 分析查询 - **vs Amazon Aurora**:Aurora 共享存储架构(6副本跨3 AZ),Redshift 独立 Compute Node 架构;Aurora 适合 10TB 以下场景,Redshift 适合 PB 级分析 ## Related Entities - [[Amazon RDS]]:托管关系型数据库,面向 OLTP - [[Amazon Aurora]]:云原生关系型数据库,共享存储架构 - [[AWS]]:云服务提供商 - [[ctp-topic-68-introduction-to-redshift]]:Redshift 入门介绍 - [[ctp-topic-51-purpose-built-databases]]:AWS 专用数据库选型全景 - [[ctp-topic-66-rds-vs-aurora]]:RDS 与 Aurora 对比参考 ## Aliases - Redshift - Amazon Redshift - AWS Redshift - Redshift Data Warehouse