---
title: "Amazon Redshift"
type: entity
tags:
  - AWS
  - Data-Warehouse
  - OLAP
  - Managed Service
sources:
  - ctp-topic-68-introduction-to-redshift
last_updated: 2026-04-23
---

## Overview
Amazon Redshift 是 AWS 提供的大规模并行处理（MPP）云数据仓库服务，支持 PB 级数据存储，面向 OLAP（在线分析处理）工作负载。完全托管，无需自行管理基础设施，具备自动备份、点时间恢复和跨区域灾难恢复能力。

## Core Architecture
- **Leader Node**：协调节点，负责客户端连接（JDBC/ODBC）、Schema 管理、仓库元数据和查询计划生成，将查询指令分发至 Compute Node
- **Compute Node**：执行节点，根据实例类型决定节点数量，每个节点在 Slices 上并行处理数据，完成后返回结果至 Leader Node
- **Slices**：Compute Node 内部的虚拟分区，每个 Slice 独立处理数据子集，实现并行计算

## Instance Types
| 类型 | 特点 | 适用场景 |
|------|------|----------|
| Dense Compute | 高 CPU + 内存，适合计算密集型查询 | 大规模数据分析 |
| Dense Storage | 高存储，适合存储密集型工作负载 | 历史数据归档 |
| RA3 | 性价比最优，AWS 托管 NVMe 存储，可独立扩展计算和存储 | 大容量数据仓库（推荐） |

## Key Features
- **MPP（大规模并行处理）**：跨多个 Compute Node 并行执行查询，显著提升查询速度和响应时间
- **列式存储（Columnar Storage）**：数据按列存储，适合聚合查询和全表扫描，相比行式存储 I/O 效率更高
- **行式存储（Row Storage）**：适合少量行的精确查询和点查询
- **数据压缩**：采用 ZSTD/LZO 等压缩算法，减少存储空间和 I/O 开销
- **Sort Key（排序键）**：决定数据在磁盘上的物理排序顺序，优化范围查询和过滤操作
- **Distribution Key（分布键）**：决定数据在 Compute Node 间的分布方式，影响数据倾斜和跨节点数据传输

## Comparison with Other AWS Databases
- **vs Amazon RDS/Aurora**：RDS/Aurora 面向 OLTP（事务处理），Redshift 面向 OLAP（分析处理）；RDS/Aurora 适合写入密集型，Redshift 适合读取/分析密集型
- **vs Amazon DynamoDB**：DynamoDB 面向 NoSQL 键值/文档场景，Redshift 面向复杂 SQL 分析查询
- **vs Amazon Aurora**：Aurora 共享存储架构（6副本跨3 AZ），Redshift 独立 Compute Node 架构；Aurora 适合 10TB 以下场景，Redshift 适合 PB 级分析

## Related Entities
- [[Amazon RDS]]：托管关系型数据库，面向 OLTP
- [[Amazon Aurora]]：云原生关系型数据库，共享存储架构
- [[AWS]]：云服务提供商
- [[ctp-topic-68-introduction-to-redshift]]：Redshift 入门介绍
- [[ctp-topic-51-purpose-built-databases]]：AWS 专用数据库选型全景
- [[ctp-topic-66-rds-vs-aurora]]：RDS 与 Aurora 对比参考

## Aliases
- Redshift
- Amazon Redshift
- AWS Redshift
- Redshift Data Warehouse