nexus/wiki/entities/Amazon-Redshift.md at b83b4e31055fa473a39c1992bf6d59563f85cea1 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

Shen Wei f09834b5a5 Update nexus: fix conflicts and sync local changes

2026-04-26 12:06:50 +08:00

3.0 KiB

Raw Blame History

title, type, tags, sources, last_updated

title

type

tags

sources

last_updated

Amazon Redshift

entity

AWS

Data-Warehouse

OLAP

Managed Service

ctp-topic-68-introduction-to-redshift

2026-04-23

Overview

Amazon Redshift 是 AWS 提供的大规模并行处理（MPP）云数据仓库服务，支持 PB 级数据存储，面向 OLAP（在线分析处理）工作负载。完全托管，无需自行管理基础设施，具备自动备份、点时间恢复和跨区域灾难恢复能力。

Core Architecture

Leader Node：协调节点，负责客户端连接（JDBC/ODBC）、Schema 管理、仓库元数据和查询计划生成，将查询指令分发至 Compute Node
Compute Node：执行节点，根据实例类型决定节点数量，每个节点在 Slices 上并行处理数据，完成后返回结果至 Leader Node
Slices：Compute Node 内部的虚拟分区，每个 Slice 独立处理数据子集，实现并行计算

Instance Types

类型	特点	适用场景
Dense Compute	高 CPU + 内存，适合计算密集型查询	大规模数据分析
Dense Storage	高存储，适合存储密集型工作负载	历史数据归档
RA3	性价比最优，AWS 托管 NVMe 存储，可独立扩展计算和存储	大容量数据仓库（推荐）

Key Features

MPP（大规模并行处理）：跨多个 Compute Node 并行执行查询，显著提升查询速度和响应时间
列式存储（Columnar Storage）：数据按列存储，适合聚合查询和全表扫描，相比行式存储 I/O 效率更高
行式存储（Row Storage）：适合少量行的精确查询和点查询
数据压缩：采用 ZSTD/LZO 等压缩算法，减少存储空间和 I/O 开销
Sort Key（排序键）：决定数据在磁盘上的物理排序顺序，优化范围查询和过滤操作
Distribution Key（分布键）：决定数据在 Compute Node 间的分布方式，影响数据倾斜和跨节点数据传输

Comparison with Other AWS Databases

vs Amazon RDS/Aurora：RDS/Aurora 面向 OLTP（事务处理），Redshift 面向 OLAP（分析处理）；RDS/Aurora 适合写入密集型，Redshift 适合读取/分析密集型
vs Amazon DynamoDB：DynamoDB 面向 NoSQL 键值/文档场景，Redshift 面向复杂 SQL 分析查询
vs Amazon Aurora：Aurora 共享存储架构（6副本跨3 AZ），Redshift 独立 Compute Node 架构；Aurora 适合 10TB 以下场景，Redshift 适合 PB 级分析

Amazon RDS：托管关系型数据库，面向 OLTP
Amazon Aurora：云原生关系型数据库，共享存储架构
AWS：云服务提供商
ctp-topic-68-introduction-to-redshift：Redshift 入门介绍
ctp-topic-51-purpose-built-databases：AWS 专用数据库选型全景
ctp-topic-66-rds-vs-aurora：RDS 与 Aurora 对比参考

Aliases

Redshift
Amazon Redshift
AWS Redshift
Redshift Data Warehouse