Files
nexus/wiki/entities/Amazon-Redshift.md
2026-04-24 00:03:01 +08:00

2.9 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Amazon Redshift entity
AWS
Data-Warehouse
OLAP
Managed Service
ctp-topic-68-introduction-to-redshift
2026-04-23

Overview

Amazon Redshift 是 AWS 提供的大规模并行处理MPP云数据仓库服务支持 PB 级数据存储,面向 OLAP在线分析处理工作负载。完全托管无需自行管理基础设施具备自动备份、点时间恢复和跨区域灾难恢复能力。

Core Architecture

  • Leader Node协调节点负责客户端连接JDBC/ODBC、Schema 管理、仓库元数据和查询计划生成,将查询指令分发至 Compute Node
  • Compute Node:执行节点,根据实例类型决定节点数量,每个节点在 Slices 上并行处理数据,完成后返回结果至 Leader Node
  • SlicesCompute Node 内部的虚拟分区,每个 Slice 独立处理数据子集,实现并行计算

Instance Types

类型 特点 适用场景
Dense Compute 高 CPU + 内存,适合计算密集型查询 大规模数据分析
Dense Storage 高存储,适合存储密集型工作负载 历史数据归档
RA3 性价比最优AWS 托管 NVMe 存储,可独立扩展计算和存储 大容量数据仓库(推荐)

Key Features

  • MPP大规模并行处理:跨多个 Compute Node 并行执行查询,显著提升查询速度和响应时间
  • 列式存储Columnar Storage:数据按列存储,适合聚合查询和全表扫描,相比行式存储 I/O 效率更高
  • 行式存储Row Storage:适合少量行的精确查询和点查询
  • 数据压缩:采用 ZSTD/LZO 等压缩算法,减少存储空间和 I/O 开销
  • Sort Key排序键:决定数据在磁盘上的物理排序顺序,优化范围查询和过滤操作
  • Distribution Key分布键:决定数据在 Compute Node 间的分布方式,影响数据倾斜和跨节点数据传输

Comparison with Other AWS Databases

  • vs Amazon RDS/AuroraRDS/Aurora 面向 OLTP事务处理Redshift 面向 OLAP分析处理RDS/Aurora 适合写入密集型Redshift 适合读取/分析密集型
  • vs Amazon DynamoDBDynamoDB 面向 NoSQL 键值/文档场景Redshift 面向复杂 SQL 分析查询
  • vs Amazon AuroraAurora 共享存储架构6副本跨3 AZRedshift 独立 Compute Node 架构Aurora 适合 10TB 以下场景Redshift 适合 PB 级分析

Aliases

  • Redshift
  • Amazon Redshift
  • AWS Redshift
  • Redshift Data Warehouse