37 lines
1.7 KiB
Markdown
37 lines
1.7 KiB
Markdown
---
|
||
title: "Organizational Second Hit Syndrome"
|
||
type: concept
|
||
tags: [sre, reliability, incident-response, organizational-resilience]
|
||
last_updated: 2026-04-20
|
||
---
|
||
|
||
# Organizational Second Hit Syndrome
|
||
|
||
组织二次冲击综合征(Organizational Second Hit Syndrome)是一种类比神经学"二次冲击综合征(Second Impact Syndrome, SIS)"的故障现象。
|
||
|
||
## Definition
|
||
重大故障(first hit)发生后,组织会进入一段脆弱期(vulnerable period)。在此期间,如果发生第二次故障(second hit),往往会引发**强烈、广泛且有时具有破坏性的组织反应**。
|
||
|
||
## Background
|
||
这一概念由 [[Richard-Cook]] 博士首次提出(2026年3月7日),由 [[John-Allspaw]] 和 [[Richard-Cook]] 在 [[Adaptive-Capacity-Labs]] 发表。
|
||
|
||
## Key Characteristics
|
||
- **时间相关性**:Second hit 发生在 first hit 之后的脆弱期内
|
||
- **影响范围**:反应强度大,影响面广,可能造成组织级损害
|
||
- **与神经学 SIS 的类比**:神经学 SIS 中,第一次脑部损伤后如果再次受伤,即使伤势轻微也可能导致灾难性后果;组织 SIS 同理
|
||
|
||
## Implications for SRE
|
||
1. **故障后的恢复期需要特别关注**:首次故障后不要放松警惕
|
||
2. **制定"二次故障"应对预案**:在复盘和恢复阶段保持警戒
|
||
3. **组织层面的韧性建设**:建立跨团队沟通机制,防止信息孤岛导致的二次事故扩大
|
||
4. **MTTR(Mean Time to Recovery)优化**:不仅关注单次故障,还要关注故障间的组织状态
|
||
|
||
## Related Concepts
|
||
- [[Incident-Response]]
|
||
- [[BlamelessPostMortem]]
|
||
- [[Resilience]]
|
||
- [[Self-Healing]]
|
||
|
||
## Source
|
||
- SRE Weekly Issue #513 — [[sre-weekly-issue-513]]
|