wiki-ingest: 大模型相关术语和框架总结
This commit is contained in:
@@ -110,6 +110,8 @@
|
||||
- [不谈技术:普通人该怎么在AI时代赚钱](sources/普通人如何在AI时代赚钱.md) — AI 时代赚钱三原则:品味是护城河、端到端优于零件、死亡过滤器筛选真正热爱
|
||||
|
||||
## Entities (2026-04-16 Batch 4)
|
||||
- [GPT-3](entities/GPT-3.md) — OpenAI 175B 参数大模型标杆
|
||||
- [GPT-2](entities/GPT-2.md) — OpenAI 1.5B 参数早期语言模型
|
||||
- [LaunchDarkly](entities/LaunchDarkly.md) — Feature Flag 管理平台,86% 客户可在一天内恢复;HP/Dior 将回滚从小时级降至秒级
|
||||
- [HP](entities/HP.md) — 通过 LaunchDarkly 将回滚时间从小时级降至分钟级
|
||||
- [Christian Dior](entities/Christian-Dior.md) — 通过 LaunchDarkly 将 15 分钟回滚降至即时开关
|
||||
@@ -236,6 +238,8 @@
|
||||
- [CodeWeaver](entities/CodeWeaver.md) — 将任意代码库编织为树形 Markdown,简化 AI 上下文注入
|
||||
|
||||
## Concepts (2026-04-16 Batch 4)
|
||||
- [KV Cache](concepts/KV-Cache.md) — 保存历史 K/V 向量避免重复计算的注意力优化技术
|
||||
- [PagedAttention](concepts/PagedAttention.md) — vLLM 分块注意力机制,页表式 KV Cache 管理
|
||||
- [RTO](concepts/RTO.md) — Recovery Time Objective,系统最大可容忍停机时间;Feature Flag 将其从小时级降至秒级
|
||||
- [RPO](concepts/RPO.md) — Recovery Point Objective,可接受的最大数据丢失量(从故障时刻往前回溯)
|
||||
- [Kill Switch](concepts/Kill-Switch.md) — Feature Flag 紧急关闭能力,RTO 保险策略;HP/Dior 案例验证秒级 RTO
|
||||
|
||||
Reference in New Issue
Block a user