Auto-sync: update nexus workspace
This commit is contained in:
24
wiki/concepts/AISummary.md
Normal file
24
wiki/concepts/AISummary.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "AISummary"
|
||||
type: concept
|
||||
tags: [ai, summary, document-processing]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Definition
|
||||
AI Summary 是利用 AI 技术对长文本、PDF 或视频内容进行自动摘要和提炼的服务。
|
||||
|
||||
## Key Characteristics
|
||||
- 支持多种内容格式:文章、PDF、视频
|
||||
- 提供多种摘要模式
|
||||
- 可生成思维导图等可视化输出
|
||||
- 支持多语言摘要输出
|
||||
- 大幅降低信息消化时间
|
||||
|
||||
## Examples from Sources
|
||||
- [[Decopy]] 提供 AI Summary Generator,支持文章、PDF 和视频的摘要生成,具备多摘要模式、思维导图和多语言输出功能
|
||||
|
||||
## Relationships
|
||||
- 属于 [[AI时代发展策略]] 的信息处理层
|
||||
- 为知识管理提供高效的内容处理能力
|
||||
@@ -1,33 +1,34 @@
|
||||
---
|
||||
title: "Adversarial Debate Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Adversarial Debate Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的对抗式辩论模式——一个Agent提出方案,另一个Agent攻击反驳,由第三个Agent(裁判)决定胜负。核心是用外部批评者和评判者模拟人类的"恐惧"动机。
|
||||
|
||||
## 角色
|
||||
- **Generator**:"Here is my plan."(生成方案)
|
||||
- **Critic**:"Here are 3 reasons why that plan sucks."(扮演魔鬼代言人)
|
||||
- **Judge**:"The Critic is right. Fix it."(裁判/主持人)
|
||||
|
||||
## 核心洞察
|
||||
LLM是"Yes-Men",一旦开始写作很少自我纠正——需要一个指定的反对者来打破这种惯性。
|
||||
|
||||
## 关键机制
|
||||
- 三方应使用**不同模型**(不同训练/微调/提示),多样性有益
|
||||
- 顺序执行+循环特性导致速度可能非常慢
|
||||
- Agent可能陷入无限辩论——可使用**Watchdog**(确定性代码)在时间/次数超阈值时打破循环
|
||||
|
||||
## 适用场景
|
||||
- 安全分析(Security Analysis)
|
||||
- 代码审查(Code Review)
|
||||
- 高风险内容审核(High-Stakes Content Moderation)
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
---
|
||||
title: "Adversarial Debate Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Adversarial Debate Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的对抗式辩论模式——一个Agent提出方案,另一个Agent攻击反驳,由第三个Agent(裁判)决定胜负。核心是用外部批评者和评判者模拟人类的"恐惧"动机。
|
||||
|
||||
## 角色
|
||||
- **Generator**:"Here is my plan."(生成方案)
|
||||
- **Critic**:"Here are 3 reasons why that plan sucks."(扮演魔鬼代言人)
|
||||
- **Judge**:"The Critic is right. Fix it."(裁判/主持人)
|
||||
|
||||
## 核心洞察
|
||||
LLM是"Yes-Men",一旦开始写作很少自我纠正——需要一个指定的反对者来打破这种惯性。
|
||||
|
||||
## 关键机制
|
||||
- 三方应使用**不同模型**(不同训练/微调/提示),多样性有益
|
||||
- 顺序执行+循环特性导致速度可能非常慢
|
||||
- Agent可能陷入无限辩论——可使用**Watchdog**(确定性代码)在时间/次数超阈值时打破循环
|
||||
|
||||
## 适用场景
|
||||
- 安全分析(Security Analysis)
|
||||
- 代码审查(Code Review)
|
||||
- 高风险内容审核(High-Stakes Content Moderation)
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
|
||||
25
wiki/concepts/Agent.md
Normal file
25
wiki/concepts/Agent.md
Normal file
@@ -0,0 +1,25 @@
|
||||
---
|
||||
title: "Agent"
|
||||
type: concept
|
||||
tags: [agent, llm, automation, mcp]
|
||||
aliases: [Agent, AI Agent, 智能体, 自主代理]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Agent,智能体,由 [[Large Language Model]] + [[Model Context Protocol|MCP]] + [[Prompt]] 组成,实现自动化执行。LLM 给出步骤方法和工具调用指令,MCP 负责实际执行。
|
||||
|
||||
## Key Facts
|
||||
- LLM 本身只给出"步骤方法",不会真正执行(如大模型告诉你如何发邮件,但不会自己发)
|
||||
- Agent 将 LLM 与 MCP 工具整合,实现真正的自动化
|
||||
- Agent 工作流:输入 Prompt(含工具描述)→ LLM 返回工具名和参数 → MCP Server 执行 → 返回结果
|
||||
- 是 [[LangChain]] 等开发框架的核心应用场景
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 核心组件 ← [[Agent]]
|
||||
- [[Model Context Protocol]] ← 执行层 ← [[Agent]]
|
||||
- [[Prompt]] ← 输入 ← [[Agent]]
|
||||
- [[LangChain]] ← 用于构建 ← [[Agent]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -2,7 +2,9 @@
|
||||
title: "Agentic AI"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: [designing-for-agentic-ai]
|
||||
sources:
|
||||
- designing-for-agentic-ai
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-27
|
||||
---
|
||||
|
||||
|
||||
@@ -1,37 +1,38 @@
|
||||
---
|
||||
title: "Consensus Voting Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Consensus Voting Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的共识投票模式——将同一任务分配给N个LLM,选取出现次数最多的答案作为最终结果。
|
||||
|
||||
## 核心公式
|
||||
若单个模型幻觉概率为 P,则N个模型同时幻觉相同谎言的概率为 P^N。
|
||||
- 示例:P=0.2(20%幻觉率),N=3 → 0.2³ = 0.008(0.8%)
|
||||
|
||||
## 核心机制
|
||||
1. **Spawn N LLMs**:N需要通过试验找到成本与可靠性的平衡点
|
||||
2. **Fan out work**:给所有Agent完全相同的任务
|
||||
3. **Fan in results**:选取最常见的答案
|
||||
|
||||
## 关键要求
|
||||
- Agent之间**无反馈回路**,否则群体思维(Groupthink)和从众效应会扭曲结果
|
||||
- 理想情况下各Agent使用不同模型,降低思维同质化风险
|
||||
- 实验应像盲测一样进行
|
||||
|
||||
## 适用场景
|
||||
- 事实核查(Fact-checking)
|
||||
- 分类任务(如"这是垃圾邮件吗?")
|
||||
|
||||
## 缺点
|
||||
成本高——本质上是将同一任务分配给多个Agent,ROI需根据任务和失败成本计算。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
- [[Composite SLO]](概率公式类比)
|
||||
---
|
||||
title: "Consensus Voting Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Consensus Voting Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的共识投票模式——将同一任务分配给N个LLM,选取出现次数最多的答案作为最终结果。
|
||||
|
||||
## 核心公式
|
||||
若单个模型幻觉概率为 P,则N个模型同时幻觉相同谎言的概率为 P^N。
|
||||
- 示例:P=0.2(20%幻觉率),N=3 → 0.2³ = 0.008(0.8%)
|
||||
|
||||
## 核心机制
|
||||
1. **Spawn N LLMs**:N需要通过试验找到成本与可靠性的平衡点
|
||||
2. **Fan out work**:给所有Agent完全相同的任务
|
||||
3. **Fan in results**:选取最常见的答案
|
||||
|
||||
## 关键要求
|
||||
- Agent之间**无反馈回路**,否则群体思维(Groupthink)和从众效应会扭曲结果
|
||||
- 理想情况下各Agent使用不同模型,降低思维同质化风险
|
||||
- 实验应像盲测一样进行
|
||||
|
||||
## 适用场景
|
||||
- 事实核查(Fact-checking)
|
||||
- 分类任务(如"这是垃圾邮件吗?")
|
||||
|
||||
## 缺点
|
||||
成本高——本质上是将同一任务分配给多个Agent,ROI需根据任务和失败成本计算。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
- [[Composite SLO]](概率公式类比)
|
||||
|
||||
23
wiki/concepts/Continuous-Batching.md
Normal file
23
wiki/concepts/Continuous-Batching.md
Normal file
@@ -0,0 +1,23 @@
|
||||
---
|
||||
title: "Continuous Batching"
|
||||
type: concept
|
||||
tags: [continuous-batching, vllm, inference, gpu]
|
||||
aliases: [Continuous Batching, 连续批处理, Iteration-Level Scheduling]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Continuous Batching,连续批处理,vLLM 的推理优化技术。与传统的攒满一批再处理不同,Continuous Batching 在每个解码步骤(按 Token 迭代)都动态组装活跃请求批次,GPU 基本满负载运转。
|
||||
|
||||
## Key Facts
|
||||
- 传统批处理:攒满一批再跑,短任务被长任务阻塞(头阻塞问题)
|
||||
- Continuous Batching:每步解码都组装新批次,无需等待整批结束即可插入新请求
|
||||
- 基于 [[PagedAttention]] 的块式内存 + 步进级调度器实现
|
||||
- 提高 GPU 并发与公平性,充分利用 GPU 算力
|
||||
|
||||
## Connections
|
||||
- [[vLLM]] ← 使用 ← [[Continuous Batching]]
|
||||
- [[PagedAttention]] ← 协同 ← [[Continuous Batching]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
22
wiki/concepts/Data-Distillation.md
Normal file
22
wiki/concepts/Data-Distillation.md
Normal file
@@ -0,0 +1,22 @@
|
||||
---
|
||||
title: "Data Distillation"
|
||||
type: concept
|
||||
tags: [distillation, model-compression, training, llm]
|
||||
aliases: [Data Distillation, 数据蒸馏, Knowledge Distillation]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Data Distillation,数据蒸馏,利用高性能的大模型生成精简但有价值的数据,使一个小模型可以从中学习并逼近大模型的效果。
|
||||
|
||||
## Key Facts
|
||||
- 核心思想:用大模型作为"教师"(Teacher),生成高质量训练数据
|
||||
- 小模型(Student)从这些数据中学习
|
||||
- 目标:以更低成本达到接近大模型的效果
|
||||
- 是模型压缩和高效部署的重要技术手段
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 教师模型 ← [[Data Distillation]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
24
wiki/concepts/Embedding.md
Normal file
24
wiki/concepts/Embedding.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "Embedding"
|
||||
type: concept
|
||||
tags: [embedding, vector, nlp, similarity]
|
||||
aliases: [Embedding, 向量化, Text Embedding, 词向量]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Embedding,向量化,将词或文本转换为浮点数向量的技术。通过计算向量之间的距离(欧氏距离、余弦相似度等)判断语义关联性。
|
||||
|
||||
## Key Facts
|
||||
- 词的意义取决于上下文语境(如"苹果"可指水果或手机)
|
||||
- Embedding 将词转化为高维浮点向量
|
||||
- 语义相近的词在向量空间中距离更近
|
||||
- 示例:一百和两百的距离近,而一百离一千远,说明一百比一千更接近两百的语义
|
||||
- 是 [[RAG]] 检索的基础技术
|
||||
|
||||
## Connections
|
||||
- [[RAG]] ← 依赖 ← [[Embedding]]
|
||||
- [[Vector-Embedding]] ← 同义词 ← [[Embedding]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -1,33 +1,54 @@
|
||||
---
|
||||
title: "Generation"
|
||||
type: concept
|
||||
tags: [rag, generation, llm, prompt, reasoning]
|
||||
tags: [RAG, LLM, 问答生成]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
Generation(生成阶段)是 RAG Pipeline 的第三步,将用户问题与 Retrieval 阶段检索到的相关文档块组合为 Prompt,输入 LLM 生成最终答案。
|
||||
|
||||
## Process
|
||||
1. **Context Assembly**:将用户问题(Question)与 Top-k 个相关文档块(Context)放入字典结构:`{"question": ..., "context": ...}`
|
||||
2. **Prompt Templating**:通过 PromptTemplate 将 Question 和 Context 组合为结构化的 Prompt String
|
||||
3. **LLM Inference**:将 Prompt 输入 LLM,LLM 严格基于上下文中提供的信息生成答案
|
||||
4. **Output Parsing**:从 LLM 输出中提取纯字符串结果
|
||||
Generation(生成阶段)是 RAG 管道的第三阶段,将用户问题与检索到的相关文档块组合成 Prompt,输入 LLM 生成带事实依据的答案。
|
||||
|
||||
## Key Requirements for Generation
|
||||
- **Source Grounding**:LLM 必须严格基于检索到的上下文生成,不能凭空发挥
|
||||
- **Answer Attribution**:理想情况下应提供答案的来源引用(哪些文档块支持该答案)
|
||||
## Core Process
|
||||
|
||||
## In RAG Pipeline
|
||||
- **上游**:接收 Retrieval 阶段返回的文档块作为上下文
|
||||
- **下游**:输出最终答案给用户
|
||||
```
|
||||
问题 + Top-k 文档块 → PromptTemplate 组装 → LLM 生成 → 返回答案
|
||||
```
|
||||
|
||||
## Frameworks Simplify This
|
||||
LangChain 和 LlamaIndex 将 Retrieval + Generation 封装为 RAG Chain(如 RetrievalQA Chain),只需几行代码即可完成端到端 Pipeline。
|
||||
1. **组装上下文**:将问题(Question)和检索到的文档块(Context)放入预定义的字典结构
|
||||
2. **Prompt 模板**:通过 PromptTemplate 将问题+上下文组合成完整的 Prompt String
|
||||
3. **LLM 生成**:将 Prompt 输入 LLM,LLM 基于检索到的知识生成回答
|
||||
4. **可选链式组合**:使用 LangChain/LlamaIndex 的 Chain 将 Retrieval 和 Generation 串联为统一管道
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — Generation 是 RAG Pipeline 的第三阶段
|
||||
- [[Retrieval]] — Generation 的上游,提供上下文
|
||||
- [[PromptTemplate]] — 组装 Question + Context 的模板技术
|
||||
- [[Chain]] — LangChain 中串联 Retrieval 和 Generation 的抽象
|
||||
- [[Large Language Model]] — 实际执行生成任务的模型
|
||||
## Key Prompt Pattern
|
||||
|
||||
```
|
||||
你是一个问答助手。请根据以下参考资料回答用户问题。
|
||||
如果参考资料中没有相关信息,请如实说明。
|
||||
|
||||
参考资料:
|
||||
{context}
|
||||
|
||||
用户问题:{question}
|
||||
|
||||
回答:
|
||||
```
|
||||
|
||||
## LangChain Chain
|
||||
|
||||
LangChain 和 LlamaIndex 提供了 `RetrievalQA Chain` 等开箱即用的链,可将检索和生成过程自动化串联,避免手动拼装 Prompt。
|
||||
|
||||
## Connections
|
||||
|
||||
- [[Generation]] ← part_of ← [[RAG]]
|
||||
- [[Generation]] ← receives_input ← [[Retrieval]]
|
||||
- [[Generation]] ← uses ← [[Large-Language-Model]]
|
||||
- [[Generation]] ← uses ← [[Prompt]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- Answer Generation
|
||||
- RAG Generation
|
||||
- LLM Response Generation
|
||||
- 答案生成
|
||||
|
||||
@@ -1,23 +1,24 @@
|
||||
---
|
||||
title: "Genetic Algorithm"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Genetic Algorithm
|
||||
|
||||
## 定义
|
||||
遗传算法——传统机器学习中基于自然选择和遗传机制的优化算法,是[[Tree-of-Thoughts]]和[[Knock-out-Pattern]]的ML理论根源。
|
||||
|
||||
## 核心要素
|
||||
1. **遗传表示**(Genetic Representation):解决方案域的编码(模型+上下文)
|
||||
2. **适应度函数**(Fitness Function):评估解决方案质量的函数(淘汰赛裁判)
|
||||
|
||||
## 在多智能体系统中的应用
|
||||
- [[Knock-out-Pattern]]是遗传算法的精简实现——将适应度函数替换为验证器(Validator)
|
||||
- [[Tree-of-Thoughts]]通过验证器持续筛选Agent分支,可结合赢家的特征重组生成新Agent
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
---
|
||||
title: "Genetic Algorithm"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Genetic Algorithm
|
||||
|
||||
## 定义
|
||||
遗传算法——传统机器学习中基于自然选择和遗传机制的优化算法,是[[Tree-of-Thoughts]]和[[Knock-out-Pattern]]的ML理论根源。
|
||||
|
||||
## 核心要素
|
||||
1. **遗传表示**(Genetic Representation):解决方案域的编码(模型+上下文)
|
||||
2. **适应度函数**(Fitness Function):评估解决方案质量的函数(淘汰赛裁判)
|
||||
|
||||
## 在多智能体系统中的应用
|
||||
- [[Knock-out-Pattern]]是遗传算法的精简实现——将适应度函数替换为验证器(Validator)
|
||||
- [[Tree-of-Thoughts]]通过验证器持续筛选Agent分支,可结合赢家的特征重组生成新Agent
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
|
||||
23
wiki/concepts/Hallucination.md
Normal file
23
wiki/concepts/Hallucination.md
Normal file
@@ -0,0 +1,23 @@
|
||||
---
|
||||
title: "Hallucination"
|
||||
type: concept
|
||||
tags: [hallucination, llm, problem, reliability]
|
||||
aliases: [Hallucination, 幻觉, 大模型幻觉, LLM 幻觉]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Hallucination,幻觉,大语言模型在面对陌生领域或缺乏足够知识的问题时,"一本正经地胡说八道",给出看似合理但实际错误答案的现象。
|
||||
|
||||
## Key Facts
|
||||
- 本质原因:LLM 的知识局限于训练数据集,面对未知领域时无法真实"理解",只能基于概率生成最可能的下一个词
|
||||
- 类比:LLM 在陌生领域"只会写一个解字",然后放飞自我
|
||||
- [[RAG]] 是解决幻觉的主要技术手段之一(通过外部知识引导)
|
||||
- 其他方法:模型微调、Prompt Engineering、Chain-of-Thought
|
||||
|
||||
## Connections
|
||||
- [[RAG]] ← 解决 ← [[Hallucination]]
|
||||
- [[Large Language Model]] ← 问题 ← [[Hallucination]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -1,34 +1,35 @@
|
||||
---
|
||||
title: "Hierarchy Agent Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Hierarchy Agent Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的等级制度模式——由一个主管模型(Supervisor/Planner)制定计划、分解任务、分配工作给专业工作代理(Worker),再由验证代理(Validator)检验结果的质量。
|
||||
|
||||
## 核心机制
|
||||
- **Planner**:智能模型(如 Opus)将用户目标分解为原子化小步骤
|
||||
- **Worker**:专门化智能体(通常用更小更快的模型),专注于单一任务
|
||||
- **Validator**:检查点——工作不合格则退回;可用确定性代码(单元测试/JSON schema)或LLM本身
|
||||
|
||||
## 为什么有效
|
||||
依赖图强制协作——Worker必须等Planner分配任务才能开始,且无法作弊(会被Validator发现)。
|
||||
|
||||
## 适用场景
|
||||
需要将上下文分开的复杂工作流(如不让"撰稿人"看到"研究员"的原始日志)。
|
||||
|
||||
## 优点
|
||||
- 任务分解清晰,可独立验证每个步骤
|
||||
- 支持上下文隔离
|
||||
|
||||
## 缺点
|
||||
- 顺序执行(Planner→Worker→Validator),速度慢、成本高
|
||||
- Validator建议使用与Planner/Worker不同的模型以提高客观性
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
---
|
||||
title: "Hierarchy Agent Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Hierarchy Agent Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的等级制度模式——由一个主管模型(Supervisor/Planner)制定计划、分解任务、分配工作给专业工作代理(Worker),再由验证代理(Validator)检验结果的质量。
|
||||
|
||||
## 核心机制
|
||||
- **Planner**:智能模型(如 Opus)将用户目标分解为原子化小步骤
|
||||
- **Worker**:专门化智能体(通常用更小更快的模型),专注于单一任务
|
||||
- **Validator**:检查点——工作不合格则退回;可用确定性代码(单元测试/JSON schema)或LLM本身
|
||||
|
||||
## 为什么有效
|
||||
依赖图强制协作——Worker必须等Planner分配任务才能开始,且无法作弊(会被Validator发现)。
|
||||
|
||||
## 适用场景
|
||||
需要将上下文分开的复杂工作流(如不让"撰稿人"看到"研究员"的原始日志)。
|
||||
|
||||
## 优点
|
||||
- 任务分解清晰,可独立验证每个步骤
|
||||
- 支持上下文隔离
|
||||
|
||||
## 缺点
|
||||
- 顺序执行(Planner→Worker→Validator),速度慢、成本高
|
||||
- Validator建议使用与Planner/Worker不同的模型以提高客观性
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
|
||||
24
wiki/concepts/ImageToVideo.md
Normal file
24
wiki/concepts/ImageToVideo.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "ImageToVideo"
|
||||
type: concept
|
||||
tags: [ai, video, image-to-video]
|
||||
sources: [我的工具集, 14个免费的ai图生视频工具]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Definition
|
||||
Image-to-Video 是将静态图片转化为动态视频的 AI 技术,让图片中的元素产生运动效果。
|
||||
|
||||
## Key Characteristics
|
||||
- 将静态图像作为输入,生成包含运动元素的视频
|
||||
- 广泛应用于电商视频制作、内容创作、广告营销等场景
|
||||
- 降低视频创作门槛,无需专业设备和拍摄技能
|
||||
|
||||
## Examples from Sources
|
||||
- [[Wavespeed AI]] 提供 Image-to-Video 功能(付费)
|
||||
- [[Vidu]] 提供 Image-to-Video 功能(月费 ¥8)
|
||||
- [[Hailuo AI]] 提供 Image-to-Video 功能(月费 ¥42)
|
||||
|
||||
## Relationships
|
||||
- 属于 [[AI时代发展策略]] 的创意工具层
|
||||
- 与 [[TextToVideo]] 互补:ImageToVideo 从图像生成,TextToVideo 从文本生成
|
||||
@@ -1,29 +1,47 @@
|
||||
---
|
||||
title: "Indexing"
|
||||
type: concept
|
||||
tags: [rag, indexing, document-processing, embedding]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
Indexing(索引阶段)是 RAG Pipeline 的第一步,负责将外部文档转化为可检索的向量表示:文档加载 → 文本切分 → 向量化 → 存入向量数据库。
|
||||
|
||||
## Process
|
||||
1. **Document Loading**:从多种来源(网页/PDF/数据库/API 等)加载原始文档
|
||||
2. **Text Splitting**:将长文档切分为满足 Embedding Model Context Window 的文本片段(Split)
|
||||
3. **Embedding**:使用 Embedding Model 将每个 Split 转化为固定长度的语义向量
|
||||
4. **Storage**:将向量 + 原始文本块存入 Vector Store(向量数据库)
|
||||
|
||||
## Why Splitting is Necessary
|
||||
Embedding Model 的 Context Window 有限(通常 512~8192 token),无法直接处理整篇长文档,因此必须切分。切分策略直接影响检索质量——过小则语义不完整,过大则引入噪声。
|
||||
|
||||
## In RAG Pipeline
|
||||
- **前置阶段**:Indexing 的输出(向量数据库)是 Retrieval 阶段的输入
|
||||
- **工具支撑**:LangChain 的 DocumentLoader、TextSplitter、Embedding、VectorStore 组件封装了全流程
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — Indexing 是 RAG Pipeline 的第一阶段
|
||||
- [[Split]] — 切分后的文档片段
|
||||
- [[Embedding]] — 向量化的技术
|
||||
- [[Vector Store]] — 存储向量的数据库
|
||||
- [[Retrieval]] — Indexing 的下一阶段
|
||||
---
|
||||
title: "Indexing"
|
||||
type: concept
|
||||
tags: [RAG, 向量数据库, 文档处理]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
|
||||
Indexing(索引阶段)是 RAG(检索增强生成)管道的第一阶段,负责将外部文档转换为可检索的向量表示并存入向量数据库。
|
||||
|
||||
## Core Process
|
||||
|
||||
```
|
||||
原始文档 → 文档加载器 → 文本切分(Split) → Embedding向量化 → 存入Vector Store
|
||||
```
|
||||
|
||||
1. **文档加载(Loading)**:通过 LangChain 等框架的 Document Loader 从多种来源(网页/本地文件/数据库等)加载原始文档
|
||||
2. **文本切分(Splitting)**:将长文档切分成适合 Embedding Model Context Window 的小块(Split),通常 512~4096 token
|
||||
3. **向量化(Embedding)**:使用 Embedding Model(如 BAAI/bge 系列)将文本块转换为固定长度的向量表示
|
||||
4. **存入向量数据库**:将 Embedding Vector 存入 Vector Store(如 Qdrant、Chroma、Milvus 等)
|
||||
|
||||
## Key Parameters
|
||||
|
||||
- **Chunk Size**:每个 Split 的 token 数量,需平衡上下文完整性和模型限制
|
||||
- **Chunk Overlap**:相邻 Split 之间的重叠 token 数,防止信息在切分边界丢失
|
||||
- **Embedding Model**:决定向量质量和检索效果的模型(如 BAAI、OpenAI text-embedding-3、BGE 等)
|
||||
|
||||
## Tools
|
||||
|
||||
- **LangChain**:提供 160+ 文档加载器和向量存储集成
|
||||
- **LlamaIndex**:专注数据连接和索引的 LLM 应用框架
|
||||
- **Qdrant**:Rust 编写的开源向量数据库,支持过滤和混合检索
|
||||
|
||||
## Connections
|
||||
|
||||
- [[Indexing]] ← part_of ← [[RAG]]
|
||||
- [[Indexing]] ← uses ← [[Embedding]]
|
||||
- [[Indexing]] ← produces ← [[Vector-Store]]
|
||||
- [[Indexing]] ← depends_on ← [[Context-Window]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- Document Indexing
|
||||
- Chunking
|
||||
- 文档索引
|
||||
|
||||
23
wiki/concepts/KV-Cache.md
Normal file
23
wiki/concepts/KV-Cache.md
Normal file
@@ -0,0 +1,23 @@
|
||||
---
|
||||
title: "KV Cache"
|
||||
type: concept
|
||||
tags: [kv-cache, inference, llm, optimization]
|
||||
aliases: [KV Cache, Key-Value Cache, KV缓存]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
KV Cache,大语言模型推理过程中的缓存机制。K(Key)和 V(Value)是由每个 Token 的向量通过线性变换得到的两类向量,用于注意力计算。KV Cache 将这些历史 K/V 保存下来,避免后续解码步骤重复计算。
|
||||
|
||||
## Key Facts
|
||||
- 节省计算:无需每次都重新计算历史 Token 的注意力
|
||||
- 显存开销:KV Cache 随上下文长度、层数、头数、维度线性增长,是推理中最大的显存开销来源之一
|
||||
- [[vLLM]] 的核心优化对象
|
||||
- [[PagedAttention]] 通过分块管理解决其碎片化问题
|
||||
|
||||
## Connections
|
||||
- [[vLLM]] ← 优化 ← [[KV Cache]]
|
||||
- [[PagedAttention]] ← 解决 ← [[KV Cache]] 的碎片化问题
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -1,36 +1,37 @@
|
||||
---
|
||||
---
|
||||
title: "Knock-out Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Knock-out Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的淘汰制模式——将任务分配给N个Agent,用验证器决定哪些表现最差的被淘汰。核心是用"适者生存"替代LLM不存在的"死亡恐惧"。
|
||||
|
||||
## 核心机制
|
||||
1. 将任务分配给N个Agent
|
||||
2. 用Validator决定要淘汰哪些Agent
|
||||
3. (可选)用通过验证的Agent特征组合创建新Agent填补空缺
|
||||
|
||||
## ML渊源
|
||||
这是传统机器学习中[[Genetic-Algorithm]](遗传算法)的精简实现,依赖两个要素:
|
||||
- **遗传表示**:解决方案域(模型+上下文)
|
||||
- **适应度函数**:淘汰决策依据
|
||||
|
||||
## 关键要求
|
||||
需要**快速验证输出的方式**(如单元测试)——如果需要人工检查所有分支,成本太高。Eval是必要基础设施。
|
||||
|
||||
## 适用场景
|
||||
迭代式智能体工程——主要用于开发/调试阶段,不适合生产环境的高用户负载。
|
||||
|
||||
## 与Tree of Thoughts的关系
|
||||
Tree of Thoughts是Knock-out模式的进阶实现,通过验证器持续筛选。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
- [[Genetic-Algorithm]]
|
||||
---
|
||||
---
|
||||
title: "Knock-out Pattern"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Knock-out Pattern
|
||||
|
||||
## 定义
|
||||
多智能体系统的淘汰制模式——将任务分配给N个Agent,用验证器决定哪些表现最差的被淘汰。核心是用"适者生存"替代LLM不存在的"死亡恐惧"。
|
||||
|
||||
## 核心机制
|
||||
1. 将任务分配给N个Agent
|
||||
2. 用Validator决定要淘汰哪些Agent
|
||||
3. (可选)用通过验证的Agent特征组合创建新Agent填补空缺
|
||||
|
||||
## ML渊源
|
||||
这是传统机器学习中[[Genetic-Algorithm]](遗传算法)的精简实现,依赖两个要素:
|
||||
- **遗传表示**:解决方案域(模型+上下文)
|
||||
- **适应度函数**:淘汰决策依据
|
||||
|
||||
## 关键要求
|
||||
需要**快速验证输出的方式**(如单元测试)——如果需要人工检查所有分支,成本太高。Eval是必要基础设施。
|
||||
|
||||
## 适用场景
|
||||
迭代式智能体工程——主要用于开发/调试阶段,不适合生产环境的高用户负载。
|
||||
|
||||
## 与Tree of Thoughts的关系
|
||||
Tree of Thoughts是Knock-out模式的进阶实现,通过验证器持续筛选。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
- [[Genetic-Algorithm]]
|
||||
|
||||
@@ -1,28 +1,27 @@
|
||||
---
|
||||
title: "Large Language Model"
|
||||
type: concept
|
||||
tags: [llm, ai, nlp]
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
## Definition
|
||||
大语言模型(Large Language Model,LLM)是基于大规模预训练的深度学习模型,能够理解和生成人类语言,在推理与生成方面表现出色。
|
||||
|
||||
## Core Characteristics
|
||||
- **知识截止日期**:LLM 的知识基于训练数据,存在固定的时间节点,无法自动获取最新信息
|
||||
- **推理能力强**:能够进行复杂推理、代码生成、文本创作等任务
|
||||
- **幻觉问题**:可能生成看似合理但实际错误的内容(幻觉)
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **思考层**:LLM 作为 AI 系统的"天才大脑",负责逻辑推理和内容生成
|
||||
- 与 [[RAG]] 配合获取实时信息
|
||||
- 与 [[AI Agent]] 配合实现自主行动
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — 补充实时知识,降低幻觉
|
||||
- [[AI Agent]] — 提供行动能力
|
||||
- [[ReAct Pattern]] — 推理-行动协同模式
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
---
|
||||
title: "Large Language Model"
|
||||
type: concept
|
||||
tags: [llm, nlp, deep-learning]
|
||||
aliases: [LLM, 大语言模型, Large Language Model]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Large Language Model,大语言模型。行业通常以参数规模和训练数据/算力来衡量是否称为"大模型",语言模型常在 ≥1B 参数开始被称为"大模型"。
|
||||
|
||||
## Key Facts
|
||||
- 1B = Billion = 10亿参数
|
||||
- 常见大模型示例:GPT-2(1.5B)、GPT-3(175B)、GPT-4(参数量未公开)
|
||||
- 参数规模是衡量模型能力的重要指标之一
|
||||
|
||||
## Connections
|
||||
- [[Agent]] ← 构建于 ← [[Large Language Model]]
|
||||
- [[Prompt]] ← 输入给 ← [[Large Language Model]]
|
||||
- [[Model Context Protocol]] ← 连接 ← [[Large Language Model]]
|
||||
- [[RAG]] ← 增强 ← [[Large Language Model]]
|
||||
- [[vLLM]] ← 加速推理 ← [[Large Language Model]]
|
||||
- [[Hallucination]] ← 问题 ← [[Large Language Model]]
|
||||
- [[Data Distillation]] ← 蒸馏对象 ← [[Large Language Model]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
|
||||
@@ -1,52 +1,24 @@
|
||||
---
|
||||
title: "Model Context Protocol"
|
||||
type: concept
|
||||
tags: [llm, mcp, protocol, tool-calling]
|
||||
sources: [大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Model Context Protocol (MCP)
|
||||
|
||||
## Aliases
|
||||
- MCP
|
||||
- Model Context Protocol
|
||||
- 模型上下文协议
|
||||
|
||||
## Definition
|
||||
|
||||
Model Context Protocol(MCP,模型上下文协议)是一个开放协议,旨在为 LLM 应用提供**标准化接口**,使其能够连接外部数据源和各种工具进行交互。
|
||||
|
||||
MCP 充当 LLM 与外部世界之间的**标准化通信层**:当 LLM 处理用户请求时需要访问外部信息或功能,MCP Client 向 MCP Server 发送请求;MCP Server 负责与相应的外部数据源或工具交互,获取数据并按 MCP 协议规范格式化后返回给 LLM。
|
||||
|
||||
## Key Insight
|
||||
|
||||
> "大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。"
|
||||
|
||||
MCP 解决的核心问题:**LLM 只能返回"需要调用什么工具和参数"的描述,不能自己执行**。MCP 提供了 LLM 与工具之间的标准桥梁。
|
||||
|
||||
## Architecture
|
||||
|
||||
```
|
||||
User Request
|
||||
↓
|
||||
LLM(分析请求,决定需要哪些工具)
|
||||
↓
|
||||
MCP Client(发送标准化请求)
|
||||
↓
|
||||
MCP Server(与外部数据源/工具交互)
|
||||
↓
|
||||
格式化结果
|
||||
↓
|
||||
LLM(整合结果,生成最终响应)
|
||||
```
|
||||
|
||||
## Related Concepts
|
||||
|
||||
- [[AI Agent]]:LLM + MCP + 工具执行 = 真正自主的 Agent
|
||||
- [[Prompt]]:MCP Server 的返回结果作为上下文注入 LLM 的 Prompt
|
||||
- [[Large Language Model]]:MCP 扩展了纯 LLM 的能力边界
|
||||
|
||||
## Sources
|
||||
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
---
|
||||
title: "Model Context Protocol"
|
||||
type: concept
|
||||
tags: [mcp, protocol, llm, tool]
|
||||
aliases: [MCP, Model Context Protocol, 模型上下文协议]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Model Context Protocol(MCP),模型上下文协议,是一个开放协议,为 LLM 应用提供标准化接口,使其能够连接外部数据源和各种工具进行交互。
|
||||
|
||||
## Key Facts
|
||||
- MCP Client 向 MCP Server 发送请求
|
||||
- MCP Server 负责与外部数据源或工具交互,获取数据并按 MCP 协议规范格式化后返回
|
||||
- **核心约束**:大模型本身不会自己调用外部数据源或工具,只会告诉用户需要调用哪些工具,实际调用需要开发者自己实现
|
||||
- MCP 是连接 LLM 与真实世界的桥梁
|
||||
|
||||
## Connections
|
||||
- [[Agent]] ← 构建于 ← [[Model Context Protocol]]
|
||||
- [[Large Language Model]] ← 通过 ← [[Model Context Protocol]] → 连接外部工具
|
||||
- [[Model Context Protocol]] ← 标准化 ← 工具调用
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
|
||||
24
wiki/concepts/PagedAttention.md
Normal file
24
wiki/concepts/PagedAttention.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "PagedAttention"
|
||||
type: concept
|
||||
tags: [paged-attention, vllm, inference, optimization]
|
||||
aliases: [PagedAttention, 分页注意力]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
PagedAttention,vLLM 的核心注意力机制创新,将 [[KV Cache]] 切分为固定大小的块(block),并用页表式映射管理,类似操作系统的虚拟内存调度方式。
|
||||
|
||||
## Key Facts
|
||||
- 传统方式:为每条序列分配一大块连续内存,导致碎片化和 OOM(显存不足)
|
||||
- PagedAttention 解决方案:将 KV Cache 切分为固定大小块,用页表管理,灵活调度
|
||||
- 优势:避免碎片化、支持动态并发、支持 KV 块复用(多分支/重复前缀场景)
|
||||
- 显著减少预填充(Prefill)时间
|
||||
|
||||
## Connections
|
||||
- [[vLLM]] ← 使用 ← [[PagedAttention]]
|
||||
- [[KV Cache]] ← 优化管理 ← [[PagedAttention]]
|
||||
- [[Continuous Batching]] ← 协同 ← [[PagedAttention]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
24
wiki/concepts/Prompt.md
Normal file
24
wiki/concepts/Prompt.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "Prompt"
|
||||
type: concept
|
||||
tags: [prompt, llm, interaction]
|
||||
aliases: [Prompt, 提示词, Prompt Engineering]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Prompt,提示词,用户输入给大模型的语句。是与大模型交互的唯一入口。
|
||||
|
||||
## Key Facts
|
||||
- Prompt 是用户与大模型之间的通信媒介
|
||||
- Prompt 的质量直接影响大模型的输出质量
|
||||
- Prompt Engineering(提示词工程)研究如何写出更有效的提示词
|
||||
- Zero-shot、Few-shot、Chain-of-Thought 等是常见的 Prompt 策略
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 接收 ← [[Prompt]]
|
||||
- [[Agent]] ← 使用 ← [[Prompt]]
|
||||
- [[Large Language Model]] ← 指导 ← [[Prompt]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -1,35 +1,26 @@
|
||||
---
|
||||
title: "RAG"
|
||||
type: concept
|
||||
tags: [rag, retrieval, llm, ai]
|
||||
last_updated: 2026-04-27
|
||||
tags: [rag, retrieval, llm, knowledge]
|
||||
aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
检索增强生成(Retrieval-Augmented Generation,RAG)是将大语言模型(LLM)链接到外部实时知识库的技术,通过检索+生成的流程提升答案准确性和时效性。
|
||||
Retrieval-Augmented Generation(RAG),检索增强生成,通过从外部知识库检索相关信息来增强大语言模型的回答质量,解决模型在陌生领域的幻觉(Hallucination)问题。
|
||||
|
||||
## Core Mechanism
|
||||
1. **检索(Retrieval)**:当用户提问时,从外部知识库(向量数据库/知识图谱/公司文档)中检索最相关的信息块(Chunk)
|
||||
2. **增强生成(Augmented Generation)**:将检索结果与用户问题作为上下文输入 LLM,指示其严格基于上下文生成答案
|
||||
## Key Facts
|
||||
- 大模型在陌生领域容易产生幻觉,"一本正经胡说八道"
|
||||
- RAG 通过给模型"一些提示",引导其在正确方向上回答
|
||||
- 效果案例:正确率从 60% 提升至 90%
|
||||
- RAG 依赖 [[Embedding]] 技术实现语义检索
|
||||
- 典型 RAG 流程:用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答
|
||||
|
||||
## Key Benefits
|
||||
- **知识更新与定制**:无需重新训练即可获取最新信息
|
||||
- **消除幻觉**:提供事实依据,显著降低胡说八道的风险
|
||||
- **引用来源**:可追溯信息来源,增加可信度
|
||||
- **成本效益**:相比微调,成本更低、更新更快
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **认知层**:RAG 作为 AI 系统的"记忆系统",负责信息获取与准确性保障
|
||||
- 为 [[AI Agent]] 提供可信赖的信息来源
|
||||
## Connections
|
||||
- [[Embedding]] ← 依赖 ← [[RAG]]
|
||||
- [[Hallucination]] ← 解决 ← [[RAG]]
|
||||
- [[Large Language Model]] ← 增强 ← [[RAG]]
|
||||
- [[LangChain]] ← 支持 ← [[RAG]]
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
- [[rag从入门到精通系列1-基础rag]]
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
- [[knowledge-base-rag]]
|
||||
|
||||
## Related Concepts
|
||||
- [[Large Language Model]] — 被增强的底层模型
|
||||
- [[AI Agent]] — 依赖 RAG 提供准确信息
|
||||
- [[Hybrid Search]] — RAG 常用检索策略
|
||||
- [[Semantic Search]] — 向量检索的核心技术
|
||||
|
||||
@@ -1,31 +1,32 @@
|
||||
---
|
||||
title: "Reliability Engineering"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Reliability Engineering
|
||||
|
||||
## 定义
|
||||
可靠性工程——将LLM视为分布式系统中不可靠组件的工程哲学,而非"有感知"的智能体。
|
||||
|
||||
## 核心原则
|
||||
停止要求模型"小心",开始**强制**其正确:
|
||||
|
||||
1. **Constrained(约束)**:通过架构约束(如依赖图强制执行)而非提示词约束
|
||||
2. **Verified(验证)**:每个步骤有检查点,不合格则退回
|
||||
3. **Pruned(修剪)**:淘汰表现最差的Agent
|
||||
4. **Challenged(挑战)**:通过对抗辩论让错误暴露
|
||||
|
||||
## 核心转变
|
||||
从"AI原型"(Prototype AI)到"企业级AI"(Enterprise AI)的范式转变:
|
||||
- ❌ 将LLM视为神奇的聊天机器人
|
||||
- ✅ 将LLM视为不可靠的分布式组件
|
||||
|
||||
## 关键人物
|
||||
- [[Alex Ewerlöf]]:可靠性工程专家,KTH系统工程硕士,27年经验,专注将人类系统协作模式迁移至AI架构
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
---
|
||||
title: "Reliability Engineering"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Reliability Engineering
|
||||
|
||||
## 定义
|
||||
可靠性工程——将LLM视为分布式系统中不可靠组件的工程哲学,而非"有感知"的智能体。
|
||||
|
||||
## 核心原则
|
||||
停止要求模型"小心",开始**强制**其正确:
|
||||
|
||||
1. **Constrained(约束)**:通过架构约束(如依赖图强制执行)而非提示词约束
|
||||
2. **Verified(验证)**:每个步骤有检查点,不合格则退回
|
||||
3. **Pruned(修剪)**:淘汰表现最差的Agent
|
||||
4. **Challenged(挑战)**:通过对抗辩论让错误暴露
|
||||
|
||||
## 核心转变
|
||||
从"AI原型"(Prototype AI)到"企业级AI"(Enterprise AI)的范式转变:
|
||||
- ❌ 将LLM视为神奇的聊天机器人
|
||||
- ✅ 将LLM视为不可靠的分布式组件
|
||||
|
||||
## 关键人物
|
||||
- [[Alex Ewerlöf]]:可靠性工程专家,KTH系统工程硕士,27年经验,专注将人类系统协作模式迁移至AI架构
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
|
||||
@@ -1,34 +1,49 @@
|
||||
---
|
||||
title: "Retrieval"
|
||||
type: concept
|
||||
tags: [rag, retrieval, vector-search, similarity]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
Retrieval(检索阶段)是 RAG Pipeline 的第二步,根据用户问题的语义向量(Embedding Vector),在向量数据库中按相似度找出 Top-k 个最相关的文档块(Split)。
|
||||
|
||||
## Process
|
||||
1. **Query Embedding**:将用户问题通过同一个 Embedding Model 转化为语义向量
|
||||
2. **Vector Search**:在 Vector Store 中按相似度(余弦相似度/点积/欧氏距离)检索最接近的 k 个向量
|
||||
3. **Result Selection**:返回对应的原始文本块(Split)作为上下文
|
||||
|
||||
## Key Parameters
|
||||
- **Top-k(k值)**:决定返回多少个最相关的文档块,k 过小可能遗漏关键信息,k 过大则引入噪声
|
||||
- **Similarity Metric**:余弦相似度最常用,适合方向性语义匹配;点积适合归一化向量;欧氏距离适合几何距离度量
|
||||
|
||||
## In RAG Pipeline
|
||||
- **上游**:依赖 Indexing 阶段构建的向量数据库
|
||||
- **下游**:检索结果传递给 Generation 阶段作为上下文
|
||||
|
||||
## Challenges
|
||||
- **语义鸿沟**:用户问题的措辞与文档中相关内容可能不同(词汇不匹配)
|
||||
- **上下文窗口限制**:Top-k 个文档块的总 token 数不能超过 LLM 的 Context Window
|
||||
- **噪声召回**:向量相似度高但实际无关的文档块可能被召回
|
||||
|
||||
## Related Concepts
|
||||
- [[RAG]] — Retrieval 是 RAG Pipeline 的第二阶段
|
||||
- [[Vector Store]] — 检索的数据库后端
|
||||
- [[Embedding]] — 检索的向量来源
|
||||
- [[Generation]] — Retrieval 的下一阶段,接收检索结果作为上下文
|
||||
- [[Hybrid Search]] — 结合向量检索与关键词检索以弥补单一向量检索的不足
|
||||
---
|
||||
title: "Retrieval"
|
||||
type: concept
|
||||
tags: [RAG, 向量检索, 语义搜索]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
|
||||
Retrieval(检索阶段)是 RAG 管道的第二阶段,根据用户问题的语义向量(Embedding Vector)在向量数据库中检索与之最相似的 Top-k 个文档块。
|
||||
|
||||
## Core Process
|
||||
|
||||
```
|
||||
用户问题 → 问题向量化 → Vector Store 相似度检索 → 返回 Top-k 文档块
|
||||
```
|
||||
|
||||
1. **问题向量化**:将用户输入的自然语言问题通过相同的 Embedding Model 转换为向量
|
||||
2. **相似度计算**:Vector Store 计算问题向量与所有文档块向量的相似度(常用方法:余弦相似度、点积、欧氏距离)
|
||||
3. **返回 Top-k 结果**:返回相似度最高的 k 个文档块作为检索结果
|
||||
|
||||
## Similarity Metrics
|
||||
|
||||
| 方法 | 适用场景 |
|
||||
|------|----------|
|
||||
| 余弦相似度(Cosine) | 归一化向量,衡量方向相似性 |
|
||||
| 点积(Dot Product) | 未归一化向量,兼顾 magnitude |
|
||||
| 欧氏距离(L2) | 几何距离,适用低维空间 |
|
||||
|
||||
## Retrieval Strategies
|
||||
|
||||
- **Top-k Retrieval**:返回相似度最高的 k 个结果
|
||||
- **MMR(Maximal Marginal Relevance)**:平衡相关性和多样性,减少重复信息
|
||||
- **Hybrid Retrieval**:结合关键词检索(BM25)与向量检索
|
||||
|
||||
## Connections
|
||||
|
||||
- [[Retrieval]] ← part_of ← [[RAG]]
|
||||
- [[Retrieval]] ← uses ← [[Vector-Store]]
|
||||
- [[Retrieval]] ← uses ← [[Embedding]]
|
||||
- [[Retrieval]] ← feeds_into ← [[Generation]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- Information Retrieval
|
||||
- Semantic Search
|
||||
- 向量检索
|
||||
- 语义检索
|
||||
|
||||
22
wiki/concepts/TextToSpeech.md
Normal file
22
wiki/concepts/TextToSpeech.md
Normal file
@@ -0,0 +1,22 @@
|
||||
---
|
||||
title: "TextToSpeech"
|
||||
type: concept
|
||||
tags: [ai, speech, text-to-speech]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Definition
|
||||
Text-to-Speech(TTS)是将文本转换为语音的 AI 技术,也称为语音合成。
|
||||
|
||||
## Key Characteristics
|
||||
- 将书面文本转换为可听的语音输出
|
||||
- 广泛应用于辅助阅读、语音导航、无障碍访问等场景
|
||||
- 现代 TTS 系统基于深度学习(如 WaveNet、Tacotron)生成自然语音
|
||||
|
||||
## Examples from Sources
|
||||
- [[Google AI Studio]] 提供免费的 Text-to-Speech 服务,支持 Gemini 模型和 Dialog 对话
|
||||
|
||||
## Relationships
|
||||
- 属于 [[AI时代发展策略]] 的创意工具层
|
||||
- 与 [[TextToVideo]] 互补:TTS 处理音频,TextToVideo 处理视频
|
||||
24
wiki/concepts/TextToVideo.md
Normal file
24
wiki/concepts/TextToVideo.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "TextToVideo"
|
||||
type: concept
|
||||
tags: [ai, video, text-to-video]
|
||||
sources: [我的工具集, 14个免费的ai图生视频工具]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Definition
|
||||
Text-to-Video 是将文本描述转换为视频内容的 AI 技术,属于生成式 AI 的重要分支。
|
||||
|
||||
## Key Characteristics
|
||||
- 根据文本描述生成动态视频内容
|
||||
- 可结合音频([[TextToSpeech]])实现完整的视频创作流程
|
||||
- 广泛应用于营销视频、内容创作、广告制作等场景
|
||||
|
||||
## Examples from Sources
|
||||
- [[Vidu]] 提供 Text-to-Video 服务
|
||||
- [[Hailuo AI]] 提供 Text-to-Video 服务
|
||||
|
||||
## Relationships
|
||||
- 属于 [[AI时代发展策略]] 的创意工具层
|
||||
- 与 [[ImageToVideo]] 互补:TextToVideo 从文本生成,ImageToVideo 从图像生成
|
||||
- 结合 [[TextToSpeech]] 可实现完整的"文字→视频+音频"创作流程
|
||||
22
wiki/concepts/Token.md
Normal file
22
wiki/concepts/Token.md
Normal file
@@ -0,0 +1,22 @@
|
||||
---
|
||||
title: "Token"
|
||||
type: concept
|
||||
tags: [token, llm, pricing, metering]
|
||||
aliases: [Token, Tokens, 分词, 词元]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Token,大语言模型的基本输入单元,可以认为是一个单词或一个短语。是模型计费和性能计算的基础单位。
|
||||
|
||||
## Key Facts
|
||||
- 英文:1 个字符 ≈ 0.3 个 Token
|
||||
- 中文:1 个字符 ≈ 0.6 个 Token(即中文 Token 消耗约是英文的 2 倍)
|
||||
- Token 数量直接影响 API 调用成本和响应延迟
|
||||
- Tokenization(分词)是将自然语言文本转换为 Token 序列的过程
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 计量单位 ← [[Token]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
@@ -1,25 +1,26 @@
|
||||
---
|
||||
title: "Tree of Thoughts"
|
||||
type: concept
|
||||
tags: []
|
||||
sources: []
|
||||
last_updated: 2026-04-25
|
||||
---
|
||||
|
||||
# Tree of Thoughts
|
||||
|
||||
## 定义
|
||||
思维之树——多智能体系统的树形探索模式,是[[Genetic-Algorithm]](遗传算法)的精简实现。通过验证器决定哪些Agent分支被淘汰,持续筛选直至找到最优解。
|
||||
|
||||
## 核心公式
|
||||
将任务分配给N个Agent → Validator决定淘汰哪些 → 可选:用通过验证的Agent特征生成新Agent填补空缺
|
||||
|
||||
## 关键要求
|
||||
- 需要快速验证输出的方式(如Eval/单元测试)
|
||||
- 如果需要人工检查所有分支,太慢且容易出错
|
||||
|
||||
## 与Knock-out Pattern的关系
|
||||
Tree of Thoughts是Knock-out模式的进阶——后者只是淘汰,前者还包括通过验证的Agent特征重组。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
---
|
||||
title: "Tree of Thoughts"
|
||||
type: concept
|
||||
tags: []
|
||||
sources:
|
||||
- multi-agent-system-reliability
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
# Tree of Thoughts
|
||||
|
||||
## 定义
|
||||
思维之树——多智能体系统的树形探索模式,是[[Genetic-Algorithm]](遗传算法)的精简实现。通过验证器决定哪些Agent分支被淘汰,持续筛选直至找到最优解。
|
||||
|
||||
## 核心公式
|
||||
将任务分配给N个Agent → Validator决定淘汰哪些 → 可选:用通过验证的Agent特征生成新Agent填补空缺
|
||||
|
||||
## 关键要求
|
||||
- 需要快速验证输出的方式(如Eval/单元测试)
|
||||
- 如果需要人工检查所有分支,太慢且容易出错
|
||||
|
||||
## 与Knock-out Pattern的关系
|
||||
Tree of Thoughts是Knock-out模式的进阶——后者只是淘汰,前者还包括通过验证的Agent特征重组。
|
||||
|
||||
## 来源
|
||||
- [[multi-agent-system-reliability]]
|
||||
|
||||
50
wiki/concepts/Vector-Store.md
Normal file
50
wiki/concepts/Vector-Store.md
Normal file
@@ -0,0 +1,50 @@
|
||||
---
|
||||
title: "Vector-Store"
|
||||
type: concept
|
||||
tags: [RAG, 向量数据库, 嵌入向量]
|
||||
sources: [rag从入门到精通系列1-基础rag]
|
||||
last_updated: 2025-01-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
|
||||
Vector Store(向量数据库)是专门用于存储和检索高维向量(Embedding Vector)的数据库系统,是 RAG 管道中 Retrieval 阶段的核心基础设施。
|
||||
|
||||
## Core Functions
|
||||
|
||||
1. **向量存储**:存储文本的 Embedding Vector 表示
|
||||
2. **相似度检索**:支持多种相似度度量方法(余弦相似度、点积、欧氏距离),返回 Top-k 最相似的结果
|
||||
3. **元数据过滤**:支持在检索时附加标量过滤条件(如时间、类别等)
|
||||
4. **混合检索**:部分向量数据库支持结合传统关键词检索(BM25)与向量检索
|
||||
|
||||
## Popular Vector Stores
|
||||
|
||||
| 名称 | 特点 | 语言 |
|
||||
|------|------|------|
|
||||
| Qdrant | 开源,高性能,支持过滤,Rust 编写 | Rust |
|
||||
| Chroma | 轻量级,适合本地和小规模场景 | Python |
|
||||
| Milvus | 开源,分布式,成熟生产级 | Go |
|
||||
| Weaviate | 原生支持混合检索,GraphQL 接口 | Go |
|
||||
| Pinecone | 云原生,全托管,无需运维 | 云服务 |
|
||||
| pgvector | PostgreSQL 扩展,简化技术栈 | PostgreSQL |
|
||||
|
||||
## Indexing in Vector Store
|
||||
|
||||
向量数据库通常使用近似最近邻(ANN)算法构建索引,以支持在海量向量中快速检索:
|
||||
|
||||
- **HNSW(Hierarchical Navigable Small World)**:图索引,高检索精度,中等内存占用
|
||||
- **IVF(Inverted File Index)**:倒排索引,支持聚类加速
|
||||
- **PQ(Product Quantization)**:压缩索引,节省内存
|
||||
|
||||
## Connections
|
||||
|
||||
- [[Vector-Store]] ← supports ← [[Retrieval]]
|
||||
- [[Vector-Store]] ← receives_data_from ← [[Indexing]]
|
||||
- [[Vector-Store]] ← uses ← [[Embedding]]
|
||||
|
||||
## Aliases
|
||||
|
||||
- Vector Database
|
||||
- Vector Search Engine
|
||||
- Embedding Store
|
||||
- 向量数据库
|
||||
22
wiki/concepts/WebScraper.md
Normal file
22
wiki/concepts/WebScraper.md
Normal file
@@ -0,0 +1,22 @@
|
||||
---
|
||||
title: "WebScraper"
|
||||
type: concept
|
||||
tags: [ai, data, scraper, web]
|
||||
sources: [我的工具集]
|
||||
last_updated: 2026-05-11
|
||||
---
|
||||
|
||||
## Definition
|
||||
Web Scraper 是用于从网页中自动提取结构化数据的工具或服务。
|
||||
|
||||
## Key Characteristics
|
||||
- 自动化抓取网页内容
|
||||
- 支持大规模数据采集
|
||||
- 可用于市场研究、竞品分析、内容聚合等场景
|
||||
|
||||
## Examples from Sources
|
||||
- [[Brightdata]] 提供付费的 Web-Scraper 服务
|
||||
|
||||
## Relationships
|
||||
- 属于 [[AI时代发展策略]] 的数据采集层
|
||||
- 为 AI Agent 提供数据输入源
|
||||
@@ -1,37 +1,34 @@
|
||||
---
|
||||
title: "九宫格法"
|
||||
type: concept
|
||||
tags: ["AI图像生成", "画面一致性", "视频制作"]
|
||||
sources: ["固定镜头短视频制作的ai全流程解析"]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
## 定义
|
||||
九宫格法是一种 AI 图像生成的一致性控制方法,通过一次性生成 3×3 共九个画面(在同一张图内),确保所有分镜的摄像机机位、角度、景深、光影完全一致,从而解决逐帧独立生成导致画面风格不一致的问题。
|
||||
|
||||
## 核心问题
|
||||
逐帧独立生成图片会导致:
|
||||
- 光影关系错乱(同一光源在不同帧中方向/强度不一致)
|
||||
- 空间关系错乱(物体位置、比例关系变化)
|
||||
- 色彩风格不一致(色调、饱和度、明度不统一)
|
||||
- 摄像机机位漂移(角度、景深在系列画面中不连贯)
|
||||
|
||||
## 九宫格法的工作流程
|
||||
1. 在 AI 图像生成工具(如 [[Midjourney]] 或 [[Nano Banana]])中设计 3×3 网格布局
|
||||
2. 一次性输入提示词,同时生成九张连贯的分镜画面
|
||||
3. 使用工具(如 [[Google AI Studio]])自动将九宫格图裁剪为九张独立的竖屏图(9:16 比例)
|
||||
4. 将九张独立图片配对,通过 [[首尾针动画]] 技术生成连贯视频片段
|
||||
|
||||
## 核心优势
|
||||
- **机位固定**:同一张图内,机位和角度天然一致
|
||||
- **光影连贯**:同一光源设置贯穿所有分镜
|
||||
- **构图统一**:景深、视角保持一致
|
||||
- **效率提升**:一次生成九个画面,减少重复调整
|
||||
|
||||
## 在 AI 短视频制作流程中的位置
|
||||
在 [[固定镜头短视频制作的AI全流程解析]] 中,九宫格法是**第二步(一致性图像生成)**的关键技术:
|
||||
1. 拆分镜头 → [[Google AI Studio]]
|
||||
2. **一致性图像生成 → 九宫格法**
|
||||
3. 首尾针动画制作
|
||||
4. 快速剪辑
|
||||
5. 声音设计
|
||||
---
|
||||
title: "九宫格法"
|
||||
type: concept
|
||||
tags: [AI视频生成, 图像一致性, 分镜]
|
||||
last_updated: 2026-03-15
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- 九宫格图像生成
|
||||
- 3x3 Grid Method
|
||||
- 9-Grid Image Generation
|
||||
|
||||
## Definition
|
||||
九宫格法是一种保证AI生成视频画面一致性的图像生成技术。通过一次性生成3x3共九个画面,确保摄像机机位、拍摄角度、空间关系和光影效果在所有画面中保持高度统一。
|
||||
|
||||
## Mechanism
|
||||
1. 将整个视频内容分解为九个连贯阶段
|
||||
2. 在同一prompt中使用九宫格布局一次性生成9张图
|
||||
3. 通过Google AI Studio工具自动检测并裁剪为9张竖屏图(9:16比例)
|
||||
4. 各阶段图像保持机位和角度不变,仅细节表现施工进度变化
|
||||
|
||||
## Advantages
|
||||
- 保证画面空间和光影连贯性
|
||||
- 避免逐帧独立生成导致的光影错乱
|
||||
- 增强视频整体视觉一致性
|
||||
- 适合固定机位类视频制作
|
||||
|
||||
## Related Concepts
|
||||
- [[首尾针动画]]:基于生成的图像制作动态动画
|
||||
- [[固定机位]]:九宫格法的最佳应用场景
|
||||
- [[时间压缩]]:九宫格法用于表现时间流逝的手法
|
||||
|
||||
## Source
|
||||
- [[固定镜头短视频制作的ai全流程解析]]
|
||||
|
||||
@@ -2,7 +2,8 @@
|
||||
title: "提示词工程"
|
||||
type: concept
|
||||
tags: [AI, 提示词, Prompt Engineering]
|
||||
last_updated: 2025-12-18
|
||||
sources: [清华出的deepseek使用手册-104页-真的是太厉害了-免费领取, nano-banana-pro-prompting-guide-strategies-1]
|
||||
last_updated: 2026-04-28
|
||||
---
|
||||
|
||||
## 基本定义
|
||||
@@ -13,9 +14,11 @@ last_updated: 2025-12-18
|
||||
- 需要理解AI的工作机制,才能写出高效的提示词
|
||||
- 清华大学《DeepSeek从入门到精通2025》手册系统讲解了提示词设计方法
|
||||
- 核心教学理念:**"授人以渔"** —— 不只告诉你怎么问,还告诉你为什么这么问
|
||||
- Nano-Banana Pro 的方法论:**"像创意总监一样思考"** —— 停止标签堆砌,使用自然语言和完整句子,80% 正确时通过编辑而非重生成
|
||||
|
||||
## 相关来源
|
||||
- [[清华出的deepseek使用手册-104页-真的是太厉害了-免费领取]]
|
||||
- [[Nano-Banana Pro Prompting Guide & Strategies 1]]:强调"思维模式"(Thinking Mode)和自然语言提示,适用于图像生成领域
|
||||
|
||||
## 相关概念
|
||||
- [[AI幻觉]]:与提示词工程密切相关,通过好的提示词设计可以有效减少AI幻觉
|
||||
|
||||
@@ -1,35 +1,40 @@
|
||||
---
|
||||
title: "首尾针动画"
|
||||
type: concept
|
||||
tags: ["AI视频生成", "动画技术", "短视频制作"]
|
||||
sources: ["固定镜头短视频制作的ai全流程解析"]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
## 定义
|
||||
首尾针动画(Keyframe Animation)是一种 AI 视频生成技术,通过上传两个关键帧图片——首针图(Start Frame)和尾针图(End Frame)——让 AI 自动补齐两个阶段之间的中间画面,从而产生连贯流畅的动画效果。
|
||||
|
||||
## 技术原理
|
||||
1. **上传首尾两张关键图**:首针图定义起点状态,尾针图定义终点状态
|
||||
2. **AI 分析两张图之间的变化**:识别主体、背景、光影等元素的差异
|
||||
3. **自动生成中间过渡帧**:AI 在两张图之间插值计算,生成平滑过渡的连续画面
|
||||
4. **输出连贯视频片段**:最终生成从首针到尾针的完整动画视频
|
||||
|
||||
## 在 AI 短视频制作流程中的作用
|
||||
在 [[固定镜头短视频制作的AI全流程解析]] 描述的五步公式中,**首尾针动画制作**是第三步:
|
||||
1. 拆分镜头([[Google AI Studio]])
|
||||
2. 一致性图像生成([[九宫格法]],[[Midjourney]]/[[Nano Banana]])
|
||||
3. **首尾针动画制作**(海螺AI/KAI/[[KAI]])
|
||||
4. 快速剪辑([[剪映]])
|
||||
5. 声音设计
|
||||
|
||||
## 核心优势
|
||||
- **平滑过渡**:AI 自动补齐中间变化,避免手动逐帧制作的繁琐
|
||||
- **时间压缩**:将漫长的过程(如装修数月)浓缩为几秒的流畅动画
|
||||
- **自然感强**:过渡效果由 AI 智能计算,比硬切更平滑自然
|
||||
|
||||
## 支持工具
|
||||
- [[海螺AI]](MiniMax)
|
||||
- [[KAI]]
|
||||
- 即梦AI(字节跳动)
|
||||
- 可灵AI(快手)
|
||||
---
|
||||
title: "首尾针动画"
|
||||
type: concept
|
||||
tags: [AI视频生成, 动画制作, 关键帧]
|
||||
last_updated: 2026-03-15
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- 首尾帧动画
|
||||
- First-Last Frame Animation
|
||||
- Keyframe Animation
|
||||
- Frame Interpolation
|
||||
|
||||
## Definition
|
||||
首尾针动画是一种AI视频生成技术,通过上传两个关键帧图片("首针"和"尾针"),让AI自动补齐两个阶段之间的变化,从而产生平滑的过渡动画效果。
|
||||
|
||||
## Mechanism
|
||||
1. 逐个上传九张分镜图像配对制作动画
|
||||
2. 每对图像包含"首针图"(起始状态)和"尾针图"(结束状态)
|
||||
3. AI分析两张图像的差异,自动生成中间过渡帧
|
||||
4. 达成画面平滑过渡效果,无需镜头移动
|
||||
|
||||
## Technical Requirements
|
||||
- 需要支持"首尾针"动画模式的AI工具
|
||||
- 推荐工具:海螺AI、多么AI、KAI
|
||||
- 图片需保持良好的一致性(建议使用九宫格法生成)
|
||||
|
||||
## Advantages
|
||||
- 提供平滑的过渡效果
|
||||
- 硬切反而更简洁干净
|
||||
- 无需复杂转场效果
|
||||
- 适合固定机位、内容连续变化的视频
|
||||
|
||||
## Related Concepts
|
||||
- [[九宫格法]]:生成一致性图像,为首尾针动画提供素材
|
||||
- [[快节奏剪辑]]:首尾针动画与硬切结合使用
|
||||
- [[固定机位]]:首尾针动画的最佳应用场景
|
||||
|
||||
## Source
|
||||
- [[固定镜头短视频制作的ai全流程解析]]
|
||||
|
||||
Reference in New Issue
Block a user