59 lines
3.6 KiB
Markdown
59 lines
3.6 KiB
Markdown
---
|
||
title: "LLMs、RAG、AI Agent 三个到底什么区别?"
|
||
type: source
|
||
tags: [ai-agent, llm, rag]
|
||
sources: []
|
||
last_updated: 2025-11-19
|
||
---
|
||
|
||
## Source File
|
||
- [[raw/AI/LLMs、RAG、AI Agent 三个到底什么区别?.md]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:LLM、RAG、AI Agent 三者的定义区别与协同关系
|
||
- 问题域:AI 应用开发入门基础知识,澄清常见误解
|
||
- 方法/机制:作者以类比手法,将 LLM 比作"天才大脑"、RAG 比作"随身图书馆助理"、AI Agent 比作具备行动能力的循环控制系统,层层递进解释三者关系
|
||
- 结论/价值:三者并非竞争技术,而是在不同层面互补协同——LLM 用于思考,RAG 用于认知,Agent 用于执行;生产系统应将三者结合使用
|
||
|
||
## Key Claims(用中文描述)
|
||
- LLM(大语言模型)是 AI 应用的"天才大脑",在思考方面出色,但对当前情况一无所知
|
||
- RAG(检索增强生成)是连接 LLM 与外部实时知识库的"记忆系统",无需重新训练即可获取最新信息、消除幻觉
|
||
- AI Agent 是围绕 LLM 构建的循环控制系统,具备感知目标、规划步骤、执行动作、反思结果的行动能力
|
||
- 三者并非竞争技术,而是在不同层面满足不同实际场景的能力展示;生产系统应叠加使用三者
|
||
|
||
## Key Quotes
|
||
> "LLM 在思考方面非常出色,但对当前情况却一无所知。" — 核心矛盾点
|
||
> "RAG 就像是给那个'全能天才大脑'配备了一位随身图书馆助理。" — RAG 的定位
|
||
> "AI Agent 也就是智能体,它就是围绕大脑 LLM 构建一个循环控制系统,能够感知目标、规划步骤、执行动作、并能够反思结果。" — Agent 的本质
|
||
> "用 LLM 进行推理,用 RAG 确保准确性,以及用 Agent 框架实现自主性。" — 生产系统组合策略
|
||
|
||
## Key Concepts
|
||
- [[LLM]]:大语言模型(Large Language Model),AI 应用的"天才大脑",基于过去知识训练,具备强大推理能力但知识有截止日期
|
||
- [[RAG]]:检索增强生成(Retrieval-Augmented Generation),为 LLM 提供外部知识库访问能力的"记忆系统",包含检索和增强生成两个关键步骤
|
||
- [[AI Agent]]:AI 智能体,围绕 LLM 构建的循环控制系统,包含获取任务、扫描场景、仔细思考、采取行动、观察迭代五个基本步骤
|
||
- [[幻觉]]:LLM 基于训练数据生成看似合理但实际错误或虚构的信息,RAG 通过提供事实依据可显著减少此类风险
|
||
|
||
## Key Entities
|
||
- ChatGPT:OpenAI 开发的底座大模型代表,用作 LLM 示例
|
||
- DeepSeek、Qwen:中国开源底座大模型代表
|
||
- Midjourney、Stable Diffusion:专有模型代表(绘画领域),专有模型本质上是让"天才大脑"在某一方面做专项训练
|
||
- Claude:专有模型代表(编程领域)
|
||
- [[向量数据库]]:RAG 系统中存储外部知识的常用基础设施
|
||
|
||
## Connections
|
||
- [[LLM]] ← 思考核心 ← [[AI Agent]]
|
||
- [[RAG]] ← 提供实时信息 ← [[LLM]]
|
||
- [[AI Agent]] ← 循环控制 ← [[LLM]]
|
||
- [[RAG]] ← 减少幻觉 ← [[LLM]]
|
||
- [[AI Agent]] ← 使用工具/API ← [[向量数据库]]
|
||
|
||
## Contradictions
|
||
- 无已知冲突内容
|
||
|
||
## AI Agent 五步循环
|
||
1. 获取任务(Goal):接收用户指令或自动触发
|
||
2. 扫描场景(Perceive):感知环境,访问可用资源
|
||
3. 仔细思考(Think):由推理模型驱动,分析任务并制定行动计划
|
||
4. 采取行动(Act):调用工具(API、代码、数据库等)作用于外部世界
|
||
5. 观察并迭代(Observe):将结果加入上下文/记忆,循环回到第3步
|