Files
nexus/AI/LLMs、RAG、AI Agent 三个到底什么区别?.md

139 lines
9.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: LLMs、RAG、AI Agent 三个到底什么区别?
source: https://mp.weixin.qq.com/s/8B_Phrjz_Mlvpe7vJ3maPA
author: shenwei
published:
created: 2025-11-19
description: 主要讲明白关于LLMs、RAG和AI Agent这三个定义的区别到底是什么这三者目前已经是做AI相关应用绕不过去的名词也是作为初入AI应用开发者必须了解掌握的基础知识。
tags: [ai-agent, llm, rag]
---
#llm #rag #ai-agent
![Image](https://mmbiz.qpic.cn/mmbiz_png/VUgKicbG7iaMvyVYdNszaOVC9DnZLpg1HzVXtJF72DYMAicb3hZS4xWMztibicCAYAxkF2hTAlHyxoiaiayF0kibFnYgSg/640?wx_fmt=png&from=appmsg&watermark=1&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=0)
对于接触 AI 相关的朋友平时都会遇到很多新的概念先不说什么大模型的技术性的术语就AI应用方面的术语就非常多。
而且,现在还是依旧层出不穷。
在技术迭代到一定程度之后,它就必然会满足更多的实际场景,而要满足某些实际场景的话,并不是单单依靠某个单一技术就可以实现的。
举个例子来说大家知道计算机技术最开始其实只有CPU和内存等外置硬件设备那个时候都是基于命令行方式来做一些计算工作普通人想要用起来计算机的话门槛极高。
后来便有了Linux这类操作系统它可以支持自定义编程也就是在计算机硬件基础上来开发满足实际场景的软件这里面最典型的就是操作系统也就是我们现在用的Window、Mac等操作系统。
这时候计算机PC和Windows、MAC等等都是当时为了满足大众使用计算机所创造出的术语/名词,通过这个概念名词来定义某个技术的作用是什么,相当于给它们起一个名字来表示。
继续沿着操作系统之后就知道后面有很多基于操作系统之上的新名词诞生例如Web浏览器、客户端软件、Client/Server技术架构等等这些又都是在操作系统之上为了满足更多实际场景而开发出来的新东西而每一个都是满足当时场景下的新名词。
所以在AI成为新的普适性的技术底座之前必然会有更多的名词定义出来而它也是为了满足特定场景解决特定问题所存在的必然。
今天我们主要讲明白关于LLMs、RAG和AI Agent这三个定义的区别到底是什么这三者目前已经是做AI相关应用绕不过去的名词也是作为初入AI应用开发者必须了解掌握的基础知识。
首先,要先注意一点:它们并不是竞争技术,而是在三个不同层面,满足不同实际场景的能力展示,另外大部分人对它们使用方式都是错误的。
LLM 全称是大语言模型Large Language Model它是AI应用的“天才大脑”这个天才大脑学习了过去上下五千年的所有知识是的是所有知识堪比“全能人”。
这个“天才大脑”你问它啥,它都能回答上来,甚至还能帮助我们写写文章、分析点东西、编程、画画等等的。
LLMs也分为很多种有底座大模型例如ChatGPT、DeepSeek、Qwen等等也有专有大模型也就是专门用来画画专门用来编写的模型例如绘画模型Midjourney、Stable Diffusion、Flux等等编程模型Claude、Curos、kimi-k2-thing等等。
专有模型某种意义上来说,也是基于底座通用大模型来单独训练出来的能力,也就是让“天才大脑”对于某一个方面特别精通,做了专项的训练。
但是这个大模型有一个问题它只能知道过去已经发生的时候在上面也提到了它是基于过去的所有知识训练、学习出来的所以它的知识内容啊是有某一个时间节点的例如ChatGPT-5的知识时间就是2024年6月单独问这个模型2025年的事情它都不知道。
![Image](http://zipline.ishenwei.online/u/yqHe8q.webp)
当然现在是有了联网搜索的能力了但是这种其实是在大模型之外的Agent助手通过这个外部Agent助手可以爬取网站的数据或者通过搜索引擎Baidu、Bing、Google等来获取相关数据然后在交给大模型来总结分析。
总结起来LLM 在思考方面非常出色,但对当前情况却一无所知。
![Image](http://zipline.ishenwei.online/u/u7EkRH.webp)
这个时候就可以引出第二个名词解释就是RAG。
RAGRetrieval-Augmented Generation检索增强生成可以说是一个记忆系统它可以将原本静态固定的“天才大脑”LLM中的知识链接到外部实时的知识库当你提问问题的时候RAG会主动搜索外部数据拉去相关文档并将它们作为上下文输入到LLM中。
这样就好比于,原本是一个“书呆子”,突然打开了视野,变得灵活多动了,对于原来静态的大模型来说,动态信息、实时数据也就以为这它不需要重新训练了。
在大模型训练也就是模型学习知识的过程是一个非常高昂成本的过程啥意思就是费钱不仅仅要买书、还要营养跟得上不然动不动就卡壳、生病出bug啥的所以要用很多高端GPU卡来吸收海量数据才能让这个大脑学会知识。
最基础的工具是能够访问最新信息的能力。检索增强生成RAG为智能体提供了一张“借书证”使其能查询外部知识这些知识通常存储在向量数据库或知识图谱中——从公司内部文档到通过谷歌搜索获取的网络知识应有尽有。对于结构化数据自然语言到SQLNL2SQL工具则使智能体能够直接查询数据库从而解答诸如“上个季度我们的畅销产品有哪些”这类分析性问题。通过在发言前先查找相关信息——无论是来自文档还是数据库——智能体得以立足于事实显著地减少幻觉。
RAG 流程结合了两个关键步骤:
**1\. 检索Retrieval**
当用户提出问题时,系统首先从一个或多个 **外部、定制化** 的知识库如公司的内部文件、最新的数据库、特定领域文档等检索出最相关的小块信息Chunk
2\. 增强生成Augmented Generation
然后,系统将用户的原始问题和检索到的相关信息作为 **上下文** Context输入给 LLM指示 LLM 严格基于这些上下文信息来生成答案。
![Image](http://zipline.ishenwei.online/u/eSxFEm.webp)
RAG 就像是给那个“全能天才大脑”配备了一位 **随身图书馆助理**
**1\. 知识更新与定制:**
当你问一个关于“公司最新财报”或“某本专业书籍第十章内容”的问题时RAG 不会依赖 LLM 内部的旧知识,而是立即去检索公司内部最新的文档。
**2\. 消除幻觉:**
通过提供 **事实依据** RAG 极大地降低了 LLM “胡编乱造”的风险,因为它生成的答案是 **有据可查** 的。
**3\. 引用来源:**
优秀的 RAG 系统还能提供它查找信息的 **来源链接或文档页码** ,增加了可信度。
接下来还有最后一个名词就是AI Agent也叫做AI智能体为啥叫智能体
结合上面LLM是思考RAG是提供信息但 是它俩都不具备行动能力,有脑,有手,但是不知道怎么走路。
而AI Agent也就是智能体它就是围绕大脑LLM构建一个循环控制系统能够感知目标、规划步骤、执行动作、并能够反思结果。
本质上,智能体通过一个连续的循环过程来实现其目标。它可被分解为五个基本步骤:
1\. 获取任务:该过程由一个具体且高层次的目标启动。此任务可由用户(例如:“为团队安排即将召开的会议出行事宜”)提供,或由自动触发机制(例如:“新收到一封高优先级客户工单”)激活。
2\. 扫描场景Agent感知到环境中获取上下文信息。这涉及协调层访问其可用资源“用户请求的内容是什么”、“我的术语记忆中有哪些信息我是否已尝试过执行此任务”、“用户上周是否曾向我提供过指导”、“我能从我的工具如日历、数据库或API中访问哪些内容
3\. 仔细思考:这是智能体的核心“思考”循环,由推理模型驱动。
智能体首先将任务步骤1与场景步骤2进行分析并制定行动计划。这并非单一的思考过程而通常是一系列连续的推理链条“要预订行程我首先需要知道团队成员都有谁因此我会使用get\_team\_roster工具接下来我还需要通过calendar\_api检查他们的日程安排。”
4\. 采取行动编排层执行计划的第一步具体操作。它会选择并调用适当的工具——无论是调用API、运行代码函数还是查询数据库。这是代理基于自身内部推理真正作用于外部世界的行为。
5\. 观察并迭代智能体观察其行动的结果。get\_team\_roster工具会返回一个包含五个名字的列表。这些新信息将被添加到智能体的上下文或“记忆”中。随后循环再次启动回到步骤3“现在我已获得名单下一步是查询日历确认这五个人的日程安排。我将使用calendar\_api。”
![Image](http://zipline.ishenwei.online/u/UpOsHD.webp)
而真正的生产系统会叠加所 有三个: **用 LLM 进行推理** **,用 RAG 确保准确性以及用Agent框架实现自主性。**
**使用 LLM 单独处理纯语言任务时:写作、摘要、解释。**
**当准确性至关重要时添加 RAG从内部文档、技术手册、特定领域知识中回答。**
**需要真正自主性时部署 Agents能够决策、行动和管理复杂工作流的系统。**
未来不在于选择其一。而在于将三者结合起来进行架构设计。
用于思考的 LLMs。
用于认知的 RAG。
用于执行的Agent。
由此才能够构建出AI智能时代