--- title: 大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏 type: source tags: [LLM, MCP, RAG, vLLM, Token, 数据蒸馏] date: 2025-12-20 source_file: ../raw/AI/大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏.md --- ## Summary - 核心主题:大模型核心术语和技术框架 - 问题域:梳理LLM、MCP、RAG、Agent、LangChain、vLLM、蒸馏等术语 - 方法/机制:解释各术语的定义、原理和应用场景 - 结论/价值:为理解大模型技术体系提供基础词汇表 ## Key Claims - LLM(Large Language Model):通常以参数规模≥1B被称为"大模型" - Prompt:输入给大模型的语句 - [[MCP]](Model Context Protocol):为LLM提供标准化接口连接外部数据源和工具 - [[Agent]]:大模型+MCP工具融合后的智能体 - [[RAG]](Retrieval-augmented generation):检索增强生成,解决hallucination问题 - [[Embedding]]:向量化,将词转化为浮点型数字计算词与词之间的距离 - [[LangChain]]:快速实现agent的开发框架 - [[vLLM]]:通过PagedAttention和连续批处理优化GPU内存利用 - [[KV Cache]]:保存历史K/V向量,避免重复计算 - Token:大模型基本输入单元,中文约0.6个token/字符 - 数据蒸馏:用大模型生成精简数据训练小模型 ## Key Concepts - [[LLM]]:大语言模型 - [[MCP]]:模型上下文协议 - [[Agent]]:智能体 - [[RAG]]:检索增强生成 - [[Embedding]]:向量化 - [[LangChain]]:Agent开发框架 - [[vLLM]]:高效LLM推理引擎 - [[KV Cache]]:键值缓存 - [[Token]]:令牌,大模型基本输入单元 - [[数据蒸馏]]:知识蒸馏,用大模型数据训练小模型 - [[PagedAttention]]:vLLM的内存管理技术 - [[连续批处理]]:vLLM的推理优化技术 - [[Hallucination]]:大模型一本正经胡说八道的现象 ## Key Entities - [[LangChain]]:Agent开发框架 - [[vLLM]]:开源LLM推理优化项目 ## Connections - [[LLM]] ← uses ← [[Token]] - [[LLM]] ← enhanced_by ← [[RAG]] - [[LLM]] ← enhanced_by ← [[Agent]] - [[Agent]] ← built_with ← [[MCP]] - [[vLLM]] ← uses ← [[PagedAttention]] - [[vLLM]] ← uses ← [[KV Cache]] - [[数据蒸馏]] ← generates ← [[LLM]] ## Contradictions