Files
nexus/wiki/sources/大模型相关术语和框架总结.md

3.2 KiB
Raw Blame History

title, type, tags, date, source, author
title type tags date source author
大模型术语全总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏 source
LLM
MCP
RAG
vLLM
Token
数据蒸馏
术语
AI
2025-12-20 https://mp.weixin.qq.com/s/ AI工程化

Source File

Summary

  • 核心主题系统梳理大模型核心术语LLM、MCP、RAG、Agent、LangChain、vLLM、Token、数据蒸馏的含义与关系
  • 问题域AI 术语快速迭代,开发者难以系统理解核心概念及其关联
  • 方法/机制:每个术语配合图示和生活化比喻,解释技术本质和协作关系
  • 结论/价值:形成完整 LLM 技术栈认知地图LLM推理+MCP工具连接+RAG知识补充+vLLM高效推理

Key Claims

  • LLM≥1B 参数的语言模型GPT-2=1.5B、GPT-3=175B分底座通用和专有专项两类
  • Prompt:输入 LLM 的提示词,是与大模型交互的唯一接口
  • MCP模型上下文协议LLM 连接外部数据源/工具的标准化协议;大模型只告诉你"该调用什么工具",实际调用需通过 MCP Client→Server 执行
  • Agent = LLM + MCPLLM 输出步骤Agent 执行动作LLM 给你"发邮件的方法"Agent 真正发出邮件
  • RAG检索增强生成:解决 LLM 幻觉问题;检索外部知识库→将 chunk+问题输入 LLM→基于上下文生成比做给"天才大脑"配"图书馆助理"
  • Embedding向量化:词→浮点数向量→计算语义距离;"一百"到"两百"比到"一千"更近
  • LangChain:快速构建 Agent 的开发框架,标准接口连接 LLM、工具、数据源
  • vLLM:高效 GPU 推理引擎核心PagedAttentionKV Cache 分块管理)+ 连续批处理(减少 GPU 空载)
  • Token基本输入单元1英文字符≈0.3 Token1中文字符≈0.6 Token
  • 数据蒸馏Data Distillation:用大模型生成精简高质量训练数据,蒸馏到小模型使其逼近大模型效果

Key Quotes

"大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。" "LLM 复习局限于特定的数据集,面对陌生领域会'写一个解字然后放飞自我'RAG 给了提示,让正确率从 60% 到 90%。"

Key Concepts

  • MCP模型上下文协议LLM 连接外部工具/数据的标准化通信协议Anthropic/Claude Code/ Cursor 均支持
  • Agent执行模型LLM给步骤 + MCP执行工具 = Agent真正完成任务
  • PagedAttentionvLLM 的 KV Cache 分块管理技术,避免连续内存碎片化和 OOM
  • 连续批处理Continuous BatchingvLLM 推理优化,步进级调度 GPU 任务,减少空闲

Key Entities

  • LangChainAgent 开发框架
  • vLLM:高效 LLM 推理开源项目

Connections

Contradictions

  • (无已知冲突)