Files
nexus/wiki/sources/大模型相关术语和框架总结-LLM-MCP-Prompt-RAG-vLLM-Token-数据蒸馏.md
2026-04-18 12:03:16 +08:00

2.6 KiB
Raw Blame History

title, type, tags, date
title type tags date
大模型相关术语和框架总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏 source
llm
mcp
prompt
rag
token
vllm
2025-12-20

Source File

Summary

  • 核心主题:大模型领域核心术语和框架科普
  • 问题域AI 大模型基础知识
  • 方法/机制:术语解释 + 框架介绍
  • 结论/价值:建立对大模型技术栈的系统认知

Key Claims

  • LLMLarge Language Model行业以参数规模和训练数据/算力来衡量,通常 ≥1B 参数被称为“大模型”
  • MCPModel Context Protocol是为 LLM 提供标准化接口的开放协议,使 LLM 能连接外部数据源和工具
  • Agent 智能体需要将 LLM 整合 MCP 工具才能真正执行步骤,而不仅是给出方法
  • RAGRetrieval-augmented generation通过检索增强来解决 LLM 的幻觉问题,提升回答准确率
  • vLLM 通过 PagedAttention 和连续批处理优化 GPU 内存使用,提升推理效率

Key Quotes

"大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。" — 解释了 LLM 与 Agent 的本质区别

"LLM 在考试的时候面对陌生的领域,只会写一个解字,然后就准备放飞自我了,而此时 RAG 给了亿些提示,让 LLM 懂了开始往这个提示的方向做,最终考试的正确率从 60% 到了 90%" — 直观解释 RAG 的作用

Key Concepts

  • LLM:大型语言模型,以参数规模衡量
  • MCP:模型上下文协议,标准化接口
  • Agent:智能体,整合 LLM + MCP 工具
  • RAG:检索增强生成,解决幻觉
  • Embedding:向量化,词转化为浮点数计算语义距离
  • LangChain:快速实现 Agent 的开发框架
  • vLLM:虚拟大语言模型,优化 GPU 内存和推理效率
  • Token:大模型的基本输入单元
  • 数据蒸馏:利用大模型生成精简数据训练小模型

Key Entities

  • ChatGPTOpenAI 开发的大型语言模型示例
  • GPT-21.5B 参数的早期较大语言模型
  • GPT-3175B 参数的代表性大模型

Connections

Contradictions

  • (暂无)