nexus/wiki/sources/大模型相关术语和框架总结-LLM-MCP-Prompt-RAG-vLLM-Token-数据蒸馏.md at 098be116032cf9a18c9205ed43a7bd2eda7c8810 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen 7d361490b2 Auto-sync: 2026-04-18 12:03

2026-04-18 12:03:16 +08:00

2.6 KiB

Raw Blame History

title, type, tags, date

title

type

tags

date

大模型相关术语和框架总结｜LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏

source

llm

mcp

prompt

rag

token

vllm

2025-12-20

Source File

raw/AI/大模型相关术语和框架总结｜LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏.md

Summary

核心主题：大模型领域核心术语和框架科普
问题域：AI 大模型基础知识
方法/机制：术语解释 + 框架介绍
结论/价值：建立对大模型技术栈的系统认知

Key Claims

LLM（Large Language Model）行业以参数规模和训练数据/算力来衡量，通常 ≥1B 参数被称为“大模型”
MCP（Model Context Protocol）是为 LLM 提供标准化接口的开放协议，使 LLM 能连接外部数据源和工具
Agent 智能体需要将 LLM 整合 MCP 工具才能真正执行步骤，而不仅是给出方法
RAG（Retrieval-augmented generation）通过检索增强来解决 LLM 的幻觉问题，提升回答准确率
vLLM 通过 PagedAttention 和连续批处理优化 GPU 内存使用，提升推理效率

Key Quotes

"大模型是不会自己去调用外部数据源或者工具的，大模型只会告诉我们需要调用哪些工具，而我们需要自己去实现工具的调用。" — 解释了 LLM 与 Agent 的本质区别

"LLM 在考试的时候面对陌生的领域，只会写一个解字，然后就准备放飞自我了，而此时 RAG 给了亿些提示，让 LLM 懂了开始往这个提示的方向做，最终考试的正确率从 60% 到了 90%！" — 直观解释 RAG 的作用

Key Concepts

LLM：大型语言模型，以参数规模衡量
MCP：模型上下文协议，标准化接口
Agent：智能体，整合 LLM + MCP 工具
RAG：检索增强生成，解决幻觉
Embedding：向量化，词转化为浮点数计算语义距离
LangChain：快速实现 Agent 的开发框架
vLLM：虚拟大语言模型，优化 GPU 内存和推理效率
Token：大模型的基本输入单元
数据蒸馏：利用大模型生成精简数据训练小模型

Key Entities

ChatGPT：OpenAI 开发的大型语言模型示例
GPT-2：1.5B 参数的早期较大语言模型
GPT-3：175B 参数的代表性大模型

Connections

LLM ← 核心概念 ← MCP
LLM ← 核心概念 ← Agent
LLM ← 核心概念 ← RAG
LLM ← 核心概念 ← vLLM
LLM ← 核心概念 ← 数据蒸馏
Agent ← 依赖 ← MCP
RAG ← 技术基础 ← Embedding
LangChain ← 用于构建 ← Agent

Contradictions

（暂无）