nexus/wiki/sources/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md at b2250c60b22ad489ee50b3510be34365c6b5b130 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen b2250c60b2 Auto-sync: 2026-04-16 13:01

2026-04-16 13:01:42 +08:00

3.7 KiB

Raw Blame History

title, type, tags, date

title

type

tags

date

大模型相关术语和框架总结｜LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏

source

LLM

AI术语

技术框架

2025-12-20

Source File

raw/未分类/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md

Summary

核心主题：AI/LLM 领域核心技术术语和技术框架的系统性梳理
问题域：AI 领域术语繁多、更新快、概念容易混淆，初学者和从业者均需要系统性参考
方法/机制：按功能分层（模型→协议→架构→优化→数据），从定义到关联完整覆盖
结论/价值：建立统一的 AI 技术术语认知框架，便于跨团队沟通和技术选型决策

Key Claims

LLM（大型语言模型）：≥1B 参数为"大模型"门槛，GPT-2（1.5B）、GPT-3（175B）、GPT-4（未公开）
Prompt（提示词）：人与 LLM 的协作协议，核心是消除信息差，引导模型按预期方式响应
MCP（模型上下文协议）：标准化 LLM 与外部工具/数据的通信协议，MCP Server 负责实际执行，LLM 只给步骤
Agent（智能体）：LLM + MCP 工具 = 可执行任务的智能体，大模型负责推理，工具负责执行
RAG（检索增强生成）：通过检索外部知识解决 LLM 幻觉，考试正确率从 60% 提升至 90%
Embedding（向量化）：词→浮点数向量，计算语义距离（一百和两百距离近，一百和一千距离远）
LangChain：快速构建 Agent 的开发框架，提供 160+ 文档加载器和工具链
vLLM：通过 PagedAttention（块式 KV Cache）+ 连续批处理优化 GPU 利用率，是当前最高效的 LLM 推理框架之一
Token：LLM 基本输入单元，中文约 0.6 token/字符，英文约 0.3 token/字符，API 按 Token 计费
数据蒸馏：用大模型生成精简数据训练小模型，用高质量合成数据弥补小模型能力差距

Key Quotes

"MCP 协议的核心约束：大模型不执行实际调用，只给出步骤建议，实际执行由 MCP Server 负责"

Key Concepts

LLM：大型语言模型，≥1B 参数的语言模型为"大模型"门槛
Prompt工程：人与 LLM 协作协议的设计与优化
MCP：Model Context Protocol，LLM 与外部工具/数据的标准化通信协议
Agent：智能体，LLM + MCP 工具整合后实现实际任务执行
RAG：检索增强生成，通过外部知识检索解决 LLM 幻觉问题
Embedding：向量化，词→固定长度浮点数向量，计算语义距离
vLLM：PagedAttention 与连续批处理的 LLM 推理优化框架
Token：LLM 基本输入单元，中文约 0.6 token/字符
数据蒸馏：用大模型生成精简数据训练小模型的技术
向量数据库：存储 Embedding 向量并支持相似度检索的数据库

Key Entities

OpenAI：GPT 系列模型发布方，LLM 领域标杆
Anthropic：Claude 系列模型发布方
LangChain：LLM 应用开发框架
Qwen：通义千问大模型
BAAI：Embedding 模型开源方

Connections

LLM ← 包含 ← Agent + RAG + Prompt工程
Agent ← 依赖 ← LLM + MCP
MCP ← 连接 ← Agent + 外部工具/数据
RAG ← 依赖 ← 向量数据库 + 嵌入向量 + LLM
vLLM ← 优化 ← LLM 推理性能
数据蒸馏 ← 使用 ← LLM 生成训练数据 → 训练小模型
Token ← 计量单位 ← LLM 输入输出

Contradictions

与 RAG（RAG从入门到精通系列1基础RAG）重复：两文档均介绍 RAG，本文档侧重术语定义，该文档侧重实操流程
- 当前观点：本文档作为术语参考，该文档作为实操指南
- 对方观点：可合并为单一综合文档