Files
nexus/wiki/sources/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md
2026-04-16 13:01:42 +08:00

64 lines
3.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "大模型相关术语和框架总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏"
type: source
tags: [LLM, AI术语, 技术框架]
date: 2025-12-20
---
## Source File
- [[raw/未分类/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md]]
## Summary
- 核心主题AI/LLM 领域核心技术术语和技术框架的系统性梳理
- 问题域AI 领域术语繁多、更新快、概念容易混淆,初学者和从业者均需要系统性参考
- 方法/机制:按功能分层(模型→协议→架构→优化→数据),从定义到关联完整覆盖
- 结论/价值:建立统一的 AI 技术术语认知框架,便于跨团队沟通和技术选型决策
## Key Claims
- LLM大型语言模型≥1B 参数为"大模型"门槛GPT-21.5B、GPT-3175B、GPT-4未公开
- Prompt提示词人与 LLM 的协作协议,核心是消除信息差,引导模型按预期方式响应
- MCP模型上下文协议标准化 LLM 与外部工具/数据的通信协议MCP Server 负责实际执行LLM 只给步骤
- Agent智能体LLM + MCP 工具 = 可执行任务的智能体,大模型负责推理,工具负责执行
- RAG检索增强生成通过检索外部知识解决 LLM 幻觉,考试正确率从 60% 提升至 90%
- Embedding向量化词→浮点数向量计算语义距离一百和两百距离近一百和一千距离远
- LangChain快速构建 Agent 的开发框架,提供 160+ 文档加载器和工具链
- vLLM通过 PagedAttention块式 KV Cache+ 连续批处理优化 GPU 利用率,是当前最高效的 LLM 推理框架之一
- TokenLLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符API 按 Token 计费
- 数据蒸馏:用大模型生成精简数据训练小模型,用高质量合成数据弥补小模型能力差距
## Key Quotes
> "MCP 协议的核心约束:大模型不执行实际调用,只给出步骤建议,实际执行由 MCP Server 负责"
## Key Concepts
- [[LLM]]大型语言模型≥1B 参数的语言模型为"大模型"门槛
- [[Prompt工程]]:人与 LLM 协作协议的设计与优化
- [[MCP]]Model Context ProtocolLLM 与外部工具/数据的标准化通信协议
- [[Agent]]智能体LLM + MCP 工具整合后实现实际任务执行
- [[RAG]]:检索增强生成,通过外部知识检索解决 LLM 幻觉问题
- [[Embedding]]:向量化,词→固定长度浮点数向量,计算语义距离
- [[vLLM]]PagedAttention 与连续批处理的 LLM 推理优化框架
- [[Token]]LLM 基本输入单元,中文约 0.6 token/字符
- [[数据蒸馏]]:用大模型生成精简数据训练小模型的技术
- [[向量数据库]]:存储 Embedding 向量并支持相似度检索的数据库
## Key Entities
- [[OpenAI]]GPT 系列模型发布方LLM 领域标杆
- [[Anthropic]]Claude 系列模型发布方
- [[LangChain]]LLM 应用开发框架
- [[Qwen]]:通义千问大模型
- [[BAAI]]Embedding 模型开源方
## Connections
- [[LLM]] ← 包含 ← [[Agent]] + [[RAG]] + [[Prompt工程]]
- [[Agent]] ← 依赖 ← [[LLM]] + [[MCP]]
- [[MCP]] ← 连接 ← [[Agent]] + 外部工具/数据
- [[RAG]] ← 依赖 ← [[向量数据库]] + [[嵌入向量]] + [[LLM]]
- [[vLLM]] ← 优化 ← [[LLM]] 推理性能
- [[数据蒸馏]] ← 使用 ← [[LLM]] 生成训练数据 → 训练小模型
- [[Token]] ← 计量单位 ← LLM 输入输出
## Contradictions
- 与 [[RAG]]RAG从入门到精通系列1基础RAG重复两文档均介绍 RAG本文档侧重术语定义该文档侧重实操流程
- 当前观点:本文档作为术语参考,该文档作为实操指南
- 对方观点:可合并为单一综合文档