Auto-sync: 2026-04-16 13:01

This commit is contained in:
2026-04-16 13:01:38 +08:00
parent c0571d778c
commit b2250c60b2
59 changed files with 1288 additions and 2670 deletions

View File

@@ -0,0 +1,63 @@
---
title: "大模型相关术语和框架总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏"
type: source
tags: [LLM, AI术语, 技术框架]
date: 2025-12-20
---
## Source File
- [[raw/未分类/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md]]
## Summary
- 核心主题AI/LLM 领域核心技术术语和技术框架的系统性梳理
- 问题域AI 领域术语繁多、更新快、概念容易混淆,初学者和从业者均需要系统性参考
- 方法/机制:按功能分层(模型→协议→架构→优化→数据),从定义到关联完整覆盖
- 结论/价值:建立统一的 AI 技术术语认知框架,便于跨团队沟通和技术选型决策
## Key Claims
- LLM大型语言模型≥1B 参数为"大模型"门槛GPT-21.5B、GPT-3175B、GPT-4未公开
- Prompt提示词人与 LLM 的协作协议,核心是消除信息差,引导模型按预期方式响应
- MCP模型上下文协议标准化 LLM 与外部工具/数据的通信协议MCP Server 负责实际执行LLM 只给步骤
- Agent智能体LLM + MCP 工具 = 可执行任务的智能体,大模型负责推理,工具负责执行
- RAG检索增强生成通过检索外部知识解决 LLM 幻觉,考试正确率从 60% 提升至 90%
- Embedding向量化词→浮点数向量计算语义距离一百和两百距离近一百和一千距离远
- LangChain快速构建 Agent 的开发框架,提供 160+ 文档加载器和工具链
- vLLM通过 PagedAttention块式 KV Cache+ 连续批处理优化 GPU 利用率,是当前最高效的 LLM 推理框架之一
- TokenLLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符API 按 Token 计费
- 数据蒸馏:用大模型生成精简数据训练小模型,用高质量合成数据弥补小模型能力差距
## Key Quotes
> "MCP 协议的核心约束:大模型不执行实际调用,只给出步骤建议,实际执行由 MCP Server 负责"
## Key Concepts
- [[LLM]]大型语言模型≥1B 参数的语言模型为"大模型"门槛
- [[Prompt工程]]:人与 LLM 协作协议的设计与优化
- [[MCP]]Model Context ProtocolLLM 与外部工具/数据的标准化通信协议
- [[Agent]]智能体LLM + MCP 工具整合后实现实际任务执行
- [[RAG]]:检索增强生成,通过外部知识检索解决 LLM 幻觉问题
- [[Embedding]]:向量化,词→固定长度浮点数向量,计算语义距离
- [[vLLM]]PagedAttention 与连续批处理的 LLM 推理优化框架
- [[Token]]LLM 基本输入单元,中文约 0.6 token/字符
- [[数据蒸馏]]:用大模型生成精简数据训练小模型的技术
- [[向量数据库]]:存储 Embedding 向量并支持相似度检索的数据库
## Key Entities
- [[OpenAI]]GPT 系列模型发布方LLM 领域标杆
- [[Anthropic]]Claude 系列模型发布方
- [[LangChain]]LLM 应用开发框架
- [[Qwen]]:通义千问大模型
- [[BAAI]]Embedding 模型开源方
## Connections
- [[LLM]] ← 包含 ← [[Agent]] + [[RAG]] + [[Prompt工程]]
- [[Agent]] ← 依赖 ← [[LLM]] + [[MCP]]
- [[MCP]] ← 连接 ← [[Agent]] + 外部工具/数据
- [[RAG]] ← 依赖 ← [[向量数据库]] + [[嵌入向量]] + [[LLM]]
- [[vLLM]] ← 优化 ← [[LLM]] 推理性能
- [[数据蒸馏]] ← 使用 ← [[LLM]] 生成训练数据 → 训练小模型
- [[Token]] ← 计量单位 ← LLM 输入输出
## Contradictions
- 与 [[RAG]]RAG从入门到精通系列1基础RAG重复两文档均介绍 RAG本文档侧重术语定义该文档侧重实操流程
- 当前观点:本文档作为术语参考,该文档作为实操指南
- 对方观点:可合并为单一综合文档