Files
nexus/wiki/sources/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md
2026-04-16 13:01:42 +08:00

3.7 KiB
Raw Blame History

title, type, tags, date
title type tags date
大模型相关术语和框架总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏 source
LLM
AI术语
技术框架
2025-12-20

Source File

Summary

  • 核心主题AI/LLM 领域核心技术术语和技术框架的系统性梳理
  • 问题域AI 领域术语繁多、更新快、概念容易混淆,初学者和从业者均需要系统性参考
  • 方法/机制:按功能分层(模型→协议→架构→优化→数据),从定义到关联完整覆盖
  • 结论/价值:建立统一的 AI 技术术语认知框架,便于跨团队沟通和技术选型决策

Key Claims

  • LLM大型语言模型≥1B 参数为"大模型"门槛GPT-21.5B、GPT-3175B、GPT-4未公开
  • Prompt提示词人与 LLM 的协作协议,核心是消除信息差,引导模型按预期方式响应
  • MCP模型上下文协议标准化 LLM 与外部工具/数据的通信协议MCP Server 负责实际执行LLM 只给步骤
  • Agent智能体LLM + MCP 工具 = 可执行任务的智能体,大模型负责推理,工具负责执行
  • RAG检索增强生成通过检索外部知识解决 LLM 幻觉,考试正确率从 60% 提升至 90%
  • Embedding向量化词→浮点数向量计算语义距离一百和两百距离近一百和一千距离远
  • LangChain快速构建 Agent 的开发框架,提供 160+ 文档加载器和工具链
  • vLLM通过 PagedAttention块式 KV Cache+ 连续批处理优化 GPU 利用率,是当前最高效的 LLM 推理框架之一
  • TokenLLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符API 按 Token 计费
  • 数据蒸馏:用大模型生成精简数据训练小模型,用高质量合成数据弥补小模型能力差距

Key Quotes

"MCP 协议的核心约束:大模型不执行实际调用,只给出步骤建议,实际执行由 MCP Server 负责"

Key Concepts

  • LLM大型语言模型≥1B 参数的语言模型为"大模型"门槛
  • Prompt工程:人与 LLM 协作协议的设计与优化
  • MCPModel Context ProtocolLLM 与外部工具/数据的标准化通信协议
  • Agent智能体LLM + MCP 工具整合后实现实际任务执行
  • RAG:检索增强生成,通过外部知识检索解决 LLM 幻觉问题
  • Embedding:向量化,词→固定长度浮点数向量,计算语义距离
  • vLLMPagedAttention 与连续批处理的 LLM 推理优化框架
  • TokenLLM 基本输入单元,中文约 0.6 token/字符
  • 数据蒸馏:用大模型生成精简数据训练小模型的技术
  • 向量数据库:存储 Embedding 向量并支持相似度检索的数据库

Key Entities

  • OpenAIGPT 系列模型发布方LLM 领域标杆
  • AnthropicClaude 系列模型发布方
  • LangChainLLM 应用开发框架
  • Qwen:通义千问大模型
  • BAAIEmbedding 模型开源方

Connections

Contradictions

  • RAGRAG从入门到精通系列1基础RAG重复两文档均介绍 RAG本文档侧重术语定义该文档侧重实操流程
    • 当前观点:本文档作为术语参考,该文档作为实操指南
    • 对方观点:可合并为单一综合文档