nexus/wiki/sources/大模型相关术语和框架总结.md at dc6e698ae0b67134501b573953cc754e07c1ca1e

ishenwei/nexus

Files

weishen aec1052b8e feat(wiki): deep ingest batch 3 (19 source pages, AI dir focus)

2026-04-14 21:56:47 +08:00

title, type, tags, date, source, author

title

type

Source File

LLM：≥1B 参数的语言模型；GPT-2=1.5B、GPT-3=175B；分底座（通用）和专有（专项）两类
Prompt：输入 LLM 的提示词，是与大模型交互的唯一接口
MCP（模型上下文协议）：LLM 连接外部数据源/工具的标准化协议；大模型只告诉你"该调用什么工具"，实际调用需通过 MCP Client→Server 执行
Agent = LLM + MCP：LLM 输出步骤，Agent 执行动作；LLM 给你"发邮件的方法"，Agent 真正发出邮件
RAG（检索增强生成）：解决 LLM 幻觉问题；检索外部知识库→将 chunk+问题输入 LLM→基于上下文生成；比做给"天才大脑"配"图书馆助理"
Embedding（向量化）：词→浮点数向量→计算语义距离；"一百"到"两百"比到"一千"更近
LangChain：快速构建 Agent 的开发框架，标准接口连接 LLM、工具、数据源
vLLM：高效 GPU 推理引擎；核心：PagedAttention（KV Cache 分块管理）+ 连续批处理（减少 GPU 空载）
Token：基本输入单元；1英文字符≈0.3 Token；1中文字符≈0.6 Token
数据蒸馏（Data Distillation）：用大模型生成精简高质量训练数据，蒸馏到小模型使其逼近大模型效果

"大模型是不会自己去调用外部数据源或者工具的，大模型只会告诉我们需要调用哪些工具，而我们需要自己去实现工具的调用。" "LLM 复习局限于特定的数据集，面对陌生领域会'写一个解字然后放飞自我'，RAG 给了提示，让正确率从 60% 到 90%。"