45 lines
1.4 KiB
Markdown
45 lines
1.4 KiB
Markdown
---
|
||
title: "大模型相关术语框架总结"
|
||
type: source
|
||
tags: [LLM, MCP, Prompt, RAG, vLLM, Token]
|
||
date: 2025-12-20
|
||
---
|
||
|
||
## Source File
|
||
- [[raw/AI/大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏.md]]
|
||
|
||
## Summary
|
||
- 核心主题:大模型核心术语和技术框架
|
||
- 问题域:大模型领域术语众多难以系统理解
|
||
- 方法/机制:图解化梳理各术语关系
|
||
- 结论/价值:构建完整的大模型技术知识体系
|
||
|
||
## Key Claims
|
||
- LLM:Large Language Model大模型,≥1B参数
|
||
- Prompt:输入给大模型的语句
|
||
- MCP:Model Context Protocol,标准化接口连接外部数据和工具
|
||
- Agent:LLM+MCP=智能体,大模型给出步骤,实际执行需配合MCP
|
||
- RAG:Retrieval Augmented Generation检索增强生成,解决幻觉问题
|
||
- Embedding:向量化,计算词与词之间的距离
|
||
- vLLM:高效推理框架,KV Cache+连续批处理提升GPU利用率
|
||
- Token:基本输入单元,1英文字符≈0.3 token,1中文字符≈0.6 token
|
||
|
||
## Key Concepts
|
||
- [[LLM]]:大语言模型
|
||
- [[MCP]]:模型上下文协议
|
||
- [[Agent]]:智能体
|
||
- [[RAG]]:检索增强生成
|
||
- [[Embedding]]:向量化
|
||
- [[vLLM]]:高效LLM推理框架
|
||
- [[Token]]:大模型基本输入单元
|
||
|
||
## Key Entities
|
||
|
||
## Connections
|
||
- [[LLM]] ← uses ← [[Token]]
|
||
- [[LLM]] ← uses ← [[MCP]]
|
||
- [[Agent]] ← combines ← [[LLM]] + [[MCP]]
|
||
- [[RAG]] ← extends ← [[LLM]]
|
||
|
||
## Contradictions
|