Auto-sync: 2026-04-18 03:18

This commit is contained in:
2026-04-18 03:18:06 +08:00
parent da0f9c3594
commit b78ac81f2c
34 changed files with 981 additions and 21 deletions

36
wiki/concepts/LLM.md Normal file
View File

@@ -0,0 +1,36 @@
---
title: "LLM"
type: concept
tags: [llm, ai, 大语言模型]
date: 2026-04-18
---
## Definition
大型语言模型Large Language ModelAI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。
## Core Characteristics
- **知识截止时间**LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月
- **静态知识**:只能回答训练数据范围内的问题,无法直接获取实时信息
- **推理能力**:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等
## LLM Types
- **底座大模型Base Model**:通用模型,如 ChatGPT、DeepSeek、Qwen
- **专有模型Specialized Model**:专项训练的模型,如:
- 绘画模型Midjourney、Stable Diffusion、Flux
- 编程模型Claude、Cursor
## Limitations
1. 无法直接获取实时信息
2. 对当前情况一无所知
3. 可能产生幻觉(胡编乱造)
## Solution: Combine with RAG and Agent
最佳实践架构:
- **LLM**:用于思考和推理
- **RAG**:用于提供实时外部知识(认知)
- **Agent**:用于自主决策和执行
## Related Concepts
- [[RAG]]:为 LLM 提供外部实时知识
- [[AI代理]]:基于 LLM 构建的自主行动系统
- [[向量数据库]]RAG 系统的基础设施