Files
nexus/wiki/concepts/LLM.md
2026-04-18 03:18:06 +08:00

36 lines
1.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "LLM"
type: concept
tags: [llm, ai, 大语言模型]
date: 2026-04-18
---
## Definition
大型语言模型Large Language ModelAI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。
## Core Characteristics
- **知识截止时间**LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月
- **静态知识**:只能回答训练数据范围内的问题,无法直接获取实时信息
- **推理能力**:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等
## LLM Types
- **底座大模型Base Model**:通用模型,如 ChatGPT、DeepSeek、Qwen
- **专有模型Specialized Model**:专项训练的模型,如:
- 绘画模型Midjourney、Stable Diffusion、Flux
- 编程模型Claude、Cursor
## Limitations
1. 无法直接获取实时信息
2. 对当前情况一无所知
3. 可能产生幻觉(胡编乱造)
## Solution: Combine with RAG and Agent
最佳实践架构:
- **LLM**:用于思考和推理
- **RAG**:用于提供实时外部知识(认知)
- **Agent**:用于自主决策和执行
## Related Concepts
- [[RAG]]:为 LLM 提供外部实时知识
- [[AI代理]]:基于 LLM 构建的自主行动系统
- [[向量数据库]]RAG 系统的基础设施