nexus/wiki/concepts/LLM.md

---
title: "LLM"
type: concept
tags: [llm, ai, 大语言模型]
date: 2026-04-18
---

## Definition
大型语言模型（Large Language Model），AI 应用的"天才大脑"，学习了过去上下五千年的所有知识，擅长思考和推理，但对当前情况一无所知。

## Core Characteristics
- **知识截止时间**：LLM 的知识有训练数据的时间节点限制，例如 ChatGPT-5 的知识截止到 2024 年 6 月
- **静态知识**：只能回答训练数据范围内的问题，无法直接获取实时信息
- **推理能力**：在思考方面非常出色，可以帮助写文章、分析问题、编程、画画等

## LLM Types
- **底座大模型（Base Model）**：通用模型，如 ChatGPT、DeepSeek、Qwen
- **专有模型（Specialized Model）**：专项训练的模型，如：
  - 绘画模型：Midjourney、Stable Diffusion、Flux
  - 编程模型：Claude、Cursor

## Limitations
1. 无法直接获取实时信息
2. 对当前情况一无所知
3. 可能产生幻觉（胡编乱造）

## Solution: Combine with RAG and Agent
最佳实践架构：
- **LLM**：用于思考和推理
- **RAG**：用于提供实时外部知识（认知）
- **Agent**：用于自主决策和执行

## Related Concepts
- [[RAG]]：为 LLM 提供外部实时知识
- [[AI代理]]：基于 LLM 构建的自主行动系统
- [[向量数据库]]：RAG 系统的基础设施