36 lines
1.4 KiB
Markdown
36 lines
1.4 KiB
Markdown
---
|
||
title: "LLM"
|
||
type: concept
|
||
tags: [llm, ai, 大语言模型]
|
||
date: 2026-04-18
|
||
---
|
||
|
||
## Definition
|
||
大型语言模型(Large Language Model),AI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。
|
||
|
||
## Core Characteristics
|
||
- **知识截止时间**:LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月
|
||
- **静态知识**:只能回答训练数据范围内的问题,无法直接获取实时信息
|
||
- **推理能力**:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等
|
||
|
||
## LLM Types
|
||
- **底座大模型(Base Model)**:通用模型,如 ChatGPT、DeepSeek、Qwen
|
||
- **专有模型(Specialized Model)**:专项训练的模型,如:
|
||
- 绘画模型:Midjourney、Stable Diffusion、Flux
|
||
- 编程模型:Claude、Cursor
|
||
|
||
## Limitations
|
||
1. 无法直接获取实时信息
|
||
2. 对当前情况一无所知
|
||
3. 可能产生幻觉(胡编乱造)
|
||
|
||
## Solution: Combine with RAG and Agent
|
||
最佳实践架构:
|
||
- **LLM**:用于思考和推理
|
||
- **RAG**:用于提供实时外部知识(认知)
|
||
- **Agent**:用于自主决策和执行
|
||
|
||
## Related Concepts
|
||
- [[RAG]]:为 LLM 提供外部实时知识
|
||
- [[AI代理]]:基于 LLM 构建的自主行动系统
|
||
- [[向量数据库]]:RAG 系统的基础设施 |