1.4 KiB
1.4 KiB
title, type, tags, date
| title | type | tags | date | |||
|---|---|---|---|---|---|---|
| LLM | concept |
|
2026-04-18 |
Definition
大型语言模型(Large Language Model),AI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。
Core Characteristics
- 知识截止时间:LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月
- 静态知识:只能回答训练数据范围内的问题,无法直接获取实时信息
- 推理能力:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等
LLM Types
- 底座大模型(Base Model):通用模型,如 ChatGPT、DeepSeek、Qwen
- 专有模型(Specialized Model):专项训练的模型,如:
- 绘画模型:Midjourney、Stable Diffusion、Flux
- 编程模型:Claude、Cursor
Limitations
- 无法直接获取实时信息
- 对当前情况一无所知
- 可能产生幻觉(胡编乱造)
Solution: Combine with RAG and Agent
最佳实践架构:
- LLM:用于思考和推理
- RAG:用于提供实时外部知识(认知)
- Agent:用于自主决策和执行