28 lines
1.0 KiB
Markdown
28 lines
1.0 KiB
Markdown
---
|
||
title: "Large Language Model"
|
||
type: concept
|
||
tags: [llm, ai, nlp]
|
||
last_updated: 2025-04-23
|
||
---
|
||
|
||
## Definition
|
||
大语言模型(Large Language Model,LLM)是基于大规模预训练的深度学习模型,能够理解和生成人类语言,在推理与生成方面表现出色。
|
||
|
||
## Core Characteristics
|
||
- **知识截止日期**:LLM 的知识基于训练数据,存在固定的时间节点,无法自动获取最新信息
|
||
- **推理能力强**:能够进行复杂推理、代码生成、文本创作等任务
|
||
- **幻觉问题**:可能生成看似合理但实际错误的内容(幻觉)
|
||
|
||
## Role in AI System Architecture
|
||
- **思考层**:LLM 作为 AI 系统的"天才大脑",负责逻辑推理和内容生成
|
||
- 与 [[RAG]] 配合获取实时信息
|
||
- 与 [[AI Agent]] 配合实现自主行动
|
||
|
||
## Related Concepts
|
||
- [[RAG]] — 补充实时知识,降低幻觉
|
||
- [[AI Agent]] — 提供行动能力
|
||
- [[ReAct Pattern]] — 推理-行动协同模式
|
||
|
||
## Sources
|
||
- [[llms-rag-ai-agent-三个到底什么区别]]
|