--- title: "Large Language Model" type: concept tags: [llm, ai, nlp] last_updated: 2025-04-23 --- ## Definition 大语言模型(Large Language Model,LLM)是基于大规模预训练的深度学习模型,能够理解和生成人类语言,在推理与生成方面表现出色。 ## Core Characteristics - **知识截止日期**:LLM 的知识基于训练数据,存在固定的时间节点,无法自动获取最新信息 - **推理能力强**:能够进行复杂推理、代码生成、文本创作等任务 - **幻觉问题**:可能生成看似合理但实际错误的内容(幻觉) ## Role in AI System Architecture - **思考层**:LLM 作为 AI 系统的"天才大脑",负责逻辑推理和内容生成 - 与 [[RAG]] 配合获取实时信息 - 与 [[AI Agent]] 配合实现自主行动 ## Related Concepts - [[RAG]] — 补充实时知识,降低幻觉 - [[AI Agent]] — 提供行动能力 - [[ReAct Pattern]] — 推理-行动协同模式 ## Sources - [[llms-rag-ai-agent-三个到底什么区别]]