--- title: "LLM" type: concept tags: [llm, ai, 大语言模型] date: 2026-04-18 --- ## Definition 大型语言模型(Large Language Model),AI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。 ## Core Characteristics - **知识截止时间**:LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月 - **静态知识**:只能回答训练数据范围内的问题,无法直接获取实时信息 - **推理能力**:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等 ## LLM Types - **底座大模型(Base Model)**:通用模型,如 ChatGPT、DeepSeek、Qwen - **专有模型(Specialized Model)**:专项训练的模型,如: - 绘画模型:Midjourney、Stable Diffusion、Flux - 编程模型:Claude、Cursor ## Limitations 1. 无法直接获取实时信息 2. 对当前情况一无所知 3. 可能产生幻觉(胡编乱造) ## Solution: Combine with RAG and Agent 最佳实践架构: - **LLM**:用于思考和推理 - **RAG**:用于提供实时外部知识(认知) - **Agent**:用于自主决策和执行 ## Related Concepts - [[RAG]]:为 LLM 提供外部实时知识 - [[AI代理]]:基于 LLM 构建的自主行动系统 - [[向量数据库]]:RAG 系统的基础设施