Files
nexus/wiki/concepts/LLM.md
2026-04-18 03:18:06 +08:00

1.4 KiB
Raw Blame History

title, type, tags, date
title type tags date
LLM concept
llm
ai
大语言模型
2026-04-18

Definition

大型语言模型Large Language ModelAI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。

Core Characteristics

  • 知识截止时间LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月
  • 静态知识:只能回答训练数据范围内的问题,无法直接获取实时信息
  • 推理能力:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等

LLM Types

  • 底座大模型Base Model:通用模型,如 ChatGPT、DeepSeek、Qwen
  • 专有模型Specialized Model:专项训练的模型,如:
    • 绘画模型Midjourney、Stable Diffusion、Flux
    • 编程模型Claude、Cursor

Limitations

  1. 无法直接获取实时信息
  2. 对当前情况一无所知
  3. 可能产生幻觉(胡编乱造)

Solution: Combine with RAG and Agent

最佳实践架构:

  • LLM:用于思考和推理
  • RAG:用于提供实时外部知识(认知)
  • Agent:用于自主决策和执行
  • RAG:为 LLM 提供外部实时知识
  • AI代理:基于 LLM 构建的自主行动系统
  • 向量数据库RAG 系统的基础设施