11 KiB
title, last_updated
| title | last_updated |
|---|---|
| Wiki Overview | 2026-04-15 |
LLM Wiki Overview
核心主题
AI开源生态在2025年取得突破性进展,国产模型在多个领域成为国际闭源产品的有力替代。同时,DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。
主要领域
- 大语言模型:DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
- AI生图:Flux和Stable Diffusion主导开源生态,Flux在人体解剖学正确性上表现最佳
- AI生视频:HunyuanVideo以最大参数量成为开源视频生成标杆
- 通用智能体:Manus定义AI Agent元年,OpenManus提供开源实现
- AI编程:Cline将VS Code变身全自动AI工程师
- 智能体工作流:n8n(16万Star)和Dify实现可视化AI流程编排
- AI搜索:Perplexica实现完全本地化的开源搜索
- DevOps 文化与转型:四大支柱驱动组织数字化交付能力
关键趋势
- 深度推理让AI学会"慢思考"
- 开源内卷将价格打成白菜价
- 国产开源模型在多个领域实现差异化竞争
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进
新增领域:Claude Skills 与流程工程
Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库(github.com/anthropics/skills)收藏数突破 3.2 万,包含生产级 Skills:办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。
关键概念
资源生态
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com
新增领域:NotebookLM 与 Source-Grounding
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。可作为被动学习(Audio Overviews)、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。
关键能力
- Source-Grounding:消除幻觉,确保回答可溯源
- 被动学习:Audio Overviews 在碎片时间消费复杂信息
- 引文追溯:每个回答附带原文引文
新增领域:AI图生视频
2025年底,AI图生视频技术快速成熟,14款免费工具已能生成高质量视频,覆盖电商模特、内容创作、广告制作等多场景。
主要产品
- 绘蛙AI视频(阿里巴巴):模特图转视频,操作简便
- 智谱清影(智谱AI):30秒生成6秒高清视频,支持风格选择
- Vidu(生数科技+清华大学):全球首个"多主体参考"功能
- 可灵AI(快手):3D时空联合注意力,物理逻辑动作生成
- 海螺AI(MiniMax):主体一致性保持,光影色调高度一致
- Stable Video(Stability AI):LoRA摄像机精细控制
关键能力
新增领域:DevOps 文化与转型
核心框架
DevOps 建立在四大支柱之上:协作优先于孤岛、自动化即赋能者、持续改进(Kaizen)、客户中心。
关键实践
- CI/CD Pipelines:自动化构建、测试、部署流水线(Jenkins、GitHub Actions、GitLab CI)
- Infrastructure as Code:以代码管理基础设施(Terraform、AWS CloudFormation)
- DevSecOps:在 CI/CD 中内置安全(SonarQube、Snyk)
- GitOps:以 Git 为单一真实源管理配置
工具生态
- 监控可观测性:Prometheus、Grafana、Datadog
- 容器化:Docker、Kubernetes
- 配置管理:Ansible(Red Hat)
未来趋势
- AI/ML 赋能 DevOps(代码审查智能自动化、异常检测、自愈基础设施)
- Serverless DevOps:FaaS 减少运维开销
- Edge Computing DevOps:边缘节点实时应用优化
新增领域:Nano Banana 结构化提示词框架
Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段(Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives)将创意描述转化为机器可执行参数。
关键机制
- negatives(负向提示词)是质量控制关键字段
- camera 字段提供电影级构图控制(焦距/光圈/角度)
- 物件描述框架与人物描述框架共用同一结构,subject 字段内容不同
关键概念
- Nano Banana:Google 发布的结构化图像提示词框架
- 负向提示词:明确排除不需要的特征
新增领域:Claude + n8n-mcp AI 工作流自动生成
Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。
核心机制
- n8n-mcp:提供 543 个 n8n 节点的结构化访问,271 个 AI 能力节点
- Claude 自动生成工作流完成度约 80%-90%,10%-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
关键能力
新增领域:MCP 在 Cursor 中的集成
MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。
核心机制
- MCP:Client-Server 架构,3 种接口(资源读取/工具调用/Promise 提示词)
- Composer:Cursor 对话模块,支持 Agent 模式和 Normal 模式
- Agent模式:自动执行 MCP 工具链,减少手动操作
- Sequential Thinking:逻辑推理分步工具,提升 AI 决策质量
关键区分
- Agent 模式:工具链自动串联
- Normal 模式:需手动复制命令
- enable yolo mode:风险高,默认关闭
新增领域:Google 5 种 Agent Skill 设计模式
Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。
5 种模式
- Tool Wrapper:监听关键词动态加载规范文档,适合团队编码规范分发
- Generator:通过"填空"流程强制一致输出格式
- Reviewer:分离检查清单与检查逻辑,换清单即换审计类型
- Inversion:agent 先问你再做,逐阶段收集信息
- Pipeline:带硬性检查点的严格顺序工作流
Anthropic 补充
- 最好的 Skill = 工具箱,而非"写好的提示词"
- 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
- 5 种模式可组合(Pipeline 包含 Reviewer、Generator 依赖 Inversion)
关键能力
- 渐进式披露:ADK 机制,agent 只在需要时才加载特定 token
新增领域:Claude Code 调用模式
OpenClaw/Hermes 通过 terminal 工具调用 Claude Code,两种核心模式满足不同场景需求。
关键机制
- Print Mode:stdin 管道非交互模式,适合绝大多数编程任务
- TMUX交互模式:tmux session 交互模式,适合超长任务
--permission-mode bypassPermissions跳过所有交互确认,是自动化调用的必要条件--add-dir自动扫描 SKILL.md 并在触发条件匹配时激活
关键区分
- delegate_task 仅调用 Hermes 子 agent,无法建立 Claude Code CLI 通道
- Skill 调用必须使用 terminal + claude -p
新增领域:LLM 核心术语与技术框架
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
核心概念
- LLM:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B)
- MCP:Model Context Protocol,LLM 与外部工具的标准化通信协议
- Agent:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
- RAG:Retrieval-augmented generation,通过检索增强解决幻觉问题(考试正确率 60%→90%)
- Embedding:向量化,将词转化为浮点数字计算语义距离
- vLLM:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率
- Token:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
- 数据蒸馏:用大模型生成精简数据训练小模型
关键洞察
- MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
- vLLM 推理优化:PagedAttention 避免内存碎片化,连续批处理减少头阻塞
新增领域:Vibe Coding 氛围编程
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。
核心方法论
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
- 规划是一切:技术选型、实施规划、模块化设计
- AI 工具(Cursor、Windsurf、Trae)承担体力活
推荐资源
- vibe-coding-cn:中文开发者 Vibe Coding 资源库与工作站
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合
新增领域:Agentic AI 赋能 Cloud DevOps
Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。
七大应用场景
- 自主检测与修复:K8s、数据库、存储异常自动修复(MTTR 降低)
- 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
- 成本优化:动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
- 安全合规:IAM 策略扫描、容器漏洞检测、实时修复
- 日志分析与可观测性:AI 驱动的根因分析
- 多租户 SaaS 管理:自动化创建、配置、归档租户
- AI 增强决策:What-If 模拟、异常检测
关键能力
- Self-Healing Systems:自愈系统,异常检测 + 自动修复
- Multi-Cloud Governance:跨 AWS/GCP/Azure 多云治理
新增领域:OpenClaw Workspace 架构
OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。
核心文件
- AGENTS.md:岗位职责说明书(300-500 字最佳),定义边界而非仅列能力
- SOUL.md:性格档案(叙事性角色设定),与 IDENTITY.md 分工明确
- USER.md:用户偏好固化,减少重复交代
- TOOLS.md:工具权限规范,核心是"什么时候不用"
- IDENTITY.md:结构化身份元数据(Name/Creature/Vibe/Emoji/Avatar)
- BOOTSTRAP.md:一次性初始化引导,完成后删除
- 长期记忆:memory/ 目录,Agent 跨会话保留重要信息
核心价值
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。