Files

2026-04-15 15:02:52 +08:00

11 KiB

Raw Blame History

title, last_updated

title	last_updated
Wiki Overview	2026-04-15

LLM Wiki Overview

核心主题

AI开源生态在2025年取得突破性进展，国产模型在多个领域成为国际闭源产品的有力替代。同时，DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。

主要领域

大语言模型：DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
AI生图：Flux和Stable Diffusion主导开源生态，Flux在人体解剖学正确性上表现最佳
AI生视频：HunyuanVideo以最大参数量成为开源视频生成标杆
通用智能体：Manus定义AI Agent元年，OpenManus提供开源实现
AI编程：Cline将VS Code变身全自动AI工程师
智能体工作流：n8n（16万Star）和Dify实现可视化AI流程编排
AI搜索：Perplexica实现完全本地化的开源搜索
DevOps 文化与转型：四大支柱驱动组织数字化交付能力

关键趋势

深度推理让AI学会"慢思考"
开源内卷将价格打成白菜价
国产开源模型在多个领域实现差异化竞争
DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进

新增领域：Claude Skills 与流程工程

Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP，将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库（github.com/anthropics/skills）收藏数突破 3.2 万，包含生产级 Skills：办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。

关键概念

AI技能封装：将固定流程任务拆解为 AI 可理解的结构化流程
流程工程：将经验沉淀为 SOP 再交给 AI 稳定执行的新范式
Anthropic ← 发布方

资源生态

三大 Awesome 仓库：ComposioHQ、VoltAgent、BehiSecc
三大聚合站：skillsmp.com、aitmpl.com、claudemarketplaces.com

新增领域：NotebookLM 与 Source-Grounding

NotebookLM 通过 Source-Grounding 机制（严格限制知识库仅含上传文档）实现高精度回答，每个答案附带精确引文。可作为被动学习（Audio Overviews）、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。

关键能力

Source-Grounding：消除幻觉，确保回答可溯源
被动学习：Audio Overviews 在碎片时间消费复杂信息
引文追溯：每个回答附带原文引文

新增领域：AI图生视频

2025年底，AI图生视频技术快速成熟，14款免费工具已能生成高质量视频，覆盖电商模特、内容创作、广告制作等多场景。

主要产品

绘蛙AI视频（阿里巴巴）：模特图转视频，操作简便
智谱清影（智谱AI）：30秒生成6秒高清视频，支持风格选择
Vidu（生数科技+清华大学）：全球首个"多主体参考"功能
可灵AI（快手）：3D时空联合注意力，物理逻辑动作生成
海螺AI（MiniMax）：主体一致性保持，光影色调高度一致
Stable Video（Stability AI）：LoRA摄像机精细控制

关键能力

图生视频：静态图片转动态视频
主体一致性：视频中保持角色外观一致
运动控制：文本提示词控制主体运动
运镜控制：模拟摄像机运动控制画面视角

新增领域：DevOps 文化与转型

核心框架

DevOps 建立在四大支柱之上：协作优先于孤岛、自动化即赋能者、持续改进（Kaizen）、客户中心。

关键实践

CI/CD Pipelines：自动化构建、测试、部署流水线（Jenkins、GitHub Actions、GitLab CI）
Infrastructure as Code：以代码管理基础设施（Terraform、AWS CloudFormation）
DevSecOps：在 CI/CD 中内置安全（SonarQube、Snyk）
GitOps：以 Git 为单一真实源管理配置

工具生态

监控可观测性：Prometheus、Grafana、Datadog
容器化：Docker、Kubernetes
配置管理：Ansible（Red Hat）

未来趋势

AI/ML 赋能 DevOps（代码审查智能自动化、异常检测、自愈基础设施）
Serverless DevOps：FaaS 减少运维开销
Edge Computing DevOps：边缘节点实时应用优化

新增领域：Nano Banana 结构化提示词框架

Google Nano Banana 是图像生成提示词的结构化框架，通过 9 个标准化字段（Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives）将创意描述转化为机器可执行参数。

关键机制

negatives（负向提示词）是质量控制关键字段
camera 字段提供电影级构图控制（焦距/光圈/角度）
物件描述框架与人物描述框架共用同一结构，subject 字段内容不同

关键概念

Nano Banana：Google 发布的结构化图像提示词框架
负向提示词：明确排除不需要的特征

新增领域：Claude + n8n-mcp AI 工作流自动生成

Claude 与 n8n-mcp 结合，通过自然语言直接生成 n8n 工作流，降低自动化门槛。

核心机制

n8n-mcp：提供 543 个 n8n 节点的结构化访问，271 个 AI 能力节点
Claude 自动生成工作流完成度约 80%-90%，10%-20% 错误率需人工修正
选择 Opensea 模型并开启 extended thinking 可显著提升生成质量

关键能力

AI工作流自动生成：自然语言→工作流代码
n8n-mcp：AI 与 n8n 的 MCP 协议桥接

新增领域：MCP 在 Cursor 中的集成

MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。

核心机制

MCP：Client-Server 架构，3 种接口（资源读取/工具调用/Promise 提示词）
Composer：Cursor 对话模块，支持 Agent 模式和 Normal 模式
Agent模式：自动执行 MCP 工具链，减少手动操作
Sequential Thinking：逻辑推理分步工具，提升 AI 决策质量

关键区分

Agent 模式：工具链自动串联
Normal 模式：需手动复制命令
enable yolo mode：风险高，默认关闭

新增领域：Google 5 种 Agent Skill 设计模式

Google Cloud 发布的 Skill 内容结构化设计模式，解决 SKILL.md 格式标准化后执行效果差异大的问题。

5 种模式

Tool Wrapper：监听关键词动态加载规范文档，适合团队编码规范分发
Generator：通过"填空"流程强制一致输出格式
Reviewer：分离检查清单与检查逻辑，换清单即换审计类型
Inversion：agent 先问你再做，逐阶段收集信息
Pipeline：带硬性检查点的严格顺序工作流

Anthropic 补充

最好的 Skill = 工具箱，而非"写好的提示词"
写 Skill 三条铁律：只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
5 种模式可组合（Pipeline 包含 Reviewer、Generator 依赖 Inversion）

关键能力

渐进式披露：ADK 机制，agent 只在需要时才加载特定 token

新增领域：Claude Code 调用模式

OpenClaw/Hermes 通过 terminal 工具调用 Claude Code，两种核心模式满足不同场景需求。

关键机制

Print Mode：stdin 管道非交互模式，适合绝大多数编程任务
TMUX交互模式：tmux session 交互模式，适合超长任务
--permission-mode bypassPermissions 跳过所有交互确认，是自动化调用的必要条件
--add-dir 自动扫描 SKILL.md 并在触发条件匹配时激活

关键区分

delegate_task 仅调用 Hermes 子 agent，无法建立 Claude Code CLI 通道
Skill 调用必须使用 terminal + claude -p

新增领域：LLM 核心术语与技术框架

LLM 技术栈从模型到应用形成完整体系，涵盖参数规模基准、工具调用协议、推理优化等多个维度。

核心概念

LLM：≥1B 参数的语言模型为"大模型"门槛，GPT-2（1.5B）、GPT-3（175B）
MCP：Model Context Protocol，LLM 与外部工具的标准化通信协议
Agent：大模型 + MCP 工具整合后实现实际任务执行，大模型仅输出步骤，执行需依赖 MCP
RAG：Retrieval-augmented generation，通过检索增强解决幻觉问题（考试正确率 60%→90%）
Embedding：向量化，将词转化为浮点数字计算语义距离
vLLM：通过 PagedAttention（块式 KV Cache）和连续批处理优化 GPU 利用率
Token：LLM 基本输入单元，中文约 0.6 token/字符，英文约 0.3 token/字符
数据蒸馏：用大模型生成精简数据训练小模型

关键洞察

MCP 协议核心约束：大模型不执行实际调用，只给出步骤建议
vLLM 推理优化：PagedAttention 避免内存碎片化，连续批处理减少头阻塞

新增领域：Vibe Coding 氛围编程

Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行，让想法到可维护代码成为可审计流水线。

核心方法论

开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
保持对产品逻辑、用户流程、审美和交互的"感觉"
规划是一切：技术选型、实施规划、模块化设计
AI 工具（Cursor、Windsurf、Trae）承担体力活

新增领域：Agentic AI 赋能 Cloud DevOps

Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。

七大应用场景

自主检测与修复：K8s、数据库、存储异常自动修复（MTTR 降低）
智能 IaC 管理：审查 Terraform、CloudFormation、Pulumi 脚本
成本优化：动态扩展、Spot/Reserved 实例优化（夜间负载转移降低 40% 成本）
安全合规：IAM 策略扫描、容器漏洞检测、实时修复
日志分析与可观测性：AI 驱动的根因分析
多租户 SaaS 管理：自动化创建、配置、归档租户
AI 增强决策：What-If 模拟、异常检测

关键能力

Self-Healing Systems：自愈系统，异常检测 + 自动修复
Multi-Cloud Governance：跨 AWS/GCP/Azure 多云治理

新增领域：OpenClaw Workspace 架构

OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。

核心文件

AGENTS.md：岗位职责说明书（300-500 字最佳），定义边界而非仅列能力
SOUL.md：性格档案（叙事性角色设定），与 IDENTITY.md 分工明确
USER.md：用户偏好固化，减少重复交代
TOOLS.md：工具权限规范，核心是"什么时候不用"
IDENTITY.md：结构化身份元数据（Name/Creature/Vibe/Emoji/Avatar）
BOOTSTRAP.md：一次性初始化引导，完成后删除
长期记忆：memory/ 目录，Agent 跨会话保留重要信息

核心价值

从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。

11 KiB Raw Blame History Unescape Escape

LLM Wiki Overview

核心主题

主要领域

关键趋势

新增领域：Claude Skills 与流程工程

关键概念

资源生态

新增领域：NotebookLM 与 Source-Grounding

关键能力

新增领域：AI图生视频

主要产品

关键能力

新增领域：DevOps 文化与转型

核心框架

关键实践

工具生态

未来趋势

新增领域：Nano Banana 结构化提示词框架

关键机制

关键概念

新增领域：Claude + n8n-mcp AI 工作流自动生成

核心机制

关键能力

新增领域：MCP 在 Cursor 中的集成

核心机制

关键区分

新增领域：Google 5 种 Agent Skill 设计模式

5 种模式

Anthropic 补充

关键能力

新增领域：Claude Code 调用模式

关键机制

关键区分

新增领域：LLM 核心术语与技术框架

核心概念

关键洞察

新增领域：Vibe Coding 氛围编程

核心方法论

推荐资源

新增领域：Agentic AI 赋能 Cloud DevOps

七大应用场景

关键能力

新增领域：OpenClaw Workspace 架构

核心文件

核心价值

11 KiB

Raw Blame History