Files
nexus/wiki/overview.md
2026-04-15 15:02:52 +08:00

11 KiB
Raw Blame History

title, last_updated
title last_updated
Wiki Overview 2026-04-15

LLM Wiki Overview

核心主题

AI开源生态在2025年取得突破性进展国产模型在多个领域成为国际闭源产品的有力替代。同时DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。

主要领域

  1. 大语言模型DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
  2. AI生图Flux和Stable Diffusion主导开源生态Flux在人体解剖学正确性上表现最佳
  3. AI生视频HunyuanVideo以最大参数量成为开源视频生成标杆
  4. 通用智能体Manus定义AI Agent元年OpenManus提供开源实现
  5. AI编程Cline将VS Code变身全自动AI工程师
  6. 智能体工作流n8n16万Star和Dify实现可视化AI流程编排
  7. AI搜索Perplexica实现完全本地化的开源搜索
  8. DevOps 文化与转型:四大支柱驱动组织数字化交付能力

关键趋势

  • 深度推理让AI学会"慢思考"
  • 开源内卷将价格打成白菜价
  • 国产开源模型在多个领域实现差异化竞争
  • DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进

新增领域Claude Skills 与流程工程

Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库github.com/anthropics/skills收藏数突破 3.2 万,包含生产级 Skills办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。

关键概念

  • AI技能封装:将固定流程任务拆解为 AI 可理解的结构化流程
  • 流程工程:将经验沉淀为 SOP 再交给 AI 稳定执行的新范式
  • Anthropic ← 发布方

资源生态

  • 三大 Awesome 仓库ComposioHQ、VoltAgent、BehiSecc
  • 三大聚合站skillsmp.com、aitmpl.com、claudemarketplaces.com

新增领域NotebookLM 与 Source-Grounding

NotebookLM 通过 Source-Grounding 机制严格限制知识库仅含上传文档实现高精度回答每个答案附带精确引文。可作为被动学习Audio Overviews、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。

关键能力

新增领域AI图生视频

2025年底AI图生视频技术快速成熟14款免费工具已能生成高质量视频覆盖电商模特、内容创作、广告制作等多场景。

主要产品

  • 绘蛙AI视频阿里巴巴模特图转视频操作简便
  • 智谱清影智谱AI30秒生成6秒高清视频支持风格选择
  • Vidu生数科技+清华大学):全球首个"多主体参考"功能
  • 可灵AI快手3D时空联合注意力物理逻辑动作生成
  • 海螺AIMiniMax主体一致性保持光影色调高度一致
  • Stable VideoStability AILoRA摄像机精细控制

关键能力

新增领域DevOps 文化与转型

核心框架

DevOps 建立在四大支柱之上协作优先于孤岛、自动化即赋能者、持续改进Kaizen、客户中心。

关键实践

  • CI/CD Pipelines自动化构建、测试、部署流水线Jenkins、GitHub Actions、GitLab CI
  • Infrastructure as Code以代码管理基础设施Terraform、AWS CloudFormation
  • DevSecOps:在 CI/CD 中内置安全SonarQube、Snyk
  • GitOps:以 Git 为单一真实源管理配置

工具生态

  • 监控可观测性Prometheus、Grafana、Datadog
  • 容器化Docker、Kubernetes
  • 配置管理AnsibleRed Hat

未来趋势

新增领域Nano Banana 结构化提示词框架

Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives将创意描述转化为机器可执行参数。

关键机制

  • negatives负向提示词是质量控制关键字段
  • camera 字段提供电影级构图控制(焦距/光圈/角度)
  • 物件描述框架与人物描述框架共用同一结构subject 字段内容不同

关键概念

新增领域Claude + n8n-mcp AI 工作流自动生成

Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。

核心机制

  • n8n-mcp:提供 543 个 n8n 节点的结构化访问271 个 AI 能力节点
  • Claude 自动生成工作流完成度约 80%-90%10%-20% 错误率需人工修正
  • 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量

关键能力

新增领域MCP 在 Cursor 中的集成

MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。

核心机制

  • MCPClient-Server 架构3 种接口(资源读取/工具调用/Promise 提示词)
  • ComposerCursor 对话模块,支持 Agent 模式和 Normal 模式
  • Agent模式:自动执行 MCP 工具链,减少手动操作
  • Sequential Thinking:逻辑推理分步工具,提升 AI 决策质量

关键区分

  • Agent 模式:工具链自动串联
  • Normal 模式:需手动复制命令
  • enable yolo mode风险高默认关闭

新增领域Google 5 种 Agent Skill 设计模式

Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。

5 种模式

  • Tool Wrapper:监听关键词动态加载规范文档,适合团队编码规范分发
  • Generator:通过"填空"流程强制一致输出格式
  • Reviewer:分离检查清单与检查逻辑,换清单即换审计类型
  • Inversionagent 先问你再做,逐阶段收集信息
  • Pipeline:带硬性检查点的严格顺序工作流

Anthropic 补充

  • 最好的 Skill = 工具箱,而非"写好的提示词"
  • 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
  • 5 种模式可组合Pipeline 包含 Reviewer、Generator 依赖 Inversion

关键能力

  • 渐进式披露ADK 机制agent 只在需要时才加载特定 token

新增领域Claude Code 调用模式

OpenClaw/Hermes 通过 terminal 工具调用 Claude Code两种核心模式满足不同场景需求。

关键机制

  • Print Modestdin 管道非交互模式,适合绝大多数编程任务
  • TMUX交互模式tmux session 交互模式,适合超长任务
  • --permission-mode bypassPermissions 跳过所有交互确认,是自动化调用的必要条件
  • --add-dir 自动扫描 SKILL.md 并在触发条件匹配时激活

关键区分

  • delegate_task 仅调用 Hermes 子 agent无法建立 Claude Code CLI 通道
  • Skill 调用必须使用 terminal + claude -p

新增领域LLM 核心术语与技术框架

LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。

核心概念

  • LLM≥1B 参数的语言模型为"大模型"门槛GPT-21.5B、GPT-3175B
  • MCPModel Context ProtocolLLM 与外部工具的标准化通信协议
  • Agent:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
  • RAGRetrieval-augmented generation通过检索增强解决幻觉问题考试正确率 60%→90%
  • Embedding:向量化,将词转化为浮点数字计算语义距离
  • vLLM:通过 PagedAttention块式 KV Cache和连续批处理优化 GPU 利用率
  • TokenLLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
  • 数据蒸馏:用大模型生成精简数据训练小模型

关键洞察

  • MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
  • vLLM 推理优化PagedAttention 避免内存碎片化,连续批处理减少头阻塞

新增领域Vibe Coding 氛围编程

Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。

核心方法论

  • 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
  • 保持对产品逻辑、用户流程、审美和交互的"感觉"
  • 规划是一切:技术选型、实施规划、模块化设计
  • AI 工具Cursor、Windsurf、Trae承担体力活

推荐资源

  • vibe-coding-cn:中文开发者 Vibe Coding 资源库与工作站
  • Cursor + claude-opus-4.5-xhigh 为推荐工具组合

新增领域Agentic AI 赋能 Cloud DevOps

Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。

七大应用场景

  1. 自主检测与修复K8s、数据库、存储异常自动修复MTTR 降低)
  2. 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
  3. 成本优化动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
  4. 安全合规IAM 策略扫描、容器漏洞检测、实时修复
  5. 日志分析与可观测性AI 驱动的根因分析
  6. 多租户 SaaS 管理:自动化创建、配置、归档租户
  7. AI 增强决策What-If 模拟、异常检测

关键能力

新增领域OpenClaw Workspace 架构

OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。

核心文件

  • AGENTS.md岗位职责说明书300-500 字最佳),定义边界而非仅列能力
  • SOUL.md:性格档案(叙事性角色设定),与 IDENTITY.md 分工明确
  • USER.md:用户偏好固化,减少重复交代
  • TOOLS.md:工具权限规范,核心是"什么时候不用"
  • IDENTITY.md结构化身份元数据Name/Creature/Vibe/Emoji/Avatar
  • BOOTSTRAP.md:一次性初始化引导,完成后删除
  • 长期记忆memory/ 目录Agent 跨会话保留重要信息

核心价值

从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。