Sync: add ai finops and deployment notes
This commit is contained in:
@@ -1,30 +1,28 @@
|
||||
---
|
||||
title: "Anthropic"
|
||||
type: entity
|
||||
tags: [AI, Claude, Anthropic]
|
||||
sources: [google-5个agent-skill设计模式-2026-03-19]
|
||||
last_updated: 2026-03-19
|
||||
---
|
||||
|
||||
## Overview
|
||||
Anthropic 是一家 AI 安全公司,开发了 Claude 系列大语言模型和 Claude Code CLI Agent。其在 Skill 设计方面的实践经验(9 类分类、3 条铁律)被 Google ADK 指南引用。
|
||||
|
||||
## Key Contributions
|
||||
- **Claude Code**:Anthropic 的 CLI Agent,支持 SKILL.md 格式标准化
|
||||
- **9 类 Skill 分类**:从参考手册到故障排查,每类有明确场景
|
||||
- **3 条铁律**:
|
||||
1. 只写 Agent 不知道的东西
|
||||
2. 重点写踩坑清单
|
||||
3. 给工具不给指令
|
||||
|
||||
## Key Insight
|
||||
> "最好的 Skill 不是写得好的提示词,而是一个「工具箱」。" — Anthropic
|
||||
|
||||
## Related Entities
|
||||
- [[GoogleCloud]]:引用了 Anthropic 的 Skill 实践经验
|
||||
- [[ClaudeCode]]:Anthropic 开发的 CLI Agent
|
||||
- [[ADK]]:Google Cloud 的 Agent 开发工具包
|
||||
|
||||
## Connections
|
||||
- [[AnthropicSkill实践]] ← authored_by ← [[Anthropic]]
|
||||
- [[Google5个AgentSkill设计模式]] ← extends ← [[AnthropicSkill实践]]
|
||||
---
|
||||
title: "Anthropic"
|
||||
type: entity
|
||||
tags: ["llm-provider", "anthropic"]
|
||||
sources: ["engineering-autonomous-optimization-architect"]
|
||||
last_updated: 2026-04-26
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- Anthropic
|
||||
- Anthropic PBC
|
||||
|
||||
## Definition
|
||||
Anthropic 是主要的 LLM Provider,提供 Claude 系列模型(Claude Opus、Claude Sonnet、Claude Haiku 等)。在 [[AutonomousOptimizationArchitect]] 系统中作为高精度基准模型,其输出常被用作 [[LLMasJudge]] 评估其他模型时的参照标准。
|
||||
|
||||
## Role in LLM Routing
|
||||
- Claude Opus 常作为高精度基准——如果其他模型要替代 Claude,必须达到其 98%+ 精度
|
||||
- Claude Sonnet/Haiku 提供性价比选项,供 [[AutonomousOptimizationArchitect]] 按任务难度分配
|
||||
- Anthropic API 不可用时触发 [[CircuitBreaker]] 切换至 [[OpenAI]] 或 [[GoogleGemini]]
|
||||
|
||||
## Key Properties
|
||||
- **Token 成本**:$3-15 / 1M tokens
|
||||
- **延迟**:低至中等
|
||||
- **常见用途**:复杂推理、长文本分析、安全敏感任务
|
||||
|
||||
## Connections
|
||||
- [[OpenAI]] — 同为 LLM Provider,共同参与 [[SemanticRouting]]
|
||||
- [[GoogleGemini]] — 在成本优化场景中与 Gemini Flash 形成对比
|
||||
|
||||
30
wiki/entities/GoogleGemini.md
Normal file
30
wiki/entities/GoogleGemini.md
Normal file
@@ -0,0 +1,30 @@
|
||||
---
|
||||
title: "GoogleGemini"
|
||||
type: entity
|
||||
tags: ["llm-provider", "google", "gemini"]
|
||||
sources: ["engineering-autonomous-optimization-architect"]
|
||||
last_updated: 2026-04-26
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- Gemini
|
||||
- Google Gemini
|
||||
- Gemini Flash
|
||||
- Gemini Pro
|
||||
|
||||
## Definition
|
||||
Google Gemini 是 Google 的 LLM 系列模型,涵盖从高性价比到高性能的多种版本。在 [[AutonomousOptimizationArchitect]] 系统中,Gemini Flash 因其极高的性价比(成本约为 Claude Opus 的 1/10)而被列为重要的路由目标。
|
||||
|
||||
## Role in LLM Routing
|
||||
- **Gemini Flash**:低成本高速度模型,如果精度达到基准的 98% 且成本远低于竞品,[[AutonomousOptimizationArchitect]] 会将流量自动路由至 Gemini
|
||||
- **Gemini Pro**:中端定位,提供能力与成本的平衡
|
||||
- 与 [[OpenAI]] 和 [[Anthropic]] 共同构成三足鼎立的 Provider 生态
|
||||
|
||||
## Key Properties
|
||||
- **Token 成本**:$0.075-0.5 / 1M tokens(Gemini Flash 极低)
|
||||
- **延迟**:低(Gemini Flash)
|
||||
- **优势**:极高的性价比,特别适合大规模、低成本推理
|
||||
|
||||
## Connections
|
||||
- [[OpenAI]] — 同为 LLM Provider
|
||||
- [[Anthropic]] — 高精度基准 Provider
|
||||
@@ -1,32 +1,27 @@
|
||||
---
|
||||
title: "OpenAI"
|
||||
type: entity
|
||||
tags: [ai, company, llm]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
# OpenAI
|
||||
|
||||
## Type
|
||||
Company
|
||||
|
||||
## Aliases
|
||||
- OpenAI LLC
|
||||
- OpenAI LP(盈利主体)
|
||||
|
||||
## Description
|
||||
OpenAI 是美国人工智能研究公司,开发了 GPT 系列大语言模型、ChatGPT 产品、API 接口及 DALL·E 图像生成模型。
|
||||
|
||||
## Key Products
|
||||
- **ChatGPT**:对话式 AI 助手,支持自定义指令(Custom Instructions)功能
|
||||
- **GPT-4 / GPT-4o / GPT-4.5**:最新大语言模型系列
|
||||
- **OpenAI API**:为开发者提供 LLM 调用接口
|
||||
- **DALL·E**:文本生成图像模型
|
||||
- **Whisper**:开源语音识别模型
|
||||
- **Sora**:视频生成模型
|
||||
|
||||
## Relevance to This Wiki
|
||||
OpenAI 是本 Wiki 中多个 AI 工具和方案的底层技术提供商:[[ChatGPT]] 是用户自定义配置的主体;[[OpenClaw]] 可接入 OpenAI API;n8n、Claude 等工具均支持 OpenAI 模型集成。
|
||||
|
||||
## Sources
|
||||
- [[openai-chatgpt-个性化定义]]
|
||||
---
|
||||
title: "OpenAI"
|
||||
type: entity
|
||||
tags: ["llm-provider", "openai"]
|
||||
sources: ["engineering-autonomous-optimization-architect"]
|
||||
last_updated: 2026-04-26
|
||||
---
|
||||
|
||||
## Aliases
|
||||
- OpenAI
|
||||
- OpenAI Inc.
|
||||
|
||||
## Definition
|
||||
OpenAI 是主要的 LLM Provider 之一,提供 GPT 系列模型(GPT-4、GPT-4o、GPT-3.5 Turbo 等)。在 [[AutonomousOptimizationArchitect]] 系统中作为主要候选 Provider 之一参与性能排名和流量路由竞争。
|
||||
|
||||
## Role in LLM Routing
|
||||
- 提供多种规模的模型供 [[AutonomousOptimizationArchitect]] 按任务类型分配
|
||||
- 模型历史性能(token 延迟、幻觉率、成本)被 [[AutonomousOptimizationArchitect]] 持续追踪并纳入 Provider 排名
|
||||
|
||||
## Key Properties
|
||||
- **Token 成本**:$2.5-15 / 1M tokens(因模型而异)
|
||||
- **延迟**:中等至高(取决于模型规模)
|
||||
- **常见用途**:代码生成、复杂推理、长文档处理
|
||||
|
||||
## Connections
|
||||
- [[Anthropic]] — 同为 LLM Provider,竞争关系,共同参与 [[SemanticRouting]]
|
||||
- [[GoogleGemini]] — 同为 LLM Provider,在性价比上与 Gemini Flash 形成竞争
|
||||
|
||||
Reference in New Issue
Block a user