Files
nexus/wiki/concepts/Semantic-Routing.md
2026-05-03 05:42:12 +08:00

1.5 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Semantic Routing concept
engineering-autonomous-optimization-architect
2026-05-01

Semantic Routing

Definition

语义路由——基于任务语义和历史性能数据,动态选择最优 LLM 提供商进行路由,而非使用固定规则或纯价格优先策略。

Routing Decision Factors

  • 任务类型:文本提取 vs. 代码生成 vs. 创意写作 vs. 复杂推理
  • 历史准确率:该模型在此类任务上的 LLM-as-a-Judge 评分
  • 成本:每百万 Token 成本
  • 延迟P95 响应时间
  • 可用性:当前熔断器状态

Example

// Gemini Flash 在特定提取任务上准确率达 98% 且成本仅为 Claude Opus 的 10%
// → 自动将此类任务路由到 Gemini Flash
const rankedProviders = rankByHistoricalPerformance(taskType, providers);
for (const provider of rankedProviders) {
    if (!provider.circuitBreakerTripped) {
        return await provider.execute(task);
    }
}

vs. Traditional Routing

维度 固定路由 语义路由
成本优化
任务适配
动态适应
新模型集成 需人工修改 自动发现