Files
nexus/Hermes/云+端大模型架构-2026-04-17.md
2026-04-18 12:07:32 +08:00

1.4 KiB
Raw Blame History

别再拿 Opus 跑 Hermes 工作流了!一人公司云+端大模型架构

来源Telegram频道「Hermes爱马仕&🦞OpenClaw小龙虾」 作者Claw小龙虾 @openclaw1024 日期2026-04-17

核心逻辑:体力活留本地,脑力活上云端


硬件底座

Mac mini M4 (32GB) 统一内存神器。后台常驻挂两个量化小模型,剩下内存依然足够日常开发,性价比拉满。


三核模型矩阵

角色 模型 职责
前置路由 Hermes 3 8B 无情的API调度器。专做意图识别和吐结构化JSON去调外部工具。毫秒响应不废token
本地主力 Qwen3 14B 干80%的脏活。日常代码脚手架、RAG数据清洗、文案初稿量产全包。无限重试边际成本为零
云端大脑 Claude Opus 零琐事消耗。只吃本地喂过来的高密度半成品做极其复杂的架构推演和最终的个人Vibe注入。把最贵的API额度全花在刀刃上

调度与编排

  • 写代码Codex CLI 底层指向本地 Qwen开多分支跑终端自动化
  • 业务流n8n 或 Dify 把 Hermes → Qwen → Opus 串联起来,跑无人值守的闭环

结论

与其去卷一两个神级 Prompt不如搭一套低成本、高流转的 Pipeline。一人公司的终局就是把算力杠杆用到极致。

标签

#AI架构 #一人公司 #LLM #云端协同 #效率优化