1.4 KiB
1.4 KiB
别再拿 Opus 跑 Hermes 工作流了!一人公司云+端大模型架构
来源:Telegram频道「Hermes爱马仕&🦞OpenClaw小龙虾」 作者:Claw小龙虾 @openclaw1024 日期:2026-04-17
核心逻辑:体力活留本地,脑力活上云端
硬件底座
Mac mini M4 (32GB) 统一内存神器。后台常驻挂两个量化小模型,剩下内存依然足够日常开发,性价比拉满。
三核模型矩阵
| 角色 | 模型 | 职责 |
|---|---|---|
| 前置路由 | Hermes 3 8B | 无情的API调度器。专做意图识别和吐结构化JSON去调外部工具。毫秒响应,不废token |
| 本地主力 | Qwen3 14B | 干80%的脏活。日常代码脚手架、RAG数据清洗、文案初稿量产全包。无限重试,边际成本为零 |
| 云端大脑 | Claude Opus | 零琐事消耗。只吃本地喂过来的高密度半成品,做极其复杂的架构推演和最终的个人Vibe注入。把最贵的API额度全花在刀刃上 |
调度与编排
- 写代码:Codex CLI 底层指向本地 Qwen,开多分支跑终端自动化
- 业务流:n8n 或 Dify 把 Hermes → Qwen → Opus 串联起来,跑无人值守的闭环
结论
与其去卷一两个神级 Prompt,不如搭一套低成本、高流转的 Pipeline。一人公司的终局,就是把算力杠杆用到极致。
标签
#AI架构 #一人公司 #LLM #云端协同 #效率优化