nexus/wiki/concepts/Harness-Engineering.md at b40abbcd473a7093d8261e212e3d6de97c1e516a

ishenwei/nexus

Files

weishen 111bc65b7b Update nexus wiki content

2026-05-03 05:42:12 +08:00

title, type, tags, sources, last_updated

title

type

Overview

Harness Engineering——为 LLM 设计系统脚手架的工程学科，使 AI Agent 能在长周期自主任务中可靠执行。核心理念：LLM 本身不是 Agent，Agent = LLM + 代码脚手架。

每个时代并非替代前一个，而是吸收前一个——Harness Engineering 仍需要好的提示词和好的上下文，但它增加了前两者都无法提供的执行层。

永远不要依赖模型"选择正确"——如果可以用程序化方式限制选择，就这样做。

如果一条信息对任务连续性重要（已完成什么、待处理什么、什么失败了），它必须存在于 context window 之外。

如果你无法检查它，你就无法信任它。Harness 的每一层都应产生可被模型自身以外的东西验证的输出。

单步工具调用失败应触发该步重试，而非重启整个管道。任何失败的爆炸半径应尽可能小。