Harness Engineering

2026-03-29 less than 1 minute read

Harness Engineering 定义

Harness engineering 是一门设计和构建约束、反馈循环和生命周期系统的工程学科，用于让 AI 智能体能够可靠地构建软件。它的核心思想是：不直接让 AI 写代码，而是创建一个环境（harness），让 AI 在这个环境中可靠地构建代码。

Anthropic 的三智能体架构：

Planner（规划智能体）：任务分解
Generator（生成智能体）：代码生成
Evaluator（评估智能体）：质量评估（基于 Design quality、Originality、Craft、Functionality 等标准）

OpenAI：5 个月内构建了超过 100 万行代码，全程无需人工输入
LangChain：仅通过改进 harness，将智能体在 Terminal Bench 2.0 上的表现从 52.8% 提升到 66.5%，排名从 Top 30 进入 Top 5

“我们只改变了 harness，模型保持不变。” — LangChain

Harness engineering 的本质是：将 AI 能力的关注点从”如何让 AI 更聪明”转向”如何设计更好的环境来引导和约束 AI”