Anthropic 的 Harness 思路：Agent 基础设施正在走向 Agent OS

Fri, 10 Apr 2026 09:22:56 +0800

Anthropic 最近发布了一篇关于 Harness 的工程实践。表面看是在讲产品实现，实质上回答的是一个更长期的问题：

当模型能力持续变化时，Agent 系统哪些层要稳定，哪些层应该允许快速替换？

核心判断

我对这篇文章的核心理解是：Agent 基础设施会越来越像一个轻量的 Agent OS。

重点不在“把今天的最佳流程写死”，而在“定义长期稳定的系统抽象”。

很多 Agent 框架常见的问题是：

模型会变强，今天合理的补丁，明天可能就是技术债。

这套思路不是承诺某一种固定编排方式，而是抽象出三层稳定接口：

它们分离后，系统更容易替换、恢复和扩展。

一个关键观点是：Session 不等于模型上下文。

Session 应该是可查询、可回放、可恢复的事件日志，而不是直接塞给模型的历史拼接。

这样做的价值：

Harness 应专注于调度，而不是持有业务状态。

理想接口更接近：

execute(name, input) -> string

这意味着模型只关心“我能调用什么能力”，而不强绑定具体设备、容器或操作系统。

当 brain 和 hands 解耦：

这直接带来更好的启动与扩展表现。

这种拆分通常会同时改善性能和安全。

性能上：

安全上：