Anthropic 的 Harness 思路：Agent 基础设施正在走向 Agent OS

Anthropic 最近发布了一篇关于 Harness 的工程实践。表面看是在讲产品实现，实质上回答的是一个更长期的问题：

当模型能力持续变化时，Agent 系统哪些层要稳定，哪些层应该允许快速替换？

核心判断

我对这篇文章的核心理解是：Agent 基础设施会越来越像一个轻量的 Agent OS。

重点不在“把今天的最佳流程写死”，而在“定义长期稳定的系统抽象”。

很多 Agent 框架常见的问题是：

模型会变强，今天合理的补丁，明天可能就是技术债。

这套思路不是承诺某一种固定编排方式，而是抽象出三层稳定接口：

它们分离后，系统更容易替换、恢复和扩展。

一个关键观点是：Session 不等于模型上下文。

Session 应该是可查询、可回放、可恢复的事件日志，而不是直接塞给模型的历史拼接。

这样做的价值：

Harness 应专注于调度，而不是持有业务状态。

理想接口更接近：

execute(name, input) -> string

这意味着模型只关心“我能调用什么能力”，而不强绑定具体设备、容器或操作系统。

当 brain 和 hands 解耦：

这直接带来更好的启动与扩展表现。

这种拆分通常会同时改善性能和安全。

性能上：

安全上：