Anthropic 的 Harness 方向：Agent 基礎設施正走向 Agent OS

Anthropic 最近發佈了一篇關於 Harness 的工程實踐文章。表面上是在講產品實作，本質上回答的是一個更長期的問題：

當模型能力持續變化時，Agent 系統哪些層要穩定，哪些層應該允許快速替換？

核心判斷

我對這篇文章的核心理解是：Agent 基礎設施會越來越像一個輕量的 Agent OS。

重點不在「把今天的最佳流程寫死」，而在「定義長期穩定的系統抽象」。

很多 Agent 框架常見的問題是：

模型會變強，今天合理的補丁，明天可能就是技術債。

這套思路不是承諾某一種固定編排方式，而是抽象出三層穩定介面：

它們分離後，系統更容易替換、恢復和擴展。

一個關鍵觀點是：Session 不等於模型上下文。

Session 應該是可查詢、可回放、可恢復的事件日誌，而不是直接塞給模型的歷史拼接。

這樣做的價值：

Harness 應專注於調度，而不是持有業務狀態。

理想介面更接近：

execute(name, input) -> string

這代表模型只需要關心「我能調用哪些能力」，而不必強綁具體設備、容器或作業系統。

當 brain 和 hands 解耦後：

這會直接帶來更好的啟動與擴展表現。

這種拆分通常會同時改善效能和安全。

效能上：

安全上：