Anthropic 的 Harness 方向：Agent 基礎設施正走向 Agent OS

Fri, 10 Apr 2026 09:22:56 +0800

Anthropic 最近發佈了一篇關於 Harness 的工程實踐文章。表面上是在講產品實作，本質上回答的是一個更長期的問題：

當模型能力持續變化時，Agent 系統哪些層要穩定，哪些層應該允許快速替換？

核心判斷

我對這篇文章的核心理解是：Agent 基礎設施會越來越像一個輕量的 Agent OS。

重點不在「把今天的最佳流程寫死」，而在「定義長期穩定的系統抽象」。

很多 Agent 框架常見的問題是：

模型會變強，今天合理的補丁，明天可能就是技術債。

這套思路不是承諾某一種固定編排方式，而是抽象出三層穩定介面：

它們分離後，系統更容易替換、恢復和擴展。

一個關鍵觀點是：Session 不等於模型上下文。

Session 應該是可查詢、可回放、可恢復的事件日誌，而不是直接塞給模型的歷史拼接。

這樣做的價值：

Harness 應專注於調度，而不是持有業務狀態。

理想介面更接近：

execute(name, input) -> string

這代表模型只需要關心「我能調用哪些能力」，而不必強綁具體設備、容器或作業系統。

當 brain 和 hands 解耦後：

這會直接帶來更好的啟動與擴展表現。

這種拆分通常會同時改善效能和安全。

效能上：

安全上：