<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Sandbox on KnightLi的博客</title>
        <link>https://www.knightli.com/zh-tw/tags/sandbox/</link>
        <description>Recent content in Sandbox on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Fri, 10 Apr 2026 09:22:56 +0800</lastBuildDate><atom:link href="https://www.knightli.com/zh-tw/tags/sandbox/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Anthropic 的 Harness 方向：Agent 基礎設施正走向 Agent OS</title>
        <link>https://www.knightli.com/zh-tw/2026/04/10/anthropic-harness-agent-os/</link>
        <pubDate>Fri, 10 Apr 2026 09:22:56 +0800</pubDate>
        
        <guid>https://www.knightli.com/zh-tw/2026/04/10/anthropic-harness-agent-os/</guid>
        <description>&lt;p&gt;Anthropic 最近發佈了一篇關於 Harness 的工程實踐文章。表面上是在講產品實作，本質上回答的是一個更長期的問題：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;當模型能力持續變化時，Agent 系統哪些層要穩定，哪些層應該允許快速替換？&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id=&#34;核心判斷&#34;&gt;核心判斷
&lt;/h2&gt;&lt;p&gt;我對這篇文章的核心理解是：Agent 基礎設施會越來越像一個輕量的 &lt;strong&gt;Agent OS&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;重點不在「把今天的最佳流程寫死」，而在「定義長期穩定的系統抽象」。&lt;/p&gt;
&lt;h2 id=&#34;為什麼這點重要&#34;&gt;為什麼這點重要
&lt;/h2&gt;&lt;p&gt;很多 Agent 框架常見的問題是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;把模型的臨時短板固化為永久架構&lt;/li&gt;
&lt;li&gt;把 prompt 工程誤當成系統邊界&lt;/li&gt;
&lt;li&gt;把一次有效的補丁寫成長期依賴&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;模型會變強，今天合理的補丁，明天可能就是技術債。&lt;/p&gt;
&lt;h2 id=&#34;anthropic-的解法從具體-harness-到-meta-harness&#34;&gt;Anthropic 的解法：從具體 Harness 到 Meta-Harness
&lt;/h2&gt;&lt;p&gt;這套思路不是承諾某一種固定編排方式，而是抽象出三層穩定介面：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;session&lt;/code&gt;：可恢復的事件與狀態歷史&lt;/li&gt;
&lt;li&gt;&lt;code&gt;harness&lt;/code&gt;：推理與調度循環（brain）&lt;/li&gt;
&lt;li&gt;&lt;code&gt;sandbox&lt;/code&gt;：執行環境與工具能力（hands）&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;它們分離後，系統更容易替換、恢復和擴展。&lt;/p&gt;
&lt;h2 id=&#34;1-session-不是上下文視窗&#34;&gt;1) Session 不是上下文視窗
&lt;/h2&gt;&lt;p&gt;一個關鍵觀點是：&lt;strong&gt;Session 不等於模型上下文。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;Session 應該是可查詢、可回放、可恢復的事件日誌，而不是直接塞給模型的歷史拼接。&lt;/p&gt;
&lt;p&gt;這樣做的價值：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;trimming 不等於歷史消失&lt;/li&gt;
&lt;li&gt;compaction 不等於事實丟失&lt;/li&gt;
&lt;li&gt;崩潰恢復可以回到事件層，而不是依賴摘要記憶&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;2-harness-是可替換的編排層&#34;&gt;2) Harness 是可替換的編排層
&lt;/h2&gt;&lt;p&gt;Harness 應專注於調度，而不是持有業務狀態。&lt;/p&gt;
&lt;p&gt;理想介面更接近：&lt;/p&gt;
&lt;p&gt;&lt;code&gt;execute(name, input) -&amp;gt; string&lt;/code&gt;&lt;/p&gt;
&lt;p&gt;這代表模型只需要關心「我能調用哪些能力」，而不必強綁具體設備、容器或作業系統。&lt;/p&gt;
&lt;h2 id=&#34;3-sandbox-是手不是腦&#34;&gt;3) Sandbox 是「手」，不是「腦」
&lt;/h2&gt;&lt;p&gt;當 brain 和 hands 解耦後：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;工具環境可以獨立演進&lt;/li&gt;
&lt;li&gt;不同基礎設施可以並行接入&lt;/li&gt;
&lt;li&gt;不必每個會話都預熱完整執行環境&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這會直接帶來更好的啟動與擴展表現。&lt;/p&gt;
&lt;h2 id=&#34;效能與安全啟發&#34;&gt;效能與安全啟發
&lt;/h2&gt;&lt;p&gt;這種拆分通常會同時改善效能和安全。&lt;/p&gt;
&lt;p&gt;效能上：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;可以先啟動 brain，再按需拉起 hands&lt;/li&gt;
&lt;li&gt;降低首 token 延遲（TTFT）&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;安全上：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;不把高敏憑證直接暴露給模型&lt;/li&gt;
&lt;li&gt;用受控 proxy / vault 做間接憑證訪問&lt;/li&gt;
&lt;li&gt;安全邊界建立在系統約束上，而不是「模型應該做不到」&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;相關連結&#34;&gt;相關連結
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://claude.com/blog/claude-managed-agents&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Usage patterns and customer examples&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.anthropic.com/engineering/managed-agents&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;The design of Claude Managed Agents&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://platform.claude.com/docs/en/managed-agents/quickstart&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Onboarding, quickstart, overview of the CLI and SKDs &lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
