<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>AI Agent on KnightLiブログ</title>
        <link>https://www.knightli.com/ja/tags/ai-agent/</link>
        <description>Recent content in AI Agent on KnightLiブログ</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>ja</language>
        <lastBuildDate>Wed, 15 Apr 2026 22:09:25 +0800</lastBuildDate><atom:link href="https://www.knightli.com/ja/tags/ai-agent/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>RAGFlowプロジェクト整理：オープンソースRAGエンジンの機能と使い方</title>
        <link>https://www.knightli.com/ja/2026/04/15/ragflow-rag-engine-guide/</link>
        <pubDate>Wed, 15 Apr 2026 22:09:25 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/15/ragflow-rag-engine-guide/</guid>
        <description>&lt;p&gt;&lt;code&gt;RAGFlow&lt;/code&gt; は &lt;code&gt;infiniflow&lt;/code&gt; によるオープンソースの RAG（Retrieval-Augmented Generation）エンジンです。単なる「ドキュメントをアップロードして質問する」ための薄いナレッジベース外殻ではなく、ドキュメント解析、チャンク分割、検索、リランキング、引用の追跡、モデル設定、Agent 機能、API 統合までを一つのワークフローにまとめることを目指しています。&lt;/p&gt;
&lt;p&gt;企業向けナレッジベース、ドキュメント Q&amp;amp;A、サポートアシスタント、社内情報検索、あるいは LLM により信頼できるコンテキスト層を持たせたい場合、RAGFlow は重点的に見る価値のあるオープンソース案の一つです。&lt;/p&gt;
&lt;h2 id=&#34;01-ragflow-は何を解決するのか&#34;&gt;01 RAGFlow は何を解決するのか
&lt;/h2&gt;&lt;p&gt;一般的な RAG システムがぶつかりやすい問題は主に三つあります。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;ドキュメント解析の品質が安定しない。特に PDF、スキャン文書、表、画像、複雑なレイアウトで起きやすい。&lt;/li&gt;
&lt;li&gt;チャンク分割戦略が見えにくく、検索ヒットはしていても実際の文脈が不完全になりやすい。&lt;/li&gt;
&lt;li&gt;回答に信頼できる引用がなく、利用者が出典を確認しにくい。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;RAGFlow はまさにこの部分に力を入れています。README では &lt;code&gt;Deep document understanding&lt;/code&gt;、テンプレート化されたチャンク分割、チャンクの可視化、引用のグラウンディング、多経路検索とリランキングが強調されています。つまり、単にベクトルデータベースとチャット UI をつなぐのではなく、「高品質な入力が高品質な回答につながる」ことを重視しているということです。&lt;/p&gt;
&lt;h2 id=&#34;02-主な機能&#34;&gt;02 主な機能
&lt;/h2&gt;&lt;h3 id=&#34;1-高度なドキュメント理解&#34;&gt;1. 高度なドキュメント理解
&lt;/h3&gt;&lt;p&gt;RAGFlow は複雑な非構造化データから知識を抽出できます。README に挙げられている形式には Word、PPT、Excel、TXT、画像、スキャン文書、構造化データ、Web ページなどがあります。&lt;/p&gt;
&lt;p&gt;これは企業ナレッジベースにとって非常に重要です。現実の資料はきれいな Markdown ではなく、契約書、レポート、表、スキャン PDF、製品マニュアル、スクリーンショット、Web ページが混在していることが多いからです。解析品質が低いと、その後のベクトル検索も LLM の回答も弱くなります。&lt;/p&gt;
&lt;h3 id=&#34;2-テンプレート化されたチャンク分割&#34;&gt;2. テンプレート化されたチャンク分割
&lt;/h3&gt;&lt;p&gt;RAGFlow はテンプレートベースの chunking を提供します。ここでの価値は、チャンク分割がブラックボックスではなく、文書タイプに応じてより適切な戦略を選べることです。&lt;/p&gt;
&lt;p&gt;たとえば通常の記事、論文、表、Q&amp;amp;A 文書、画像説明、契約条項では、チャンクの粒度や境界の考え方が異なります。テンプレート化された分割により、「文が途中で切れる」「表の文脈が失われる」「見出しと本文が分かれてしまう」といった問題を減らせます。&lt;/p&gt;
&lt;h3 id=&#34;3-追跡可能な引用&#34;&gt;3. 追跡可能な引用
&lt;/h3&gt;&lt;p&gt;RAGFlow は grounded citations を重視しています。つまり、回答がどのソース断片に基づくのかを追えるということです。さらにチャンクの可視化もあり、解析結果やチャンク分割結果を人が確認して調整しやすくなっています。&lt;/p&gt;
&lt;p&gt;これは本番環境では特に重要です。企業内 Q&amp;amp;A は、ただ「それっぽい答え」を返せばよいわけではなく、検証可能である必要があります。ポリシー、コンプライアンス、財務、技術文書、サポート情報のような分野では、引用と追跡性はほぼ必須です。&lt;/p&gt;
&lt;h3 id=&#34;4-自動化された-rag-ワークフロー&#34;&gt;4. 自動化された RAG ワークフロー
&lt;/h3&gt;&lt;p&gt;RAGFlow は RAG の一連の流れを、より完成度の高いワークフローとしてまとめています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ナレッジベースの作成&lt;/li&gt;
&lt;li&gt;データのアップロードまたは同期&lt;/li&gt;
&lt;li&gt;ドキュメント解析&lt;/li&gt;
&lt;li&gt;チャンクの確認と調整&lt;/li&gt;
&lt;li&gt;LLM と embedding モデルの設定&lt;/li&gt;
&lt;li&gt;多経路検索とリランキングの実行&lt;/li&gt;
&lt;li&gt;チャットアシスタントの構築&lt;/li&gt;
&lt;li&gt;API 経由で業務システムへ統合&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;このため、単なるライブラリというより RAG プラットフォームに近い存在です。チームにとっては UI と API の両方が有用で、非エンジニアはナレッジベースを保守しやすく、エンジニアは既存システムへ組み込みやすくなります。&lt;/p&gt;
&lt;h3 id=&#34;5-agentmcpワークフロー拡張&#34;&gt;5. Agent、MCP、ワークフロー拡張
&lt;/h3&gt;&lt;p&gt;最近の RAGFlow には Agentic workflow、MCP、Agent Memory、コード実行コンポーネントなども含まれています。これは、従来型のナレッジベース Q&amp;amp;A にとどまらず、Agent シナリオにも広がっていることを示しています。&lt;/p&gt;
&lt;p&gt;典型的には、Agent が信頼できる企業知識レイヤーとして RAGFlow を使い、必要なときにナレッジベースから検索し、引用付きで回答を生成し、必要に応じてツール呼び出しやワークフローと組み合わせる、という形です。&lt;/p&gt;
&lt;h2 id=&#34;03-基本的な利用フロー&#34;&gt;03 基本的な利用フロー
&lt;/h2&gt;&lt;p&gt;公式のクイックスタートに沿うと、RAGFlow の一般的な使い方は次のようにまとめられます。&lt;/p&gt;
&lt;h3 id=&#34;1-実行環境を準備する&#34;&gt;1. 実行環境を準備する
&lt;/h3&gt;&lt;p&gt;README にある基本要件は以下の通りです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;CPU &amp;gt;= 4 cores&lt;/li&gt;
&lt;li&gt;RAM &amp;gt;= 16 GB&lt;/li&gt;
&lt;li&gt;Disk &amp;gt;= 50 GB&lt;/li&gt;
&lt;li&gt;Docker &amp;gt;= 24.0.0&lt;/li&gt;
&lt;li&gt;Docker Compose &amp;gt;= v2.26.1&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;コード実行用のサンドボックスを使う場合は &lt;code&gt;gVisor&lt;/code&gt; も必要です。また、公式 Docker イメージは主に x86 向けです。ARM64 を使う場合は、公式ドキュメントに従って自分でイメージをビルドする必要があります。&lt;/p&gt;
&lt;h3 id=&#34;2-プロジェクトを取得する&#34;&gt;2. プロジェクトを取得する
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;git clone https://github.com/infiniflow/ragflow.git
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;cd&lt;/span&gt; ragflow/docker
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;3-vmmax_map_count-を確認する&#34;&gt;3. &lt;code&gt;vm.max_map_count&lt;/code&gt; を確認する
&lt;/h3&gt;&lt;p&gt;RAGFlow のデプロイは Elasticsearch / OpenSearch のようなコンポーネントに依存するため、Linux では通常次を確認します。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;sysctl vm.max_map_count
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;値が &lt;code&gt;262144&lt;/code&gt; 未満なら、一時的に次で設定できます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;sudo sysctl -w vm.max_map_count&lt;span class=&#34;o&#34;&gt;=&lt;/span&gt;&lt;span class=&#34;m&#34;&gt;262144&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;再起動後も維持したい場合は &lt;code&gt;/etc/sysctl.conf&lt;/code&gt; に追加します。&lt;/p&gt;
&lt;h3 id=&#34;4-docker-compose-で起動する&#34;&gt;4. Docker Compose で起動する
&lt;/h3&gt;&lt;p&gt;CPU モードはそのまま起動できます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;docker compose -f docker-compose.yml up -d
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;DeepDoc を GPU で高速化したい場合、README では &lt;code&gt;.env&lt;/code&gt; に &lt;code&gt;DEVICE=gpu&lt;/code&gt; を追加してから起動する方法が示されています。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;sed -i &lt;span class=&#34;s1&#34;&gt;&amp;#39;1i DEVICE=gpu&amp;#39;&lt;/span&gt; .env
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;docker compose -f docker-compose.yml up -d
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;起動後はログを確認します。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;docker logs -f docker-ragflow-cpu-1
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;サービスが立ち上がったら、ブラウザでサーバーのアドレスを開きます。デフォルト構成では通常次のようになります。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;http://IP_OF_YOUR_MACHINE
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;5-モデル-api-key-を設定する&#34;&gt;5. モデル API Key を設定する
&lt;/h3&gt;&lt;p&gt;RAGFlow では LLM と embedding モデルの設定が必要です。README では &lt;code&gt;service_conf.yaml.template&lt;/code&gt; 内でデフォルトの LLM factory を選び、対応する &lt;code&gt;API_KEY&lt;/code&gt; を更新する流れが説明されています。&lt;/p&gt;
&lt;p&gt;実際には、使うプロバイダーに合わせて次を設定します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;チャットモデル&lt;/li&gt;
&lt;li&gt;embedding モデル&lt;/li&gt;
&lt;li&gt;rerank モデル&lt;/li&gt;
&lt;li&gt;PDF / DOCX 内の画像も理解したい場合はマルチモーダルモデル&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;6-ナレッジベースを作成して文書を取り込む&#34;&gt;6. ナレッジベースを作成して文書を取り込む
&lt;/h3&gt;&lt;p&gt;サービス起動後の典型的な流れは次の通りです。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Web UI にログインする。&lt;/li&gt;
&lt;li&gt;dataset / knowledge base を作成する。&lt;/li&gt;
&lt;li&gt;文書をアップロードするか、データソース同期を設定する。&lt;/li&gt;
&lt;li&gt;解析完了を待つ。&lt;/li&gt;
&lt;li&gt;チャンク結果を確認し、必要なら調整する。&lt;/li&gt;
&lt;li&gt;チャットアシスタントを作成し、知識ベースを関連付ける。&lt;/li&gt;
&lt;li&gt;回答品質と引用元を確認する。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;業務システムに組み込みたい場合は、RAGFlow の API や SDK を使って、検索とチャット機能を自分のアプリに接続できます。&lt;/p&gt;
&lt;h2 id=&#34;04-向いている場面&#34;&gt;04 向いている場面
&lt;/h2&gt;&lt;p&gt;RAGFlow は次のような用途に向いています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;企業内ナレッジベース Q&amp;amp;A&lt;/li&gt;
&lt;li&gt;製品マニュアル、技術文書、FAQ の検索&lt;/li&gt;
&lt;li&gt;カスタマーサポートや営業支援アシスタント&lt;/li&gt;
&lt;li&gt;契約書、レポート、規程文書に対する追跡可能な Q&amp;amp;A&lt;/li&gt;
&lt;li&gt;複数形式の資料を一元的に扱いたい場合&lt;/li&gt;
&lt;li&gt;UI による運用と API 統合の両方が必要なチーム&lt;/li&gt;
&lt;li&gt;Agent のコンテキスト層として RAG を使いたいシステム&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;特に、文書形式が複雑で、引用が重要で、人が解析結果を確認・調整したい場合に向いています。&lt;/p&gt;
&lt;h2 id=&#34;05-使うときの注意点&#34;&gt;05 使うときの注意点
&lt;/h2&gt;&lt;p&gt;第一に、RAGFlow は軽量スクリプトではありません。ある程度のインフラ要件があります。公式の推奨は最低 4 コア CPU、16GB RAM、50GB ディスクです。少量の Markdown に対して Q&amp;amp;A をしたいだけなら、ここまで大きなプラットフォームは不要かもしれません。&lt;/p&gt;
&lt;p&gt;第二に、文書品質は依然として重要です。RAGFlow は解析やチャンク分割を改善できますが、質の低い資料、古い資料、矛盾する資料を自動で信頼できるものに変えることはできません。本番導入前にはナレッジベースの運用設計が必要です。&lt;/p&gt;
&lt;p&gt;第三に、モデル設定は結果に直結します。embedding、rerank、チャットモデル、マルチモーダルモデルの選択は、検索品質と回答品質の両方に影響します。RAGFlow はワークフローを提供しますが、最終的な品質はデータ、モデル、パラメータ調整の組み合わせで決まります。&lt;/p&gt;
&lt;p&gt;第四に、本番環境では権限とデータセキュリティに注意が必要です。企業ナレッジベースには社内文書が含まれることが多いため、デプロイ方式、アクセス制御、ログ、API Key、モデル提供者側のデータポリシーまで事前に設計するべきです。&lt;/p&gt;
&lt;h2 id=&#34;06-短い判断&#34;&gt;06 短い判断
&lt;/h2&gt;&lt;p&gt;RAGFlow の強みは、RAG で最も面倒な部分をプラットフォーム機能としてまとめていることです。複雑な文書解析、説明可能なチャンク分割、引用のグラウンディング、多経路検索、リランキング、モデル設定、Web UI、API、Agent 拡張までを一式で備えています。&lt;/p&gt;
&lt;p&gt;検証可能で保守しやすく、業務システムにも接続できる企業ナレッジベースを作りたいなら、RAGFlow は「ベクトルデータベース + 簡単なチャット UI」より完成度の高い選択肢です。逆に、個人用途の小規模な Q&amp;amp;A や、扱うデータ形式が非常に単純な場合は、より軽量な RAG フレームワークのほうが扱いやすいかもしれません。&lt;/p&gt;
&lt;h2 id=&#34;関連リンク&#34;&gt;関連リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHub プロジェクト：&lt;a class=&#34;link&#34; href=&#34;https://github.com/infiniflow/ragflow&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/infiniflow/ragflow&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;公式ドキュメント：&lt;a class=&#34;link&#34; href=&#34;https://ragflow.io/docs/dev/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://ragflow.io/docs/dev/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;オンライン Demo：&lt;a class=&#34;link&#34; href=&#34;https://cloud.ragflow.io&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://cloud.ragflow.io&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Firecrawlプロジェクト整理：AI Agent向けのWeb検索・スクレイピング・操作API</title>
        <link>https://www.knightli.com/ja/2026/04/15/firecrawl-ai-web-data-api/</link>
        <pubDate>Wed, 15 Apr 2026 13:45:03 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/15/firecrawl-ai-web-data-api/</guid>
        <description>&lt;p&gt;&lt;code&gt;Firecrawl&lt;/code&gt; の位置づけは明確です。Webページを、AI Agentが扱いやすいデータに変換するためのツールです。単なるクローラースクリプトではなく、検索、単一ページのスクレイピング、サイト全体の巡回、ページ操作、構造化抽出、AgentワークフローをAPIとしてまとめ、モデルや自動化システムがWebページ内のノイズに悩まされにくくします。&lt;/p&gt;
&lt;h2 id=&#34;01-何を解決するのか&#34;&gt;01 何を解決するのか
&lt;/h2&gt;&lt;p&gt;多くのAIアプリケーションはWebページを読む必要があります。しかし実際のWebは扱いやすくありません。JavaScriptで描画されるページ、ポップアップ、ページネーション、ログイン状態、Bot対策、PDFやDOCXなどHTML以外のコンテンツ、本文とは関係のないナビゲーション、広告、スクリプト、スタイルが混在しています。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;Firecrawl&lt;/code&gt; が解決しようとしているのは、この中間層の問題です。アプリケーションは「このページ/このサイト/このテーマのデータが欲しい」と指定するだけで、Firecrawlがページを開き、取得し、クリーニングし、LLMで使いやすいMarkdown、HTML、スクリーンショット、JSONとして返します。&lt;/p&gt;
&lt;p&gt;この種のツールの価値は、「URLにリクエストできるか」ではありません。複雑なWebページを安定して使えるデータに変換できるかが重要です。RAG、AI検索、競合調査、自動資料収集、Webコンテンツ監視では、この層がシステム内の面倒な配管になりがちです。&lt;/p&gt;
&lt;h2 id=&#34;02-主な機能&#34;&gt;02 主な機能
&lt;/h2&gt;&lt;p&gt;FirecrawlのREADMEでは、機能がいくつかの領域に分けられています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;Search&lt;/code&gt;：Webを検索し、検索結果ページの本文まで取得する。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Scrape&lt;/code&gt;：単一URLをMarkdown、HTML、スクリーンショット、構造化JSONに変換する。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Interact&lt;/code&gt;：ページを取得した後、プロンプトやコードでクリック、スクロール、入力、待機などを実行する。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Agent&lt;/code&gt;：欲しい情報を直接説明すると、Agentが自動で検索、遷移、結果の取得を行う。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Crawl&lt;/code&gt;：Webサイト配下の複数ページを取得する。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Map&lt;/code&gt;：Webサイト内のURLを素早く発見する。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;Batch Scrape&lt;/code&gt;：大量のURLを非同期で一括取得する。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;名前だけを見ると「スクレイピングサービス」に見えます。しかし機能全体を見ると、AIアプリケーションのデータ入口に近い存在です。検索は情報源を見つけ、スクレイピングは内容を整え、操作機能は動的ページを扱い、Agentは「情報を探す」という作業をさらに自動化します。&lt;/p&gt;
&lt;h2 id=&#34;03-ai-agentに向いている理由&#34;&gt;03 AI Agentに向いている理由
&lt;/h2&gt;&lt;p&gt;従来のクローラーは、URLが既知であり、ページ構造も理解していることを前提にする場合が多いです。しかしAgentの場面ではそうとは限りません。ユーザーは「ある会社の最新料金ページにあるプラン差分を調べて」と頼むだけかもしれません。システム側は自分で検索し、ページを開き、内容を比較し、出典を返す必要があります。&lt;/p&gt;
&lt;p&gt;Firecrawlの &lt;code&gt;Agent&lt;/code&gt; エンドポイントは、このようなタスクを想定しています。自然言語のプロンプトだけで動かすことも、指定したURL範囲に限定して動かすこともできます。構造化された結果が必要な場合は、schemaと組み合わせて固定フィールドで出力できます。&lt;/p&gt;
&lt;p&gt;アプリケーション層にとっては、次の2つの利点があります。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Webサイトごとに個別のパーサーを書く必要がない。&lt;/li&gt;
&lt;li&gt;返ってきた結果をLLM、データベース、後続の自動化フローに渡しやすい。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;もちろん、すべてのカスタムクローラーを置き換えるわけではありません。制約が強く、高頻度で、大規模で、フィールドが非常に安定している取得タスクでは、専用の解析ロジックを書いたほうが安く、制御もしやすい場合があります。Firecrawlは、情報源が分散し、ページ構造が変わりやすく、AIワークフローに素早く接続したい場面に向いています。&lt;/p&gt;
&lt;h2 id=&#34;04-mcpcliインテグレーション&#34;&gt;04 MCP、CLI、インテグレーション
&lt;/h2&gt;&lt;p&gt;FirecrawlはAgent向けツールチェーンにも明確に寄せています。READMEにはMCP Serverの接続方法があり、AI coding agent向けのSkill/CLI初期化コマンドも用意されています。&lt;/p&gt;
&lt;p&gt;つまり、バックエンドサービスからAPIとして呼ぶだけでなく、Claude Code、OpenCode、Antigravity、MCPクライアントなどのワークフローに直接入ることも想定しています。Agentに調査、Web取得、内容整理をよく任せる人にとっては、API呼び出しを手書きするより軽い導入方法です。&lt;/p&gt;
&lt;p&gt;Zapier、n8n、Lovableなどのプラットフォーム連携も挙げられています。この方向性は実用的です。Webデータは必ずしもコードにだけ入るわけではなく、自動化テーブル、ローコードフロー、コンテンツ制作システム、社内ナレッジベースにも流れます。&lt;/p&gt;
&lt;h2 id=&#34;05-オープンソースセルフホストライセンス境界&#34;&gt;05 オープンソース、セルフホスト、ライセンス境界
&lt;/h2&gt;&lt;p&gt;Firecrawlはオープンソースプロジェクトです。メインリポジトリは主に &lt;code&gt;AGPL-3.0&lt;/code&gt; でライセンスされています。READMEでは、SDKと一部のUIコンポーネントは &lt;code&gt;MIT&lt;/code&gt; ライセンスであり、詳細は各ディレクトリのLICENSEファイルを見る必要があるとも説明されています。&lt;/p&gt;
&lt;p&gt;ここは注意が必要です。クラウドサービスとして使うだけなら、主な関心はAPIコスト、安定性、コンプライアンス上の境界です。一方で、セルフホストして外部にサービス提供するなら、&lt;code&gt;AGPL-3.0&lt;/code&gt; の義務をきちんと確認する必要があります。&lt;/p&gt;
&lt;p&gt;READMEでは、Webサイトのポリシー、プライバシーポリシー、利用規約を尊重するようにも注意しています。また、デフォルトで &lt;code&gt;robots.txt&lt;/code&gt; に従うと説明されています。この種のツールは強力になるほど、コンプライアンスと取得範囲の設計を後回しにせず、最初からシステムに組み込む必要があります。&lt;/p&gt;
&lt;h2 id=&#34;06-向いている場面&#34;&gt;06 向いている場面
&lt;/h2&gt;&lt;p&gt;Firecrawlを優先的に検討したいのは、次のような場面です。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;RAGシステム向けにWeb資料を取得し、きれいなMarkdownを直接得たい。&lt;/li&gt;
&lt;li&gt;AI検索や調査アシスタントで、検索後にページ全体を読む必要がある。&lt;/li&gt;
&lt;li&gt;JavaScriptが重いサイトを取得したいが、自前でブラウザクラスターを保守したくない。&lt;/li&gt;
&lt;li&gt;競合、価格、ドキュメント、ニュース、採用ページなどの公開情報を監視したい。&lt;/li&gt;
&lt;li&gt;MCPクライアントやAI coding agentにリアルタイムのWeb読み取り能力を追加したい。&lt;/li&gt;
&lt;li&gt;クローラー基盤を先に作るのではなく、Webデータ製品を素早く検証したい。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;あまり向いていない場面もはっきりしています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;対象サイトのフィールドが少なく、構造も安定していて、簡単なスクリプトで十分な場合。&lt;/li&gt;
&lt;li&gt;取得量が非常に大きく、開発保守コストより実行コストのほうが重要な場合。&lt;/li&gt;
&lt;li&gt;データソース、リトライ戦略、Bot対策への振る舞い、監査要件を細かく制御する必要がある場合。&lt;/li&gt;
&lt;li&gt;ライセンスやコンプライアンス要件として、AGPLコンポーネントや外部クラウドサービスを導入できない場合。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;07-短い判断&#34;&gt;07 短い判断
&lt;/h2&gt;&lt;p&gt;Firecrawlの価値は、「WebページからAIで使えるデータへ」という面倒な流れをプロダクト化している点にあります。検索、取得、クリーニング、操作、バッチ処理、Agent型の資料収集を1つのインターフェースにまとめているため、AIアプリケーション開発者には使いやすい選択肢です。&lt;/p&gt;
&lt;p&gt;モデルに実際のWebページを読ませる必要がよくあり、特に情報源が分散し、構造が不安定で、MCPやAgentワークフローにも接続したいなら、Firecrawlはツール箱に入れておく価値があります。逆に、固定サイトから低コストで大量収集するだけなら、従来のクローラーや専用パーサーのほうが適している場合があります。&lt;/p&gt;
&lt;h2 id=&#34;関連リンク&#34;&gt;関連リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHubプロジェクト：&lt;a class=&#34;link&#34; href=&#34;https://github.com/firecrawl/firecrawl&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/firecrawl/firecrawl&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>OpenHarness とは: このオープンソースの Agent Harness では何ができるのですか?</title>
        <link>https://www.knightli.com/ja/2026/04/12/openharness-basic-functions/</link>
        <pubDate>Sun, 12 Apr 2026 23:45:00 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/12/openharness-basic-functions/</guid>
        <description>&lt;p&gt;最近オープンソースの AI エージェント ツールに注目している場合、&lt;code&gt;HKUDS/OpenHarness&lt;/code&gt; は注目に値する新しいプロジェクトです。これは単なる「チャット シェル」ではなく、実行可能、スケーラブル、管理可能なエージェント インフラストラクチャをオープン ソースの &lt;strong&gt;エージェント ハーネス&lt;/strong&gt;に分離します。&lt;/p&gt;
&lt;p&gt;公式 README によると、OpenHarness は主に、ツールの呼び出し、スキルの読み込み、メモリ メカニズム、権限管理、マルチ エージェントの調整など、軽量のエージェントの基本機能のセットを提供します。およびそれに付随する &lt;code&gt;ohmo&lt;/code&gt; は、このインフラストラクチャ上に構築されたパーソナル AI アシスタント アプリケーションです。&lt;/p&gt;
&lt;h2 id=&#34;01-オープンハーネスとは何ですか&#34;&gt;01 オープンハーネスとは何ですか？
&lt;/h2&gt;&lt;p&gt;OpenHarness は、「大きなモデルに手、足、メモリ、境界をインストールする」ランタイム層として理解できます。&lt;/p&gt;
&lt;p&gt;大規模なモデル自体は推論と生成に優れていますが、それを本当に長期間動作できるエージェントにしたい場合は、通常、次の周辺機能が必要です。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;テキストを出力するだけでなくツールを調整する&lt;/li&gt;
&lt;li&gt;ファイルの読み取りと書き込み、コマンドの実行、検索機能と Web 機能へのアクセス&lt;/li&gt;
&lt;li&gt;長時間のセッションでもコンテキストとメモリを保持&lt;/li&gt;
&lt;li&gt;危険な操作に対する権限の制御&lt;/li&gt;
&lt;li&gt;大きなタスクを複数のサブエージェントに分割して並列処理する&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;OpenHarness の目標は、この「モデル周辺のエンジニアリング層」を、明確でオープンソースでチェック可能な Python 実装に変えることです。これは、特定のモデルや特定のチャット インターフェイスのみを強調するのではなく、エージェントの操作ベースに似ています。&lt;/p&gt;
&lt;h2 id=&#34;02-本プロジェクトの基本機能&#34;&gt;02 本プロジェクトの基本機能
&lt;/h2&gt;&lt;p&gt;現在の GitHub ホームページと README から判断すると、OpenHarness のコア機能は主に次の領域に集中しています。&lt;/p&gt;
&lt;h3 id=&#34;1-agent-loop&#34;&gt;1. Agent Loop
&lt;/h3&gt;&lt;p&gt;これは、エージェントが継続的に動作できるコア実行ループです。公式ハイライトは次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ストリーミングツール呼び出しループ&lt;/li&gt;
&lt;li&gt;API の再試行と指数バックオフ&lt;/li&gt;
&lt;li&gt;ツールの並列実行&lt;/li&gt;
&lt;li&gt;トークンの統計とコストの追跡&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;この部分の重要性は、エージェントが単なる「1 つの質問と 1 つの回答」ではなく、継続的に観察し、考え、ツールを呼び出し、結果を読み取り、タスクの次のステップに進むことができることです。&lt;/p&gt;
&lt;h3 id=&#34;2-ツールスキルプラグインシステム&#34;&gt;2. ツール、スキル、プラグインシステム
&lt;/h3&gt;&lt;p&gt;OpenHarness により、ツール層が比較的完全になりました。プロジェクトのホームページには、ファイル、シェル、検索、Web ページ、MCP などのツールが組み込まれており、オンデマンドでの Markdown スキル ファイルの読み込みをサポートしていると記載されています。&lt;/p&gt;
&lt;p&gt;その価値は「より多くのツール」だけではありませんが、さらに重要なのは、その組み合わせ方法が比較的オープンであることです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;組み込みツールを直接使用可能&lt;/li&gt;
&lt;li&gt;スキルはタスクごとにロード可能&lt;/li&gt;
&lt;li&gt;フック、スキル、エージェントはプラグインを通じて拡張可能&lt;/li&gt;
&lt;li&gt;&lt;code&gt;anthropics/skills&lt;/code&gt; および関連プラグイン エコロジーと互換性があります&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;このレイヤーは、毎回プロンプトによる一時的な説明に依存するのではなく、特定の固定プロセスを再利用可能な機能にまとめたい場合に役立ちます。&lt;/p&gt;
&lt;h3 id=&#34;3-コンテキストと記憶&#34;&gt;3. コンテキストと記憶
&lt;/h3&gt;&lt;p&gt;この部分は OpenHarness の重要な差別化ポイントです。公式キーワードには次のようなものがあります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt; の検出と挿入&lt;/li&gt;
&lt;li&gt;自動コンテキスト圧縮&lt;/li&gt;
&lt;li&gt;&lt;code&gt;MEMORY.md&lt;/code&gt; 永続メモリ&lt;/li&gt;
&lt;li&gt;セッションの回復と履歴の継続&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは、現在のラウンドの入力を処理するだけでなく、「プロジェクトのコミットメント」、「過去のタスク」、および「長期的な設定」を保持しようとすることを意味し、エージェントを毎回最初から開始するのではなく、継続的な作業により適したものにします。&lt;/p&gt;
&lt;h3 id=&#34;4-当局のガバナンスとセキュリティ境界&#34;&gt;4. 当局のガバナンスとセキュリティ境界
&lt;/h3&gt;&lt;p&gt;エージェントが実際にファイル システム、端末、ネットワークに入った後は、ガバナンスが非常に重要になります。 OpenHarness はこのセクションで次のことを提供します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;マルチレベル権限モード&lt;/li&gt;
&lt;li&gt;パスとコマンドベースのルール制御&lt;/li&gt;
&lt;li&gt;&lt;code&gt;PreToolUse&lt;/code&gt; / &lt;code&gt;PostToolUse&lt;/code&gt; hooks&lt;/li&gt;
&lt;li&gt;インタラクティブな承認ポップアップウィンドウ&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;簡単に言うと、エージェントが「できること」だけでなく、「直接実行できることと、最初に確認しなければならないこと」を考慮します。&lt;/p&gt;
&lt;h3 id=&#34;5-マルチエージェントの調整&#34;&gt;5. マルチエージェントの調整
&lt;/h3&gt;&lt;p&gt;OpenHarness は、処理のためにタスクをサブエージェントにオフロードすることもサポートしています。現在の公開情報で言及されている機能には次のものが含まれます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;サブエージェントの作成と委任&lt;/li&gt;
&lt;li&gt;チーム登録とタスク管理&lt;/li&gt;
&lt;li&gt;バックグラウンドタスクのライフサイクル管理&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;複雑なタスクの場合、これは、1 つのエージェントに依存して逐次的に進めるだけでなく、並行して共同作業を試みることもできることを意味します。&lt;/p&gt;
&lt;h3 id=&#34;6-マルチプロバイダーのワークフロー&#34;&gt;6. マルチプロバイダーのワークフロー
&lt;/h3&gt;&lt;p&gt;OpenHarness は現在、プロバイダーを単なる基盤となる API 名とは見なさず、それをワークフロー + プロファイルに抽象化します。 README によると、現在サポートされている指示は次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Claude / Anthropic-compatible&lt;/li&gt;
&lt;li&gt;OpenAI-compatible&lt;/li&gt;
&lt;li&gt;Codex Subscription&lt;/li&gt;
&lt;li&gt;GitHub Copilot&lt;/li&gt;
&lt;li&gt;Moonshot (Kimi)、GLM、MiniMax、およびその他の互換性のあるバックエンド&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これにより、特定のサービス プロバイダーに束縛されるのではなく、「マルチモデル、マルチエントリー」エージェント実行フレームワークに似たものになります。&lt;/p&gt;
&lt;h3 id=&#34;7-react-tui-と非対話型モード&#34;&gt;7. React TUI と非対話型モード
&lt;/h3&gt;&lt;p&gt;OpenHarness にはターミナルの対話型インターフェイスが付属しており、&lt;code&gt;oh&lt;/code&gt; を実行した後に React/Ink TUI に入ることができます。公式の README には、以下をサポートしていると記載されています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;コマンドセレクター&lt;/li&gt;
&lt;li&gt;許可の確認&lt;/li&gt;
&lt;li&gt;機種切り替え&lt;/li&gt;
&lt;li&gt;プロバイダースイッチ&lt;/li&gt;
&lt;li&gt;セッションの再開&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;対話型インターフェイスに入りたくない場合は、結果を標準出力、JSON、またはストリーミング JSON に出力するなど、非対話モードで単一のタスクを直接実行することもできます。これは、スクリプト作成や自動化のシナリオに適しています。&lt;/p&gt;
&lt;h2 id=&#34;03-ohmoとは&#34;&gt;03 &lt;code&gt;ohmo&lt;/code&gt;とは
&lt;/h2&gt;&lt;p&gt;OpenHarness が基盤となるインフラストラクチャである場合、&lt;code&gt;ohmo&lt;/code&gt; は、このインフラストラクチャ上に構築された「パーソナル エージェント アプリケーション」です。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;ohmo&lt;/code&gt; の位置付けはプロジェクトのホームページで非常に明確です。これは通常のチャットボットではなく、長時間の会話でも機能し続けるパーソナル アシスタントです。公式説明には、Feishu、Slack、Telegram、Discord、その他のチャネルでユーザーと対話し、次のようなタスクを実行できると記載されています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;フォークブランチ&lt;/li&gt;
&lt;li&gt;コードを書く&lt;/li&gt;
&lt;li&gt;テストの実行&lt;/li&gt;
&lt;li&gt;PRを始める&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;さらに、README では、&lt;code&gt;ohmo&lt;/code&gt; は既存の Claude Code または Codex サブスクリプション上で実行でき、必ずしも新しい API キーの追加アプリケーションを必要としないことも強調しています。これらのサブスクリプション ツールをすでに使用しているユーザーにとって、これは比較的参入障壁が低いです。&lt;/p&gt;
&lt;h2 id=&#34;04-どんなシーンに適していますか&#34;&gt;04 どんなシーンに適していますか？
&lt;/h2&gt;&lt;p&gt;このプロジェクトで現在公開されている機能から判断すると、OpenHarness は次のタイプの人々に適しています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;本番レベルのエージェントがどのような基本モジュールで構成されているかを調べたいと思っています。&lt;/li&gt;
&lt;li&gt;スケーラブルなオープンソースのエージェント オペレーティング レイヤーを自分で構築したい&lt;/li&gt;
&lt;li&gt;ツール、スキル、メモリ、権限、マルチエージェントの調整を同じフレームワークに組み込みたい&lt;/li&gt;
&lt;li&gt;単一のモデルメーカーや単一の顧客フォームに束縛されたくない&lt;/li&gt;
&lt;li&gt;既製のアーキテクチャに基づいた垂直分野のエージェントまたはパーソナルアシスタントであり続けたいですか?&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;あなたの目標が単に「直接チャットできる完成したアシスタントを見つける」ことである場合、OpenHarness オントロジーは最も軽い選択肢ではないかもしれません。ただし、エージェントのインフラストラクチャ、エンジニアリングの制御性、およびその後の拡張にもっと関心がある場合は、このプロジェクトを検討する価値があります。&lt;/p&gt;
&lt;h2 id=&#34;05-位置付けをすぐに理解する&#34;&gt;05 位置付けをすぐに理解する
&lt;/h2&gt;&lt;p&gt;一文の要約:&lt;/p&gt;
&lt;p&gt;**OpenHarness は、大規模なモデルを実際にタスクを実行できるエージェントに変換する責任を負い、&lt;code&gt;ohmo&lt;/code&gt; は、この一連の機能を、長期間使用できるパーソナル アシスタントにパッケージ化する責任があります。 **&lt;/p&gt;
&lt;p&gt;2 つのレイヤーに分割して確認することもできます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;OpenHarness: オープンソースの Agent Harness、本質はインフラストラクチャです&lt;/li&gt;
&lt;li&gt;ohmo: このインフラストラクチャ上に構築されたパーソナル エージェント アプリ&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;2026 年 4 月 12 日&lt;/strong&gt;の時点で、プロジェクトの GitHub ホームページには、更新が &lt;strong&gt;v0.1.6 (2026 年 4 月 10 日)&lt;/strong&gt; に進み、引き続き自動コンテキスト圧縮、MCP 転送機能、React TUI、およびマルチエージェント実行の安定性に重点が置かれていることが示されています。これは、まだ急速な進化段階にあることを示していますが、方向性はすでに非常に明確です。&lt;/p&gt;
&lt;h2 id=&#34;参考リンク&#34;&gt;参考リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHub プロジェクトのホームページ: &lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/OpenHarness&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/HKUDS/OpenHarness&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;英語の README: &lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/OpenHarness/blob/main/README.md&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/HKUDS/OpenHarness/blob/main/README.md&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;中国語の README: &lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/OpenHarness/blob/main/README.zh-CN.md&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/HKUDS/OpenHarness/blob/main/README.zh-CN.md&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Playwright CLI の入門: インストール、スキル、セッション管理、および一般的なコマンド</title>
        <link>https://www.knightli.com/ja/2026/04/12/playwright-cli-getting-started/</link>
        <pubDate>Sun, 12 Apr 2026 14:36:58 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/12/playwright-cli-getting-started/</guid>
        <description>&lt;p&gt;現在、ブラウザ自動化に Claude Code、GitHub Copilot、またはその他のコーディング エージェントを使用している場合、&lt;code&gt;microsoft/playwright-cli&lt;/code&gt; は注目に値する新しいツールです。これは、「コマンドを手動で入力するために使用される」従来の意味でのブラウザ ガジェットではなく、エージェントをコーディングするための Playwright CLI であり、トークン オーバーヘッドの低減、軽量のコマンド インターフェイス、およびスキル ワークフローとの統合を重視しています。&lt;/p&gt;
&lt;p&gt;公式 README から判断すると、Playwright CLI の核となる考え方は非常に明確です。モデル コンテキストに多数のツール スキーマとページ構造を詰め込む MCP と比較して、CLI コマンド方式はよりコンパクトで、大規模なコード ベース、テスト タスク、ブラウザ自動化の間を行き来するエージェント ワークフローにより適しています。&lt;/p&gt;
&lt;h2 id=&#34;01-playwright-cliとは何ですか&#34;&gt;01 Playwright CLIとは何ですか?
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;playwright-cli&lt;/code&gt; は、Microsoft がオープンソース化した Playwright コマンド ライン ツールです。公式説明は「一般的な Playwright アクション用の CLI」です。主に次のことを実現するために使用されます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ページを開いてブラウザを起動します&lt;/li&gt;
&lt;li&gt;Playwright コードを記録して生成する&lt;/li&gt;
&lt;li&gt;ページのスナップショットを取得し、要素の参照を取得します&lt;/li&gt;
&lt;li&gt;スクリーンショット、PDF のエクスポート&lt;/li&gt;
&lt;li&gt;コーディングエージェントと連携して自動テストとWebページ運用を行います。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;現在の GitHub README では、これを非常に明確に位置づけています。コーディング エージェントを使用している場合は、Playwright MCP よりも CLI の方が適していることがよくあります。永続的な状態、豊富なイントロスペクション、長いエージェント ループが必要な場合でも、MCP には価値があります。&lt;/p&gt;
&lt;p&gt;言い換えれば、Playwright CLI は、人間のエンジニアが Web ページを手動でクリックするための単なるツールではなく、「AI コーディング アシスタントのためのブラウザ自動化インターフェイス」に近いものです。&lt;/p&gt;
&lt;h2 id=&#34;02-そのメリットは何ですか&#34;&gt;02 そのメリットは何ですか?
&lt;/h2&gt;&lt;h3 id=&#34;1-エージェントのワークフローにさらに適した&#34;&gt;1. エージェントのワークフローにさらに適した
&lt;/h3&gt;&lt;p&gt;公式READMEには、最初の利点が&lt;code&gt;Token-efficient&lt;/code&gt;として直接書かれています。データのページ全体を LLM コンテキストに強制的に組み込むのではなく、エージェントはより短く、より特殊なコマンドを通じてブラウザを操作できるようになります。&lt;/p&gt;
&lt;p&gt;これはエージェントのコーディングにとって重要です。実際のプロジェクトでは、エージェントはブラウザを実行するだけでなく、コードの読み取り、ファイルの変更、テストの実行、ログの読み取りも行うためです。ブラウザ ツール自体が非常に「コンテキストを食べる」場合、全体の効率が大幅に低下します。&lt;/p&gt;
&lt;h3 id=&#34;2-スキルを使って作業する能力&#34;&gt;2. スキルを使って作業する能力
&lt;/h3&gt;&lt;p&gt;README では特に &lt;code&gt;playwright-cli install --skills&lt;/code&gt; を強調しています。これは、公式がこれを単なるシェルツールとして捉えておらず、Claude Code や GitHub Copilot などのエージェントが直接利用できるスキルの入り口として設計していることを示しています。&lt;/p&gt;
&lt;p&gt;ワークフロー自体がスキルに基づいて構築されている場合は、Playwright CLI への接続がより自然になります。&lt;/p&gt;
&lt;h3 id=&#34;3-セッション管理が比較的完了している&#34;&gt;3. セッション管理が比較的完了している
&lt;/h3&gt;&lt;p&gt;Playwright CLI はセッションをサポートします。デフォルトでは、ブラウザ プロファイルはメモリに保存され、同じセッション内の Cookie とストレージは複数の CLI 呼び出し間で保持されます。 &lt;code&gt;--persistent&lt;/code&gt; が追加された場合、プロファイルをディスクにドロップし、ブラウザを再起動しても引き続き使用することもできます。&lt;/p&gt;
&lt;p&gt;これにより、「コマンド 1 つでブラウザを開いて実行後に​​破棄する」というおもちゃのツールよりも実用的となり、継続的なデバッグやエージェントの長時間プロセスの実行にも適しています。&lt;/p&gt;
&lt;h3 id=&#34;4-視覚監視パネルが付属しています&#34;&gt;4. 視覚監視パネルが付属しています
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;playwright-cli show&lt;/code&gt; は README に含まれており、ダッシュボードを開いて実行中のすべてのブラウザー セッションを監視および制御するために使用されます。これは、ただやみくもに実行するのではなく、いつでも引き継ぎ、監視、トラブルシューティングを行うことができるため、エージェントがバックグラウンドで自動化されたタスクを実行するシナリオで役立ちます。&lt;/p&gt;
&lt;h2 id=&#34;03-設置および環境要件&#34;&gt;03 設置および環境要件
&lt;/h2&gt;&lt;p&gt;現在の GitHub README によると、Playwright CLI の基本要件は次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Node.js 18 以降&lt;/li&gt;
&lt;li&gt;Claude Code、GitHub Copilot、またはその他のコーディング エージェント&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;インストールコマンドは以下のとおりです。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;npm install -g @playwright/cli@latest
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli --help
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;ここには特に注意しなければならない非常に簡単な落とし穴があります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;現在推奨されている公式インストールは &lt;code&gt;@playwright/cli&lt;/code&gt; です。&lt;/li&gt;
&lt;li&gt;これを、npm 上の歴史的で非推奨となった古いパッケージ &lt;code&gt;playwright-cli&lt;/code&gt; と混同しないでください。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;つまり、実際にインストールする必要があるのは、古い時代からの同名の履歴パッケージではなく、スコープ指定されたパッケージです。&lt;/p&gt;
&lt;h2 id=&#34;04-始め方&#34;&gt;04 始め方
&lt;/h2&gt;&lt;h3 id=&#34;1-スキルをインストールする&#34;&gt;1. スキルをインストールする
&lt;/h3&gt;&lt;p&gt;コーディング エージェントに Playwright CLI を直接使用させたい場合は、最初にスキルをインストールすることが公式推奨されています。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli install --skills
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;README には、Claude Code や GitHub Copilot などのツールがローカルにインストールされたスキルを使用することが明確に記載されています。&lt;/p&gt;
&lt;h3 id=&#34;2-エージェントに-cli-を直接呼び出させる&#34;&gt;2. エージェントに CLI を直接呼び出させる
&lt;/h3&gt;&lt;p&gt;最初にスキルを処理したくない場合は、エージェントに CLI ヘルプ情報を直接読み取らせることもできます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Test the &amp;#34;add todo&amp;#34; flow on https://demo.playwright.dev/todomvc using playwright-cli.
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Check playwright-cli --help for available commands.
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;正式にはこの方法を「スキルレス操作」といいます。これは、スキルがプリインストールされていない場合でも、CLI 自己記述機能を通じてエージェントを駆動できることを意味します。&lt;/p&gt;
&lt;h3 id=&#34;3-最小限の工程を手動で体験&#34;&gt;3. 最小限の工程を手動で体験
&lt;/h3&gt;&lt;p&gt;README には、開始するのに非常に適した一連の TodoMVC サンプルが含まれています。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;8
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli open https://demo.playwright.dev/todomvc/ --headed
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli &lt;span class=&#34;nb&#34;&gt;type&lt;/span&gt; &lt;span class=&#34;s2&#34;&gt;&amp;#34;Buy groceries&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli press Enter
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli &lt;span class=&#34;nb&#34;&gt;type&lt;/span&gt; &lt;span class=&#34;s2&#34;&gt;&amp;#34;Water flowers&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli press Enter
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli check e21
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli check e35
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli screenshot
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;このコマンド セットの価値は、Playwright CLI がどのように対話するかをすぐに理解できることです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;open&lt;/code&gt; はページを開く責任があります&lt;/li&gt;
&lt;li&gt;&lt;code&gt;type&lt;/code&gt; および &lt;code&gt;press&lt;/code&gt; は入力を担当します&lt;/li&gt;
&lt;li&gt;&lt;code&gt;check&lt;/code&gt; 要素参照を使用したチェックボックスの操作&lt;/li&gt;
&lt;li&gt;&lt;code&gt;screenshot&lt;/code&gt; 結果を保存&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;05---headedセッションおよびモニタリングパネル&#34;&gt;05 &lt;code&gt;--headed&lt;/code&gt;、セッションおよびモニタリングパネル
&lt;/h2&gt;&lt;h3 id=&#34;--headed&#34;&gt;&lt;code&gt;--headed&lt;/code&gt;
&lt;/h3&gt;&lt;p&gt;Playwright CLI はデフォルトではヘッドレスです。ブラウザ ウィンドウを直接表示したい場合は、&lt;code&gt;--headed&lt;/code&gt; を &lt;code&gt;open&lt;/code&gt; に明示的に追加する必要があります。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli open https://playwright.dev --headed
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;これは、セレクター、ログイン プロセス、検証コードの前後のインタラクティブな観察のデバッグに便利です。&lt;/p&gt;
&lt;h3 id=&#34;session&#34;&gt;session
&lt;/h3&gt;&lt;p&gt;公式 README ではセッションの使用法が強調されています。異なるセッションを使用して、異なるプロジェクトまたは Web サイトを分離できます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli open https://playwright.dev
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli -s&lt;span class=&#34;o&#34;&gt;=&lt;/span&gt;example open https://example.com --persistent
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli list
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;エージェントを長時間動作させたい場合は、環境変数を直接指定することもできます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nv&#34;&gt;PLAYWRIGHT_CLI_SESSION&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;=&lt;/span&gt;todo-app claude .
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;一般的に使用されるセッション管理コマンドには次のものがあります。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli list
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli close-all
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli kill-all
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;で：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;list&lt;/code&gt; はすべてのセッションをリストするために使用されます&lt;/li&gt;
&lt;li&gt;&lt;code&gt;close-all&lt;/code&gt; は、すべてのブラウザを通常どおり閉じるために使用されます。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;kill-all&lt;/code&gt; は、すべてのブラウザ プロセスを強制的に終了するために使用されます。&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;監視パネル&#34;&gt;監視パネル
&lt;/h3&gt;&lt;p&gt;ブラウザでエージェントが現在何を行っているかを確認したい場合は、次のコマンドを実行できます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli show
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;README によると、このダッシュボードには主に 2 つのビューがあります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;セッション グリッド: すべてのアクティブなセッションをワークスペースごとに表示し、ライブ ビュー、URL、ページ タイトルを表示します。&lt;/li&gt;
&lt;li&gt;セッションの詳細: 単一セッションのリアルタイム インターフェイスを表示し、マウスとキーボードを引き継ぐこともできます&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これにより、Playwright CLI は「コマンドラインが利用可能」になるだけでなく、比較的成熟した可観測性も備えます。&lt;/p&gt;
&lt;h2 id=&#34;06-最初に覚えるべき一般的なコマンドはどれですか&#34;&gt;06 最初に覚えるべき一般的なコマンドはどれですか?
&lt;/h2&gt;&lt;p&gt;Playwright CLI を初めて使用する場合は、最初からすべてのコマンドを覚える必要はありません。最初に次の中心点を覚えておくだけで十分です。&lt;/p&gt;
&lt;h3 id=&#34;ページとインタラクション&#34;&gt;ページとインタラクション
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli open &lt;span class=&#34;o&#34;&gt;[&lt;/span&gt;url&lt;span class=&#34;o&#34;&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli goto &amp;lt;url&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli click &amp;lt;ref&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli fill &amp;lt;ref&amp;gt; &amp;lt;text&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli &lt;span class=&#34;nb&#34;&gt;type&lt;/span&gt; &amp;lt;text&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli hover &amp;lt;ref&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli press &amp;lt;key&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;ページ構造を取得する&#34;&gt;ページ構造を取得する
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli snapshot
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli snapshot &amp;lt;ref&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli snapshot --depth&lt;span class=&#34;o&#34;&gt;=&lt;/span&gt;N
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli &lt;span class=&#34;nb&#34;&gt;eval&lt;/span&gt; &amp;lt;func&amp;gt; &lt;span class=&#34;o&#34;&gt;[&lt;/span&gt;ref&lt;span class=&#34;o&#34;&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;後続の多くの操作は要素参照 &lt;code&gt;ref&lt;/code&gt; に依存するため、&lt;code&gt;snapshot&lt;/code&gt; は重要です。通常は、最初にスナップショットを取得し、次に返された要素番号を使用してクリック、入力、チェック、またはスクリーンショットの取得を行います。&lt;/p&gt;
&lt;h3 id=&#34;出力結果&#34;&gt;出力結果
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli screenshot
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli pdf
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id=&#34;タブページ&#34;&gt;タブページ
&lt;/h3&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli tab-list
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli tab-new &lt;span class=&#34;o&#34;&gt;[&lt;/span&gt;url&lt;span class=&#34;o&#34;&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli tab-close &lt;span class=&#34;o&#34;&gt;[&lt;/span&gt;index&lt;span class=&#34;o&#34;&gt;]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;playwright-cli tab-select &amp;lt;index&amp;gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id=&#34;07-どんな人に向いていますか&#34;&gt;07 どんな人に向いていますか？
&lt;/h2&gt;&lt;p&gt;次のいずれかのシナリオに該当する場合は、Playwright CLI を試してみる価値があります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;E2E テストに Claude Code、Copilot、またはその他のコーディング エージェントを使用している&lt;/li&gt;
&lt;li&gt;ブラウザ自動化インターフェイスをより軽量にしたいが、コンテキストに多くのページ構造を詰め込みたくない場合&lt;/li&gt;
&lt;li&gt;複数のコマンド間で同じブラウザ セッションを維持したい場合&lt;/li&gt;
&lt;li&gt;エージェントが Web ページ タスクを自動的に実行するとき、いつでも監視パネルを開いて進行状況を観察したいと考えています。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;「ブラウザの自動化がコーディング エージェントとどのように効果的に連携できるか」が仕事の焦点である場合、Playwright CLI は従来の人による手動のデバッグ方法よりも便利である可能性があります。&lt;/p&gt;
&lt;h2 id=&#34;参考リンク&#34;&gt;参考リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHub: &lt;a class=&#34;link&#34; href=&#34;https://github.com/microsoft/playwright-cli&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/microsoft/playwright-cli&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;README: &lt;a class=&#34;link&#34; href=&#34;https://github.com/microsoft/playwright-cli/blob/main/README.md&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/microsoft/playwright-cli/blob/main/README.md&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Hermes Agent とは: 概要、利点、クイック スタート、OpenClaw との比較</title>
        <link>https://www.knightli.com/ja/2026/04/12/hermes-agent-intro-guide-vs-openclaw/</link>
        <pubDate>Sun, 12 Apr 2026 14:07:58 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/12/hermes-agent-intro-guide-vs-openclaw/</guid>
        <description>&lt;p&gt;最近オープンソース AI エージェントに注目している場合、&lt;code&gt;Hermes Agent&lt;/code&gt; は注目に値する新しいプロジェクトです。ヌース・リサーチ社によって発売されました。その中心的なセールスポイントは、「別のチャット シェルを作成する」ことではなく、長期記憶、スキルの蓄積、コンテキスト ファイル、MCP 拡張機能、メッセージ ゲートウェイ、およびサブエージェントの並列処理の機能を統合エージェント実行環境に統合しようとすることです。&lt;/p&gt;
&lt;p&gt;公式 README から判断すると、Hermes Agent の目標は非常に明確です。ローカル CLI アシスタントのように、またはクラウドに常駐するパーソナル アシスタントのようにターミナル内で動作し、Telegram、Discord、Slack、WhatsApp、Signal などのチャネルを通じて継続的に話しかけることができます。この位置付けは、「コード アシスタント」、「自動化アシスタント」、「パーソナル AI ワークベンチ」を 1 つのシステムに組み合わせたいユーザーにとって、非常に魅力的です。&lt;/p&gt;
&lt;h2 id=&#34;01-エルメス代理店紹介&#34;&gt;01 エルメス代理店紹介
&lt;/h2&gt;&lt;p&gt;Hermes Agent は、Nous Research が開発したオープンソースの自己改善型 AI エージェントです。 Nous Portal、OpenRouter、OpenAI、カスタム OpenAI 互換エンドポイントなど、複数のモデル プロバイダーをサポートします。また、ローカル ターミナル、Docker、SSH、Daytona、Modal などのさまざまな実行バックエンドでの実行もサポートされます。&lt;/p&gt;
&lt;p&gt;多くの「ツールを呼び出すことができるチャットボット」との最大の違いは、Hermes は 1 つのセッションでのツール呼び出しだけを重視するのではなく、セッション全体での継続的な機能構築を重視していることです。公式ドキュメントでは、このアイデアをいくつかの部分に分割しています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;永続メモリ: &lt;code&gt;MEMORY.md&lt;/code&gt; および &lt;code&gt;USER.md&lt;/code&gt; を通じて、環境、プロジェクト、およびユーザー設定に関する重要な情報を保存します。&lt;/li&gt;
&lt;li&gt;スキル システム: 複雑なタスクで学習したプロセスをスキルにまとめ、オンデマンドでロードします。&lt;/li&gt;
&lt;li&gt;コンテキスト ファイル: &lt;code&gt;AGENTS.md&lt;/code&gt;、&lt;code&gt;SOUL.md&lt;/code&gt;、&lt;code&gt;.cursorrules&lt;/code&gt; およびその他のファイルを自動的に読み取り、プロジェクト規約をセッションに直接挿入します。&lt;/li&gt;
&lt;li&gt;MCP の統合: MCP 互換のツール サーバーに接続して、データベース、GitHub、ファイル システム、クロールなどの機能を拡張できます。&lt;/li&gt;
&lt;li&gt;メッセージ ゲートウェイ: CLI に加えて、Telegram、Discord、Slack、WhatsApp、Signal、電子メール、その他のポータル経由でも使用できます。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;一言で要約すると、Hermes Agent は「メモリ、スキル、スケーラビリティ、およびマルチエンド アクセスを備えたユニバーサル エージェント操作層」に似ています。&lt;/p&gt;
&lt;h2 id=&#34;02-そのメリットは何ですか&#34;&gt;02 そのメリットは何ですか?
&lt;/h2&gt;&lt;h3 id=&#34;1-cli-ワークフローとメッセージング-ワークフローの両方をカバーする&#34;&gt;1. CLI ワークフローとメッセージング ワークフローの両方をカバーする
&lt;/h3&gt;&lt;p&gt;エージェントプロジェクトの多くは「端末内開発アシスタント」か「チャットプラットフォームロボット」のどちらかです。エルメスがやりたいのは、これら 2 つを融合することです。ターミナルで &lt;code&gt;hermes&lt;/code&gt; を直接実行することも、ゲートウェイを起動して Telegram または Discord から同じアシスタントを継続することもできます。&lt;/p&gt;
&lt;p&gt;このデザインの良いところは、エルメスが「コンピューターの前に座っているときにだけ使える」ということに限定されていないことです。クラウドまたは VPS に導入すると、常にオンラインのパーソナル AI アシスタントになります。&lt;/p&gt;
&lt;h3 id=&#34;2長期使用をより徹底して考える&#34;&gt;2.「長期使用」をより徹底して考える
&lt;/h3&gt;&lt;p&gt;ヘルメスは単にチャットやツールの調整を行うだけではなく、長期的な蓄積も重視しています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;無限のヒープ コンテキストではなく、制限された永続メモリ。&lt;/li&gt;
&lt;li&gt;成功したプロセスを保存して再利用できるスキル システムがあります。&lt;/li&gt;
&lt;li&gt;過去のセッションを検索し、セッション間の呼び出しを実行する機能。&lt;/li&gt;
&lt;li&gt;プロジェクト内のコンテキスト ファイルを読み取ることができるため、プロジェクトの背景を毎回繰り返し説明する必要性が軽減されます。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは、固定されたコード ベース、固定されたワークフロー、固定されたチーム基準で繰り返し作業することが多いユーザーにとって重要です。これは、エージェントが「今回はあなたのために何かをしてくれる」だけではなく、徐々にあなたの環境をよりよく理解するようになるということを意味します。&lt;/p&gt;
&lt;h3 id=&#34;3-mcp-サポートにより拡張性が非常に強力になります&#34;&gt;3. MCP サポートにより拡張性が非常に強力になります
&lt;/h3&gt;&lt;p&gt;hermes の公式ドキュメントでは、MCP を明確にサポートしており、stdio と HTTP という 2 つのアクセス方法について説明しています。言い換えれば、外部システムにすでに MCP サーバーがある限り、Hermes は理論的には低コストでそれにアクセスできます。&lt;/p&gt;
&lt;p&gt;これは、単一システムに対して毎回個別のプラグインを作成するよりも柔軟です。 MCP エコシステムに多数のツールを蓄積している人にとって、Hermes へのアクセス コストははるかに低くなります。&lt;/p&gt;
&lt;h3 id=&#34;4-openclaw-ユーザーに優しい&#34;&gt;4. OpenClaw ユーザーに優しい
&lt;/h3&gt;&lt;p&gt;これはとても興味深いですね。 Hermes README には &lt;code&gt;hermes claw migrate&lt;/code&gt; が直接提供されており、構成、メモリ、スキル、API キー、メッセージング プラットフォームの設定などを OpenClaw からインポートできることが記載されています。&lt;/p&gt;
&lt;p&gt;これは、既存のエコロジーを完全に無視して車輪を再発明しているわけではなく、一部の OpenClaw ユーザーを潜在的な移行ターゲットとして明確にみなしていることを示しています。&lt;/p&gt;
&lt;h2 id=&#34;03-すぐに始める方法&#34;&gt;03 すぐに始める方法
&lt;/h2&gt;&lt;p&gt;公式に推奨されている Hermes Agent のインストール方法は非常に簡単です。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh &lt;span class=&#34;p&#34;&gt;|&lt;/span&gt; bash
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;公式の手順では、Linux、macOS、WSL2、Android の Termux がサポートされています。 README には、ネイティブ Windows はまだサポートされていないため、Windows ユーザーには WSL2 を使用することが推奨されていることが明記されていることに注意してください。&lt;/p&gt;
&lt;p&gt;インストールが完了したら、通常は最初にシェルを更新します。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;source&lt;/span&gt; ~/.bashrc
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;その後、直接開始できます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;hermes
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;段階的に完全な初期化を完了したい場合、最も心配のないコマンドは次のとおりです。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;hermes setup
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;公式ドキュメントと README によると、初めて開始するには次の手順に従うことができます。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;code&gt;hermes setup&lt;/code&gt; を実行して、基本構成を完了します。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;hermes model&lt;/code&gt; を使用して、モデルプロバイダーとモデルを選択します。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;hermes tools&lt;/code&gt; スイッチにはツールセットが必要です。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;hermes&lt;/code&gt; を直接実行して対話型 CLI に入ります。&lt;/li&gt;
&lt;li&gt;Telegram や Discord などのチャネルに接続する場合は、&lt;code&gt;hermes gateway&lt;/code&gt; の構成を続けます。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;OpenClaw ユーザーの場合は、移行コマンドを確認することもできます。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;hermes claw migrate --dry-run
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;正式にインポートするかどうかを決定する前に、移行可能なコンテンツをプレビューします。&lt;/p&gt;
&lt;h2 id=&#34;04-と-openclaw-はどうですか&#34;&gt;04 と OpenClaw はどうですか?
&lt;/h2&gt;&lt;p&gt;公式ドキュメントや README から判断すると、Hermes Agent と OpenClaw は単に「誰が誰を置き換えるか」というだけではなく、位置づけにおいては明らかに重複していますが、焦点は異なります。&lt;/p&gt;
&lt;h3 id=&#34;ヘルメスエージェントとはどのようなものですか&#34;&gt;ヘルメスエージェントとはどのようなものですか?
&lt;/h3&gt;&lt;p&gt;エルメスはどちらかというとエージェントコアとワークフローシステムに重点を置いた製品です。それが強調していることは次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;CLI の経験&lt;/li&gt;
&lt;li&gt;記憶とスキルの蓄積&lt;/li&gt;
&lt;li&gt;プロジェクトコンテキストファイル&lt;/li&gt;
&lt;li&gt;MCP拡張子&lt;/li&gt;
&lt;li&gt;サブエージェントの並列処理&lt;/li&gt;
&lt;li&gt;ローカル、コンテナ、リモート、サーバーレス環境間で実行バックエンドを切り替える&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;あなたの主な要求が「エージェントにプロジェクトをよりよく理解させ、継続的な再利用機能を向上させ、MCP と開発ワークフローへの接続を容易にする」ことである場合、Hermes の方向性はより便利になります。&lt;/p&gt;
&lt;h3 id=&#34;openclaw-とはどのようなものですか&#34;&gt;OpenClaw とはどのようなものですか?
&lt;/h3&gt;&lt;p&gt;OpenClaw は、パーソナル AI アシスタントとメッセージング ゲートウェイを中心としたプラットフォームです。それは次のように強調します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;メッセージチャネルへの非常に豊富なアクセス&lt;/li&gt;
&lt;li&gt;ゲートウェイを実行する常駐者&lt;/li&gt;
&lt;li&gt;ブラウザーでの UI の制御&lt;/li&gt;
&lt;li&gt;デバイスのペアリング、リモートアクセス、ステータス管理&lt;/li&gt;
&lt;li&gt;音声、モバイル、キャンバスなどの強力なアシスタント形式。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;「さまざまなチャット チャネルやデバイス上でパーソナル AI アシスタントを安定させる」ことが主なニーズであり、コントロール パネルを使用して均一に管理したい場合は、OpenClaw の製品感が強くなります。&lt;/p&gt;
&lt;h3 id=&#34;より現実的な選択の提案&#34;&gt;より現実的な選択の提案
&lt;/h3&gt;&lt;p&gt;この 2 つは単純に次のように理解できます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ヘルメスエージェント：「成長する総合エージェントのワークベンチ」&lt;/li&gt;
&lt;li&gt;OpenClaw: 「マルチチャネル常駐パーソナル AI アシスタント プラットフォーム」のようなもの&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;もちろん、この違いは絶対的なものではなく、双方とも機能を拡張し続けており、Hermes は OpenClaw からの移行パスも提供しています。しかし、少なくとも現在の公開情報から判断すると、Hermes は「メモリ、スキル、コンテキスト、MCP、開発ワークフロー」の分野でより顕著です。 OpenClaw は、「ゲートウェイ、マルチチャネル、コントロール UI、デバイス アクセス」の分野でより成熟しています。&lt;/p&gt;
&lt;h2 id=&#34;05-どんな人に試してほしいの&#34;&gt;05 どんな人に試してほしいの？
&lt;/h2&gt;&lt;p&gt;あなたが次のカテゴリーに属する人であれば、Hermes Agent を最初に試してみる価値があります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;あなたはターミナルで AI ツールを広範囲に使用しており、エージェントがコード ベースとプロジェクト ルールをよりよく理解できるようになることを期待しています。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;AGENTS.md&lt;/code&gt;、スキル、記憶、MCP 能力を組み合わせたいと考えています。&lt;/li&gt;
&lt;li&gt;単一のモデル ベンダーに縛られることなく、柔軟にプロバイダーを切り替えられるようにしたいと考えています。&lt;/li&gt;
&lt;li&gt;以前に OpenClaw を使用していましたが、今度はよりエージェント指向のワークフローの方向を試したいと考えています。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;より多くのモバイルリーチ、さまざまな IM プラットフォームへのアクセス、ブラウザ コンソール、および「常時接続のパーソナル アシスタントの感覚」を重視する場合は、OpenClaw が依然として魅力的です。&lt;/p&gt;
&lt;h2 id=&#34;参考リンク&#34;&gt;参考リンク
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;Hermes Agent GitHub: &lt;a class=&#34;link&#34; href=&#34;https://github.com/NousResearch/hermes-agent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/NousResearch/hermes-agent&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;ヘルメスエージェントドキュメント: &lt;a class=&#34;link&#34; href=&#34;https://hermes-agent.nousresearch.com/docs/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://hermes-agent.nousresearch.com/docs/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Hermes Features Overview: &lt;a class=&#34;link&#34; href=&#34;https://hermes-agent.nousresearch.com/docs/user-guide/features/overview&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://hermes-agent.nousresearch.com/docs/user-guide/features/overview&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Hermes MCP: &lt;a class=&#34;link&#34; href=&#34;https://hermes-agent.nousresearch.com/docs/user-guide/features/mcp/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://hermes-agent.nousresearch.com/docs/user-guide/features/mcp/&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;OpenClaw GitHub: &lt;a class=&#34;link&#34; href=&#34;https://github.com/openclaw/openclaw&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/openclaw/openclaw&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;OpenClaw Getting Started: &lt;a class=&#34;link&#34; href=&#34;https://docs.openclaw.ai/start/quickstart&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://docs.openclaw.ai/start/quickstart&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;OpenClaw Control UI: &lt;a class=&#34;link&#34; href=&#34;https://docs.openclaw.ai/web/control-ui&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://docs.openclaw.ai/web/control-ui&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>OpenClaw 脳に似た記憶アルゴリズム 夢を見る: 機械は夢を見始めるが、人間は不眠症になる</title>
        <link>https://www.knightli.com/ja/2026/04/12/openclaw-dreaming-machine-dreams-humans-lose-sleep/</link>
        <pubDate>Sun, 12 Apr 2026 12:41:34 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/12/openclaw-dreaming-machine-dreams-humans-lose-sleep/</guid>
        <description>&lt;p&gt;大規模モデルの長期記憶は常に問題でした。コンテキストが蓄積すればするほど、情報が混乱しやすくなります。知的なエージェントはすべてを覚えているように見えますが、実際には、何が重要で、何が忘れるべきかを判断することがますます困難になります。&lt;/p&gt;
&lt;p&gt;4 月 5 日、OpenClaw は新バージョンの実験機能「Dreaming」を開始しました。これは派手な名前ではなく、人間の睡眠プロセスを模倣する一連のバックグラウンド記憶構成メカニズムです。目標は非常に単純で、知的エージェントが目覚めた後により正確に記憶できるようにすることです。&lt;/p&gt;
&lt;h2 id=&#34;01-睡眠アルゴリズム記憶整理を3段階に分ける&#34;&gt;01 睡眠アルゴリズム：記憶整理を3段階に分ける
&lt;/h2&gt;&lt;p&gt;夢を見ることは単にインデックスを作成することではなく、人間の睡眠中のさまざまな機能に対応して、記憶を 3 つの論理的な段階に編成します。&lt;/p&gt;
&lt;p&gt;浅い睡眠: システムは最初に最近の会話と思い出の記録をスキャンし、重複の削除と予備的なスクリーニングを実行して、候補コンテンツを生成します。この段階では、一時的な保存のみが実行され、コア メモリ ファイル &lt;code&gt;MEMORY.md&lt;/code&gt; は直接変更されません。&lt;/p&gt;
&lt;p&gt;ディープ スリープ: システムは、ルールに従って価値の高い情報のフィルタリングを開始します。最低の評価、最低のリコール数、最低の固有クエリ数を満たす情報のみが次のステップに進みます。書き込む前に、最新のログが再度比較され、古い内容が削除されます。最後に、結果は &lt;code&gt;MEMORY.md&lt;/code&gt; に追加され、ディープ スリープの概要が &lt;code&gt;DREAMS.md&lt;/code&gt; に残ります。&lt;/p&gt;
&lt;p&gt;急速眼球運動段階 (REM): 記憶が定着した後、システムはさらに短期の行動追跡を分析し、異なる情報間の潜在的なつながりを探し、パターンの要約と反映内容を生成します。この部分は、エージェントが複雑なタスクを処理するときに全体の状況をより簡単に把握できるように、専用の REM ブロックに書き込まれます。&lt;/p&gt;
&lt;p&gt;マシン自体の記憶整理メカニズムに加えて、Dreaming は人間の読書により適した「夢日記」も生成します。素材がある程度溜まるとバックグラウンドサブエージェントがデフォルトモデルを呼び出して&lt;code&gt;DREAMS.md&lt;/code&gt;に簡潔な記述を追加します。&lt;/p&gt;
&lt;h2 id=&#34;02-採点の仕組み何を残し何を忘れるべきかを決める&#34;&gt;02 採点の仕組み：何を残し、何を忘れるべきかを決める
&lt;/h2&gt;&lt;p&gt;夢を見るための鍵は「整理する」だけではなく「ふるい分ける」ことです。 OpenClaw は、大規模なフルスケール ストレージを使用し続ける代わりに、重み付けされたスコアリング メカニズムを使用して、どの情報を長期記憶に入れる価値があるかを判断します。&lt;/p&gt;
&lt;p&gt;このメカニズムは主に次の 6 つの次元に注目します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;関連性の重み (30%): 情報が検索されたときに役立つかどうかを測定します。&lt;/li&gt;
&lt;li&gt;頻度重み付け (24%): ある情報が繰り返し言及された回数をカウントします。&lt;/li&gt;
&lt;li&gt;クエリの多様性 (15%): さまざまな質問やシナリオにわたってそれが現れるかどうかを確認します。&lt;/li&gt;
&lt;li&gt;適時性の重み (15%): より新しい情報に高い優先度を与えます。&lt;/li&gt;
&lt;li&gt;統合の重み (10%): 情報が複数の日に渡って安定して表示されるかどうかを確認します。&lt;/li&gt;
&lt;li&gt;コンセプトの豊富さ (6%): その背後にある関連コンセプトが十分に充実しているかどうかを判断します。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは、システムが長期記憶にすべてを詰め込むのではなく、繰り返し表示され、問題を解決し、時代を超えた情報を保持することを優先することを意味します。&lt;/p&gt;
&lt;h2 id=&#34;03-なぜクロードの夢の考えを人々に思い出させるのでしょうか&#34;&gt;03 なぜクロードの「夢」の考えを人々に思い出させるのでしょうか?
&lt;/h2&gt;&lt;p&gt;一部の開発者は、OpenClaw の Dreaming アップグレードの背後にあるアイデアが、Claude Code の漏洩コードに登場した KAIROS 自動ドリーミング メカニズムと非常によく似ていると信じています。以前は、&lt;code&gt;MEMORY.md&lt;/code&gt; 全体の読み取りと書き込みを繰り返す方法では、後の段階でメモリ システムがますます肥大化する可能性がありました。一方、Dreaming はプロセスを浅い睡眠の統合、深い睡眠の固化、REM の関連付けに分割します。ロジックは明らかにより明確で、「最初に組織化し、次に沈殿させ、次に精製する」というアイデアに近くなります。&lt;/p&gt;
&lt;p&gt;神経科学の観点からこのデザインを肯定する人もいます。なぜなら、夢、浅い睡眠、深い睡眠、レムの概念は単なるランダムな名前ではなく、記憶を定着させるために明らかに人間の睡眠モデルから借用したものだからです。&lt;/p&gt;
&lt;p&gt;OpenClaw の既存の &lt;code&gt;IDENTITY.md&lt;/code&gt;、&lt;code&gt;USER.md&lt;/code&gt;、&lt;code&gt;HEARTBEAT.md&lt;/code&gt; はすでにエージェントの個性、ユーザー コンテキスト、実行継続性を提供していますが、&lt;code&gt;DREAMS.md&lt;/code&gt; が追加するのは「どの記憶を保持するか」を指定する機能です。&lt;/p&gt;
&lt;h2 id=&#34;04-最も皮肉なシーン-機械は夢を見ることを学ぶが人間は眠れない&#34;&gt;04 最も皮肉なシーン: 機械は夢を見ることを学ぶが、人間は眠れない
&lt;/h2&gt;&lt;p&gt;Dreaming の本当の価値は、AI にすべてを記憶させることではなく、短期記憶を見直し、基礎となるパターンを抽出し、ノイズをフィルターする方法を学習させることです。本当に役立つエージェントは、モバイル ハード ドライブのように丸暗記するのではなく、ユーザーの好み、目標、背景をますます理解する必要があります。&lt;/p&gt;
&lt;p&gt;工学的な観点から見ると、このメカニズムの最も注目すべき点は、それが神秘的ではないということです。これはブラック ボックス マジックではなく、ステージ、しきい値、反映、および忘却ルールを備えた一連のバックグラウンド プロセスです。この設計により、AI の記憶メカニズムが、単なる「コンテキストの無限のヒープ」ではなく、初めて「制御可能なシステム」のように見えます。&lt;/p&gt;
&lt;p&gt;しかし、それが全体を少し皮肉なものにしているのです。私たちは機械に人間のように夢を見る方法を教えるために多大なリソースを投資していますが、同時に多くの人々がこれらのますますスマート化するシステムに取って代わられるのではないかという恐怖で眠れなくなっています。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>MCPを捨てますか？ CLI がエージェントのデフォルトのツール層になりつつある理由</title>
        <link>https://www.knightli.com/ja/2026/04/10/mcp-vs-cli-for-agents/</link>
        <pubDate>Fri, 10 Apr 2026 21:55:12 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/10/mcp-vs-cli-for-agents/</guid>
        <description>&lt;p&gt;過去 1 年間、エージェント ツールチェーンに関する議論は、次の 1 つの問題にますます集中してきました。&lt;/p&gt;
&lt;p&gt;MCP (モデル コンテキスト プロトコル) はツールの呼び出しを簡単にしますか? それとも、もともと単純だったものを複雑にしますか?&lt;/p&gt;
&lt;p&gt;CLI は、ほとんどの日常的な開発タスクにとって、より実用的なデフォルトになりつつあります。&lt;/p&gt;
&lt;h2 id=&#34;コストの違いは経験の問題ではなく桁違いの問題です&#34;&gt;コストの違いは「経験の問題」ではなく、桁違いの問題です
&lt;/h2&gt;&lt;p&gt;MCP に対する実際の最大のプレッシャーはトークンのオーバーヘッドです。&lt;/p&gt;
&lt;p&gt;一般的なシナリオでは、MCP は実際にタスクを実行する前に、多数のツール スキーマをロードする必要があります。 GitHub MCP サーバーを例に挙げると、初期化で数万のトークンが消費される可能性があります。長いタスクの場合、これはコンテキスト バジェットを直接圧迫します。&lt;/p&gt;
&lt;p&gt;コミュニティのベンチマークは、同じ結論を繰り返し示しています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;1 回の MCP 呼び出しのコストは、通常、CLI の数倍から数十倍になります。&lt;/li&gt;
&lt;li&gt;失敗した再試行のコストも高くなります (接続の再構築とコンテキストの再ロード)。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは「遅い」というギャップではなく、むしろ API 料金、レイテンシー、安定性の問題にまで拡大します。&lt;/p&gt;
&lt;h2 id=&#34;モデルが自然にcli-に精通している理由&#34;&gt;モデルが自然に「CLI に精通している」理由
&lt;/h2&gt;&lt;p&gt;見落とされがちな事実は、トレーニングの分布です。&lt;/p&gt;
&lt;p&gt;LLM は、トレーニング中にコマンド、出力、エラー レポート、スクリプト、マニュアル ページなどの大量の端末テキストを確認しました。言い換えれば、CLI 対話モードは本質的にモデルの「母国語入力」に近いものになります。&lt;/p&gt;
&lt;p&gt;それどころか、MCP の JSON-RPC とツール スキーマは、ここ 2 年間で大規模に登場したばかりの新しいパラダイムです。モデルは確かに学習できますが、親しみやすさと圧縮効率は通常、CLI などの歴史的コーパスほど良くありません。&lt;/p&gt;
&lt;p&gt;これは、その理由を何度も説明するものでもあります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;目標は同じですが、CLI 命令は短くなります&lt;/li&gt;
&lt;li&gt;出力は推論を直接続行するのにより適しています。&lt;/li&gt;
&lt;li&gt;エラー回復パスの安定性が向上&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;安全と隔離mcpにはまだ補講の余地があります&#34;&gt;安全と隔離：MCPにはまだ補講の余地があります
&lt;/h2&gt;&lt;p&gt;MCP がセキュリティを実現できないわけではありませんが、エコシステムはまだ初期段階にあります。&lt;/p&gt;
&lt;p&gt;現在の一般的な懸念事項は次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ツール中毒&lt;/li&gt;
&lt;li&gt;サービス動作のドリフト (ラグプル)&lt;/li&gt;
&lt;li&gt;同名のツール「シャドウイング」&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;もちろん、CLI にもセキュリティの問題 (インジェクション、不正アクセス、パスのリスク) がありますが、そのプロセス モデル、権限の境界、監査リンクは数十年にわたるエンジニアリングの実践によって検証されています。本番環境では、この「予測可能性」が重要です。&lt;/p&gt;
&lt;h2 id=&#34;これはmcpが無価値であるという意味ではありません&#34;&gt;これはMCPが無価値であるという意味ではありません
&lt;/h2&gt;&lt;p&gt;私はMCPを放棄すべきではないと思います。&lt;/p&gt;
&lt;p&gt;より合理的な位置付けは次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;CLI は実行層 (ローカル、低遅延、高頻度の呼び出し) を担当します。&lt;/li&gt;
&lt;li&gt;MCP は接続層 (リモート サービス ディスカバリ、統合認証、監査、マルチテナント) を担当します。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;一般に、ハイブリッド アーキテクチャ: &lt;code&gt;CLI + MCP Gateway&lt;/code&gt; とも呼ばれます。&lt;/p&gt;
&lt;p&gt;多数のリモート システムに接続し、統合された権限管理とコンプライアンス監査を実行する必要がある場合、MCP には依然として明白な価値があります。しかし、「エージェントが開発タスクを迅速に完了できるようにする」という点では、多くの場合、CLI ファーストの方が現在のモデルの機能の境界に沿っています。&lt;/p&gt;
&lt;p&gt;今日のエンジニアリングの現実では、CLI はエージェントの母国語に似ています。 MCP は、唯一の実行プロトコルではなく、接続プロトコルとして適しています。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>OpenClaw と Agent Harness: なぜ AGI のように見えるのか</title>
        <link>https://www.knightli.com/ja/2026/04/10/openclaw-agent-architecture-enterprise-ai/</link>
        <pubDate>Fri, 10 Apr 2026 09:16:17 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/10/openclaw-agent-architecture-enterprise-ai/</guid>
        <description>&lt;p&gt;初めて OpenClaw に触れた人の多くは、「チャットボットというよりも、何かができる同僚に近い」と感じるでしょう。&lt;/p&gt;
&lt;p&gt;この感覚には何も不思議なことはありません。重要な点は、OpenClaw は単一モデルの機能を飛躍的に向上させたものではなく、完全な &lt;strong&gt;エージェント ハーネス&lt;/strong&gt; であるということです。&lt;/p&gt;
&lt;h2 id=&#34;結論を先に言ってください&#34;&gt;結論を先に言ってください
&lt;/h2&gt;&lt;p&gt;OpenClaw の本質は次のように要約できます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;モデルは理解と意思決定を担当します&lt;/li&gt;
&lt;li&gt;ハーネスはメモリ、ツール、トリガー、実行、出力を担当します。&lt;/li&gt;
&lt;li&gt;両者はサイクルを通じて協力し、「継続的なアクション」の体験を形成します。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;したがって、それが「AGI に似ている」主な理由は、モデルが突然全能になることではなく、システム エンジニアリングによってモデルの実行可能性が増幅されることです。&lt;/p&gt;
&lt;h2 id=&#34;ハーネスとは&#34;&gt;ハーネスとは
&lt;/h2&gt;&lt;p&gt;ハーネスは「モデルが着用する外骨格」と理解できます。&lt;/p&gt;
&lt;p&gt;スタンドアロン LLM は通常、単一のリクエストでのみ回答を提供でき、Harness はこれらの機能を完了します。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;セッションと状態の管理: 複数のラウンドのタスクをつなぎ合わせる&lt;/li&gt;
&lt;li&gt;メモリメカニズム: オンデマンドでコンテキストを保存および呼び出し&lt;/li&gt;
&lt;li&gt;ツール システム: ブラウザ、端末、ファイル、外部 API の呼び出し&lt;/li&gt;
&lt;li&gt;トリガーメカニズム: タイマーまたはイベントによって起動し、毎回誰かが質問するのを待つ必要はありません。&lt;/li&gt;
&lt;li&gt;出力チャネル: 単なるテキストではなく、結果をシステムに書き戻します。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;これらの機能が同じループに接続されると、モデルは「レスポンダー」から「エグゼキューター」に変わります。&lt;/p&gt;
&lt;h2 id=&#34;openclaw-の外観が異なる理由&#34;&gt;OpenClaw の外観が異なる理由
&lt;/h2&gt;&lt;p&gt;従来のチャットボットは「1 回質問し、1 回回答」です。&lt;/p&gt;
&lt;p&gt;OpenClaw は、「観察 -&amp;gt; ツールの調整 -&amp;gt; 結果の確認 -&amp;gt; 意思決定」という閉ループに似ています。クローズドループが確立されると、タスクを継続的に進める能力を発揮します。&lt;/p&gt;
&lt;p&gt;これは、OpenClaw について学ぶべき最も価値のあることでもあります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;エージェントのエクスペリエンスは主にアーキテクチャ設計から得られることが証明されています&lt;/li&gt;
&lt;li&gt;「自律性」をエンジニアリングモジュールに分割します&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;価値観と境界線&#34;&gt;価値観と境界線
&lt;/h2&gt;&lt;p&gt;OpenClaw の利点は多用途性と柔軟性があることですが、価格も明らかです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;コンテキストとツールの定義が増えるほど、コストが高くなります&lt;/li&gt;
&lt;li&gt;システムが一般的であればあるほど、デバッグと管理はより複雑になります&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;本番環境のシナリオでは、多くのチームが「万能エージェント」ではなく、より小規模で専門性の高いエージェントを選択します。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Anthropic による OpenClaw 禁止の完全なタイムライン</title>
        <link>https://www.knightli.com/ja/2026/04/08/anthropic-openclaw-timeline-2026-04/</link>
        <pubDate>Wed, 08 Apr 2026 19:48:42 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/04/08/anthropic-openclaw-timeline-2026-04/</guid>
        <description>&lt;h2 id=&#34;イベントの背景&#34;&gt;イベントの背景
&lt;/h2&gt;&lt;p&gt;2026 年 4 月 4 日、Anthropic は、OpenClaw などのサードパーティ ツールに対するクロードのサブスクリプションの対象を打ち切ると発表しました。&lt;/p&gt;
&lt;p&gt;ユーザー レベルへの直接的な影響は、もともとサブスクリプション パスに依存してクロードにアクセスしていたサードパーティ プロセスを、他のアクセス方法に変更するか、他のモデルに切り替える必要があることです。&lt;/p&gt;
&lt;h2 id=&#34;タイムライン2026年1月から4月&#34;&gt;タイムライン（2026年1月から4月）
&lt;/h2&gt;&lt;h3 id=&#34;2026年1月&#34;&gt;2026年1月
&lt;/h3&gt;&lt;p&gt;公開報道によると、Anthropic は、当時 Clawdbot として知られていたこのプロジェクトに対し、発音がクロードに近いことから名前の変更を求めたという。&lt;/p&gt;
&lt;p&gt;同じ段階で、サードパーティがサブスクリプション認証情報を介して通話できる機能が限られているというフィードバックがコミュニティから出始めました。&lt;/p&gt;
&lt;h3 id=&#34;2026年2月&#34;&gt;2026年2月
&lt;/h3&gt;&lt;p&gt;関連する制限はサービス規約に記載されており、サブスクリプションとサードパーティの自動呼び出しとの境界がさらに明確になります。&lt;/p&gt;
&lt;p&gt;同月、OpenClaw は v4.0 をリリースし、基礎となるアーキテクチャがプラグイン可能なモデル バックエンドに変更されました。つまり、モデルは単一の固定された入り口ではなくなり、複数のモデルプロバイダーの間で切り替えることができます。&lt;/p&gt;
&lt;h3 id=&#34;2026年3月&#34;&gt;2026年3月
&lt;/h3&gt;&lt;p&gt;Anthropic は、リモート タスクの実行やデスクトップ操作などの機能をカバーする、Claude Dispatch と Computer Use をリリースします。&lt;/p&gt;
&lt;p&gt;OpenClaw は今後のアップデートでも互換性レイヤーを推進し、異なるモデルの認証方法、ツール呼び出し形式、戻り構造の違いを統一し、モデルを切り替える際の移行コストを削減します。&lt;/p&gt;
&lt;p&gt;公開レポートでは、OpenClaw チームが 3 月下旬に Anthropic と連絡を取ったとも述べられていましたが、最終的な戦略的方向性は変更されませんでした。&lt;/p&gt;
&lt;h3 id=&#34;2026-年-4-月-4-日&#34;&gt;2026 年 4 月 4 日
&lt;/h3&gt;&lt;p&gt;Anthropic は、サードパーティ ツールのサブスクリプション適用範囲の打ち切りを正式に実装します。&lt;/p&gt;
&lt;p&gt;これは、過去数か月間に行われた戦略的調整の実施段階を示します。&lt;/p&gt;
&lt;h3 id=&#34;2026-年-4-月-5-日&#34;&gt;2026 年 4 月 5 日
&lt;/h3&gt;&lt;p&gt;OpenClaw は v4.5 をリリースします。主なアクションには次のようなものがあります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ブートストラッププロセス中にモデルエントリの優先順位を調整する&lt;/li&gt;
&lt;li&gt;GPT-5.4 などの代替モデル パスにアクセスする&lt;/li&gt;
&lt;li&gt;タスクのプロセスとインタラクティブなエクスペリエンスに適応し続ける&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;リリース時期から判断すると、OpenClaw のスイッチング機能は完全に一時的なビルドではなく、2 月以降のマルチモデル アーキテクチャの変革に基づいています。&lt;/p&gt;
&lt;h2 id=&#34;プロセスにおける-2-つの平行した方向&#34;&gt;プロセスにおける 2 つの平行した方向
&lt;/h2&gt;&lt;p&gt;タイムラインを見ると、両当事者は同じ期間に異なる方向に前進しました。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Anthropic: サブスクリプションの境界を厳格化し、公式の製品機能の統合を促進します。&lt;/li&gt;
&lt;li&gt;OpenClaw: モデルの置換可能性を強化し、モデル間の互換性を向上させます。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;この 2 つのルートは矛盾するものではありませんが、「エントリーの所有権」と「ユーザーのワークフローの登録位置」という点で競合関係が生じます。&lt;/p&gt;
&lt;h2 id=&#34;現状2026年4月現在&#34;&gt;現状（2026年4月現在）
&lt;/h2&gt;&lt;p&gt;公開されている情報に基づいて、次の事実が確認できます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;サブスクリプションオーバーライドのカットオフが実行されました&lt;/li&gt;
&lt;li&gt;OpenClaw はメジャー モデル パスの切り替えを完了し、バージョンの反復を維持しました&lt;/li&gt;
&lt;li&gt;ユーザーが大きな変化を感じるかどうかは、元のワークフローが単一モデルの機能にどの程度依存しているかによって決まります。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;経過観察のポイント&#34;&gt;経過観察のポイント
&lt;/h2&gt;&lt;p&gt;次に注目すべきは、その事件そのものではなく、次の 3 つの点です。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;サブスクリプション プランと API 呼び出しの間の境界は今後も改善されていくのでしょうか?&lt;/li&gt;
&lt;li&gt;安定性、コスト、エクスペリエンスの観点からマルチモデルエージェントの長期的なパフォーマンスを実現&lt;/li&gt;
&lt;li&gt;ユーザーのワークフローは最終的にモデル層、ツール層、あるいはその 2 つの間のハイブリッド層に落ち着きますか?&lt;/li&gt;
&lt;/ol&gt;
</description>
        </item>
        
    </channel>
</rss>
