Ralph on KnightLiブログ

Ralph とマルチエージェント協調：AI を長時間安定して働かせるには

Mon, 27 Apr 2026 08:19:02 +0800

最近 coding agent を使っていると、すぐにひとつの現実的な問題にぶつかります。AI は確かに仕事をしてくれる。でも、どうすれば何時間も動かし続けても途中で脱線せず、要件を忘れず、同じ作業をやり直さずに済むのか。

Ralph やマルチエージェント協調をめぐる議論で本当に重要なのも、まさにこの点です。単にどのモデルが強いかを比べる話ではありません。より実用的な問いは、長いタスクでも AI が安定して動けるように、どうワークフローを設計するか です。

この問題を分解すると、よく出てくるルートは大きく 2 つあります。

Ralph 方式：新しいセッションを繰り返し起動し、ファイルシステムで文脈をつなぐ
マルチエージェント方式：リード Agent が調整し、子 Agent が分担して実行する

もっと平たく言えば、問われているのは「どのモデルが強いか」ではなく、「どう AI を組織して、継続的に成果を出す小さなチームのように動かすか」です。

01 なぜ長時間タスクは崩れやすいのか

短いタスクでは、多くの問題は表に出ません。指示を 1 つ出し、モデルが数ファイルを読み、少しコードを書き換えれば終わります。

ところがタスクが長くなると、問題が一気に表面化します。

会話が伸び続けてコンテキストが膨らむ
初期の要件が新しい情報に押し流される
ひとつの Agent が設計、実装、テストまで全部抱える
明確な受け入れ確認がないと、「終わった」と「終わったと言っているだけ」が混ざる

そのため、長時間 AI を動かすときに本当に問われるのは単発の出力性能ではなく、タスク分割、状態の受け渡し、役割分担、フィードバックループ です。

02 Ralph 方式：長いタスクを短いラウンドに分ける

Ralph の考え方は、まず「コンテキストがどんどん汚れていく」問題を解くのに向いています。

やっていることはシンプルです。

ループで新しい agent セッションを何度も起動する
各ラウンドでは十分小さなタスクを 1 つだけ扱う
ラウンドをまたぐ状態は会話ではなくファイルに置く

利点は明快です。毎回 fresh context から始まるので、1 ラウンドごとの集中が保ちやすく、過去の履歴に引きずられにくくなります。

Ralph 系のプロジェクトを見たことがあるなら、構造はかなり一貫しています。

現在のタスクは構造化ファイルに書く
途中の学びは進捗ファイルに残す
コードの変化は git 履歴に残す

つまり Ralph は、1 つの Agent に「全部を永遠に覚えさせる」ことを目指していません。記憶を意図的に外へ逃がし、セッションそのものを軽く保とうとします。

この種の方式は、特に次のような条件で相性がいいです。

作業がすでに小さな story に分けられている
各 story が 1 つの context window に収まる
プロジェクトに tests、typecheck、その他のチェックがある

これは AI を一歩ずつ安定して前に進めるにはどうするか という問題への答えです。

03 マルチエージェント方式：1 人では抱えきれない仕事を分担する

もうひとつのルートがマルチエージェント協調です。

この種のワークフロー設計でより有望なのは、リード Agent が自分で全部やるのではなく、調整役に回り、ほかの Agent が実装、テスト、確認、受け入れを分担する形です。

ここが Ralph との大きな違いです。

Ralph は直列の反復に近い
マルチエージェントは並列の分業に近い

タスクの中に自然な役割分担があるなら、マルチエージェントのほうが扱いやすくなります。たとえば次のように分けられます。

ひとりがタスク分解と実行計画を担当する
ひとりが実装する
ひとりがテストして検証する
ひとりが結果が最初の要件に合っているか見直す

大事なのは、ただウィンドウを増やすことではありません。価値があるのは役割を分離することです。もともと 1 つの Agent に押し込んでいた仕事を、より明確な段階に分けられます。

役割の境界がはっきりすると、いくつかの問題が軽くなります。

書く人とレビューする人を分けられる
テストする側が毎回ゼロから要件を再構築しなくていい
リード Agent が実装詳細に埋もれにくい

これは AI を小さなチームのように協調させるにはどうするか という問題への答えです。

04 本当に重要なのは並列化ではなく、どう分けるか

Ralph を使うにしてもマルチエージェントを使うにしても、見落とされやすいのはこの点です。大事なのは Agent の数より、ワークフロー設計の質です。

タスク分解が悪ければ、Agent を増やしても混乱を並列化するだけです。

より安定しやすい分け方には、だいたい次の特徴があります。

1 タスクに 1 つの明確な目標がある
1 役割に 1 種類の出力責任がある
各ラウンドに明確な完了条件がある
前のラウンドの成果が次のラウンドでそのまま使える

たとえば「機能を全部作って」と一気に投げるより、次のように段階を切るほうが安定しやすいです。

まず要件と境界を分ける
次に実装を分ける
次にテストを分ける
最後に受け入れ確認を独立させる

この分け方の利点は、問題が起きたときに、理解、実装、テスト、受け入れ基準のどこに原因があるのか見つけやすいことです。

05 なぜ受け入れ確認が重要なのか

多くの AI ワークフローが崩れるのは、前半で何もしていないからではありません。最後に、本当に独立した確認ステップがないからです。

長いタスクでは、「結果が生成された」と「その結果が本当に使える」のあいだに、かなり大きな差があることがよくあります。

だからこそ、開発と受け入れを分けて考える方向が重要です。複雑な仕組みにしなくても、少なくとも次の問いは独立して投げる価値があります。

最初のタスクを本当に完了しているか
表面だけ直して根本原因を残していないか
テストが都合のいい経路だけを見ていないか
上流の要件を途中で勝手に変えていないか

この層が欠けると、AI は長いフローの中で何度でも「成功した」と自己申告しがちです。

06 どう選ぶべきか

手早い目安としては、次のように考えられます。

いちばん痛いのがコンテキスト肥大化や長セッションの失焦なら Ralph
いちばん痛いのが 1 つの Agent に役割を詰め込みすぎていることならマルチエージェント

もう少し具体的に言うと、

Ralph は、流れが明快で、粒度が細かく、ラウンド単位で進めやすい仕事に向く
マルチエージェントは、役割分担が明確で、並行処理や相互検証が必要な仕事に向く

実際には、この 2 つは対立するものではありません。むしろ成熟したやり方は組み合わせです。

外側は Ralph のような反復ループで大きなタスクを進める
内側は各ラウンドでマルチエージェントを使い、調査、実装、テスト、受け入れを分担する

こうすれば、長いコンテキストの制御と、1 ラウンド内の協調効率を両方取りにいけます。

07 ひとことでまとめると

これらの方法が重要なのは、Ralph やマルチエージェントそのものを単独で推しているからではありません。むしろ、ひとつの現実的な事実をはっきりさせているからです。AI を長時間安定して働かせる鍵は、モデル単体の強さよりも、コンテキスト、タスク、役割、受け入れ確認をどう設計したかにある。

すでに Claude Code、Codex、そのほかの coding agent に長めの実タスクを任せ始めているなら、こうしたワークフロー発想は「もっと強いモデルに替える」より優先して学ぶ価値があります。

Ralph とは何か：Claude Code と Amp を反復実行できる自律開発フローに変える方法

Mon, 27 Apr 2026 08:08:55 +0800

最近、coding agent の長時間ワークフローに注目しているなら、snarktank/ralph は一度見ておきたい小さなプロジェクトです。これは新しいモデルのラッパーでも、チャット UI をもう一枚かぶせたものでもありません。Claude Code や Amp を autonomous loop として組み立て、PRD にある story を 1 つずつ進め、すべて終わるまで回し続ける仕組みです。

核になる発想はかなりシンプルです。同じ agent を、どんどん長くて汚れていくコンテキストの中で無理に走らせ続けないこと。代わりに、各イテレーションごとに新しい AI coding session を立ち上げること。これによって、コンテキストの膨張を抑えつつ、タスク境界もはっきりします。

01 Ralph とは何か

Ralph の公式な位置づけは明快です。PRD の項目が完了するまで、AI coding tool を繰り返し実行する autonomous AI agent loop です。

現在のリポジトリでは、次の 2 つのツールに対応しています。

Amp CLI
Claude Code

各イテレーションでは fresh instance が起動されます。つまり、1 本の会話を延々と伸ばし続けるのではなく、次のような外部状態に記憶を持たせます。

git 履歴
progress.txt
prd.json

ここが重要です。大きなタスクを agent に長く走らせるときの問題は、モデルがコードを書けないことではない場合が多いです。むしろ、会話が重くなり、コンテキストを落とし、要件を忘れ、同じ作業を繰り返しやすくなることのほうが大きい。Ralph は、ほぼこの問題に正面から向き合って設計されています。

02 どう動くのか

Ralph のワークフローは 3 段階です。

1. まず PRD を作る

README では、まず付属の prd skill を使って要件書を作り、機能を小さめの story に分割することを勧めています。

2. PRD を `prd.json` に変換する

次に ralph skill を使って、Markdown の PRD を構造化された prd.json に変換します。このファイルには user stories と、それぞれが通過済みかどうかが記録されます。

3. ループスクリプトを実行する

実際の実行を担うのは ralph.sh です。コマンドはおおむね次の形です。

1
2

./scripts/ralph/ralph.sh [max_iterations]
./scripts/ralph/ralph.sh --tool claude [max_iterations]

デフォルトは 10 イテレーションです。各ラウンドではおおよそ次のことを行います。

branchName からブランチを作る
passes: false で最優先の story を選ぶ
その story だけを実装する
typecheck や tests などの品質チェックを走らせる
チェックを通過したらコミットする
prd.json を更新する
学びを progress.txt に追記する
次のラウンドへ進む

つまり Ralph は、すべてを一気に終わらせようとはしません。1 つのコンテキストウィンドウに収まる小さなループへと仕事を圧縮していくわけです。

03 Ralph の面白いところ

1. 毎回 fresh context を使う

これが Ralph のいちばん中心的な設計です。README でも、各イテレーションは新しい AI instance であり、イテレーション間の記憶は git、progress.txt、prd.json にしか残らないと強調されています。

これは、Claude Code などを 1 本の長い会話の中で使い続ける一般的なやり方とはかなり違います。後者はタスクが大きくなるほど履歴に引きずられて重くなり、少しずつ焦点を失いがちです。Ralph は、1 回の実行ですべてを覚えさせることを諦め、その代わりに記憶をファイルに逃がします。

2. タスクを小さく保つことを前提にしている

ドキュメントでは、各 PRD item は 1 つの context window で終えられる大きさでなければならないと明言されています。たとえば、フィルターを 1 つ追加する、server action を更新する、DB のカラムを 1 本足す、といった粒度は適切です。一方で、API 全体の再設計やダッシュボード全体の構築は大きすぎます。

この制約はとても現実的です。多くの autonomous agent loop が崩れる理由は、loop そのものではなく、タスク分割が粗すぎて 1 ラウンドに抱え込む量が多すぎることにあります。

3. コードだけでなく学びも残す

progress.txt だけでなく、README は AGENTS.md の更新も強く勧めています。理由は単純で、今後のイテレーションや将来の開発者がそのメモを読むからです。各ラウンドで見つかったパターン、注意点、慣習は、プロジェクト文書として残しておいたほうがいい。

言い換えると、Ralph は agent に継続してコードを書かせるだけでなく、コードベースに対する作業記憶も蓄積させようとしています。

04 どんな場面に向いているか

次のような条件なら、Ralph はかなり相性がいいです。

すでに明確な user stories に分解できている
テスト、typecheck、CI のような信頼できるフィードバックループがある
1 本の長い会話に全部を押し込まず、agent を継続的に前進させたい
一発完了より、反復で少しずつ進む形を受け入れられる

逆に、要件がまだ曖昧だったり、議論を何度も往復しながら方向を頻繁に変える必要がある作業では、Ralph は最初の選択肢ではないかもしれません。要件が固まり、実装を安定して前に進めたい段階のほうが向いています。

05 普通の Claude Code 利用と何が違うか

ふつうに Claude Code を使う場合は、1 つのセッションを開いて、そこからコードを読み、編集し、コマンドを実行し続ける形が一般的です。これは小規模から中規模の作業では非常に便利ですが、大きな作業になると次の 2 点が問題になりやすいです。

コンテキストが伸び続ける
途中の判断が構造化された形で残りにくい

Ralph は Claude Code や Amp を、より「バッチ実行器」に近いものへ変えます。

タスクの起点は都度の会話ではなく prd.json
各ラウンドが扱うのは 1 つの story だけ
完了状態はファイルへ書き戻される
学びは progress.txt に残る
コード変更は git に残る

その意味で、これは新しい AI assistant というより、coding agent の上にイテレーション制御を追加する仕組みと見たほうが近いです。

06 ひとつ重要な前提

Ralph がうまく機能するかどうかは、loop 自体よりもフィードバックループの質に左右されます。README もかなり率直で、typecheck、tests、CI がないと、エラーは後続イテレーションで積み重なっていくと書いています。

フロントエンド作業については、acceptance criteria にブラウザ検証を含めることまで勧めています。実際の確認がないと、agent は「見た目上は終わった」と「本当に動く」を簡単に混同してしまうからです。

ここは大事です。Ralph は magical automation ではありません。むしろ、すでに持っている開発の規律を増幅する仕組みに近いです。タスク分割が明快で、チェックがしっかりしているプロジェクトほど価値が出ますし、その土台がないなら、混乱を繰り返し増幅するだけになりかねません。

07 ひとことでまとめると

Ralph の価値は、大規模な新基盤を作ったことではありません。シンプルだけれど実用的な発想を、すぐ使えるフローに落とし込んだところにあります。Claude Code や Amp に各ラウンドで十分小さな story を 1 つだけ扱わせ、fresh context で集中させつつ、git、prd.json、progress.txt で継続性を保つ。

もし、すでに coding agent を実プロジェクトで使い始めていて、「長いタスクをどう安定して前に進めるか」で悩んでいるなら、Ralph のやり方はかなり参考になります。

参考リンク

GitHub リポジトリ: https://github.com/snarktank/ralph
インタラクティブなフローチャート: https://snarktank.github.io

Ralph on KnightLiブログ

Ralph とマルチエージェント協調：AI を長時間安定して働かせるには

01 なぜ長時間タスクは崩れやすいのか

02 Ralph 方式：長いタスクを短いラウンドに分ける

03 マルチエージェント方式：1 人では抱えきれない仕事を分担する

04 本当に重要なのは並列化ではなく、どう分けるか

05 なぜ受け入れ確認が重要なのか

06 どう選ぶべきか

07 ひとことでまとめると

Ralph とは何か：Claude Code と Amp を反復実行できる自律開発フローに変える方法

01 Ralph とは何か

02 どう動くのか

1. まず PRD を作る

2. PRD を prd.json に変換する

3. ループスクリプトを実行する

03 Ralph の面白いところ

1. 毎回 fresh context を使う

2. タスクを小さく保つことを前提にしている

3. コードだけでなく学びも残す

04 どんな場面に向いているか

05 普通の Claude Code 利用と何が違うか

06 ひとつ重要な前提

07 ひとことでまとめると

参考リンク

2. PRD を `prd.json` に変換する