DeepSeek V4 の値下げは AI Agent のコストモデルをどう書き換えるか

DeepSeek V4 リリース後の連続値下げ、Flash と Pro の使い分け、そして Coding Plan、Token Plan、AI Agent のコスト構造への影響を整理する。

DeepSeek V4 の発表は、特別に大きな話題を作ったわけではありません。 大規模な発表会もなく、すべての競合を一目で圧倒するようなベンチマークの物語もありませんでした。 しかし数日後、本当に業界へ影響する部分が見え始めました。連続的な値下げです。

今回の変化で重要なのは、「モデルが少し強くなった」ことではなく、「利用コストが別の水準まで下がった」ことです。 Token 価格が、普通の Agent タスクなら数毛から数元で完了できるほど低くなると、多くの Coding Plan や Token Plan のビジネスロジックは見直しを迫られます。

発表当日は爆発的ではなかった

DeepSeek V4 に対する最初の反応は、そこまで熱狂的ではありませんでした。 多くの人は R1 のような強い衝撃を期待していました。ベンチマークの全面的なリード、国産計算資源の検証、マルチモーダルと Agent 能力の同時爆発です。 しかし実際に発表されると、それは堅実なアップグレードに近いものでした。

V4 Pro は確かに強いモデルです。特にコード、数学、長文コンテキスト、agentic coding では良い性能を見せます。 ただし、同種のモデルを一瞬で色あせさせるような製品ではありません。 そのため発表当日の世論には少し気まずさがありました。褒めたいけれど、十分に爆発的な切り口が見つかりにくかったのです。

本当の転換点は発表当日ではなく、その後の価格調整でした。

連続値下げこそが重要

DeepSeek V4 の発表後、価格は連続して下がり始めました。 DeepSeek の公式価格ページと元記事の整理によると、当時のおおよその価格は次のとおりです。

  • DeepSeek V4 Flash:入力 100 万 Token あたり約 1 元。キャッシュヒット後は 100 万 Token あたり約 2 分;
  • DeepSeek V4 Pro:入力 100 万 Token あたり約 3 元。キャッシュヒット後は 100 万 Token あたり約 2.5 分;
  • 全シリーズの入力キャッシュヒット価格は、初回価格の 1/10 に低下;
  • V4 Pro は一時 75% 割引期間にあり、割引は 2026 年 5 月 31 日 23:59 まで延長されました。

米ドルの API 価格で見ると、さらに直感的です。

モデル キャッシュヒット入力 非キャッシュ入力 出力 コンテキスト
deepseek-v4-flash $0.0028 / 100万 Token $0.14 / 100万 Token $0.28 / 100万 Token 1M
deepseek-v4-pro プロモーション価格 $0.003625 / 100万 Token $0.435 / 100万 Token $0.87 / 100万 Token 1M
deepseek-v4-pro 通常価格 $0.0145 / 100万 Token $1.74 / 100万 Token $3.48 / 100万 Token 1M

ここで注意すべき点が 2 つあります。

第一に、V4 Pro の $0.435 / $0.87 はプロモーション価格であり、長期的な通常価格ではありません。 DeepSeek の公式説明では、この 75% 割引は 2026 年 5 月 31 日 15:59 UTC まで延長されています。

第二に、Agent のコストモデルで重要なのはキャッシュヒット価格です。 Flash のキャッシュヒット入力は $0.0028 / 100万 Token まで低く、Pro のプロモーション期間中のキャッシュヒット入力は $0.003625 / 100万 Token です。 これは、繰り返し使われるプロジェクトコンテキスト、ツール定義、システムプロンプト、履歴要約が、完全な入力価格で課金されなくなることを意味します。

この価格のもっとも重要な点は、多くのタスクで Token コストが「気になりにくくなる」ことです。 以前の開発者は、1 回の Agent タスクが大量のコンテキストを消費し、コードを何度も読み書きし、ツールを頻繁に呼び出すことを心配していました。 今はキャッシュヒット率が十分に高ければ、コストをかなり低く抑えられます。

GPT、Claude との価格比較

DeepSeek 自体の価格だけを見ても、差はまだ感じにくいかもしれません。 同時期によく使われるクローズドモデルと並べると、違いはより明確になります。

モデル 入力 キャッシュ入力 出力 適した場面
deepseek-v4-flash $0.14 / M $0.0028 / M $0.28 / M 高頻度 Agent、通常の coding、バッチタスク
deepseek-v4-pro プロモーション価格 $0.435 / M $0.003625 / M $0.87 / M 複雑な coding、計画、事実確認
deepseek-v4-pro 通常価格 $1.74 / M $0.0145 / M $3.48 / M プロモーション終了後の Pro コスト基準
GPT-5.5 $5 / M $0.50 / M $30 / M 高品質な複雑タスク、汎用推論
GPT-5.4 $2.50 / M $0.25 / M $15 / M プログラミングと専門タスクの中位選択肢
GPT-5.4 mini $0.75 / M $0.075 / M $4.50 / M 低コストの汎用/サブタスクモデル
Claude Opus 4.7 $5 / M $0.50 / M $25 / M 高品質な執筆、複雑推論、長時間タスク
Claude Sonnet 4.6 $3 / M $0.30 / M $15 / M プログラミング、Agent、総合タスク
Claude Haiku 4.5 $1 / M $0.10 / M $5 / M 軽量タスク、要約、分類

この表で最も目立つのは出力価格です。 Agent はコンテキストを読むだけでなく、計画、パッチ、説明、ログ、次のアクションを継続的に生成します。 出力が多い場合、DeepSeek V4 Pro のプロモーション価格 $0.87 / M は、GPT-5.5 の $30 / M や Claude Sonnet 4.6 の $15 / M と比べて、差がどんどん広がります。

V4 Pro の通常出力価格 $3.48 / M で計算しても、GPT-5.4、GPT-5.5、Claude Sonnet / Opus より明らかに低い水準です。 タスクを Flash で処理できるなら、出力価格はさらに $0.28 / M まで下がります。

キャッシュ入力の差はさらに極端です。 DeepSeek V4 Flash のキャッシュ入力は $0.0028 / M である一方、GPT-5.5 と Claude Opus 4.7 のキャッシュ入力はいずれも $0.50 / M です。 これは同じ桁の話ではありません。 同じコードリポジトリを繰り返し読む Agent にとって、この差は通常のチャットよりも重要です。

Agent タスクが特に影響を受ける理由

AI Agent は普通のチャットとは違います。 普通のチャットはたいてい一問一答で、入力コンテキストは比較的限られています。 Agent タスクは、プロジェクトファイルを繰り返し読み、計画を生成し、ツールを呼び出し、結果を確認し、さらにコードを修正します。

この種のタスクには 2 つの特徴があります。

  • Token 消費が大きい;
  • 繰り返しコンテキストが多い。

2 点目が非常に重要です。 コードプロジェクトでは、モデルは同じファイル群、ディレクトリ構造、エラーログ、変更結果を何度も読みます。 プラットフォームがキャッシュヒットをサポートしていれば、繰り返し入力のコストは大幅に下がります。

元記事では実際の体験として、DeepSeek V4 Pro と Flash を Claude Code のようなツールに接続し、プロンプトリポジトリを取得してローカル検索サイトを作らせた例が紹介されています。 タスクは最終的に完了し、総コストは 8 毛強ほどで、そのうち Pro のキャッシュヒット率は 98.7% に達しました。

この例は現実的な問題を示しています。Agent タスクが「同じプロジェクトを中心に繰り返し作業する」ほど、キャッシュヒットの価値は高くなります。 Web サイト生成、bug 修正、フロントエンド修正が数毛から数元で済むなら、サブスクリプションプランの魅力は下がります。

簡略化したタスクで差を見積もることもできます。 1 回の coding agent タスクが次を含むと仮定します。

  • 50 万 Token の入力。そのうち 80% がキャッシュヒット可能;
  • 5 万 Token の出力;
  • ツール呼び出し、検索、プラットフォーム上乗せ分は計算せず、モデル Token コストだけを見る。

おおよそのコストは次のとおりです。

モデル 推定コスト
DeepSeek V4 Flash 約 $0.03
DeepSeek V4 Pro プロモーション価格 約 $0.09
DeepSeek V4 Pro 通常価格 約 $0.36
GPT-5.4 mini 約 $0.30
GPT-5.4 約 $1.01
GPT-5.5 約 $1.75
Claude Sonnet 4.6 約 $1.11
Claude Opus 4.7 約 $1.65

この見積もりは、DeepSeek がすべてのタスクで優れているという意味ではありません。 モデル品質、ツール呼び出しの安定性、長文コンテキスト検索能力、コードスタイル、事実の信頼性は個別に評価する必要があります。 ただしコスト面では、DeepSeek V4 は「Agent にもう数ラウンド走らせる」ことの限界コストをかなり低くしました。 これにより開発者は、毎回 Token 請求を心配するのではなく、より長いワークフロー、より頻繁なセルフチェック、より多くの候補案を設計しやすくなります。

Coding Plan と Token Plan の違い

多くの AI 製品はいま、Coding Plan と Token Plan という 2 種類のプランを提供しています。

大まかな違いは次のとおりです。

  • Coding Plan は通常、主にプログラミング向け;
  • Token Plan は通常、STT、TTS、画像生成、検索、embedding、RAG など、より多くの機能を含む;
  • STT は音声から文字への変換;
  • TTS は文字から音声への変換;
  • Coding Plan はユーザーをプログラミング場面に制限しがちで、他の機能は別途購入が必要になることが多い。

ビジネスの観点では、Coding Plan はビュッフェに近いものです。 ユーザーは固定料金を前払いし、ベンダーは大多数の人が枠を使い切らないことに賭けます。 多く使う人も少なく使う人もいて、平均するとプラットフォームは利益を出せます。

しかし従量制の Token 価格が十分に低くなると、ユーザーは計算し始めます。なぜ必ずプランを買わなければならないのか。 1 か月の実際の利用コストが数元から十数元程度なら、40 元や 200 元のプランは必ずしも割に合いません。

値下げがサブスクリプションモデルを揺さぶる理由

サブスクリプションプランが成立するには前提があります。ユーザーが単発利用を高いと感じるか、毎回の呼び出しコストを計算したくないことです。 Token 価格が高いとき、プランは安心に見えます。 Token 価格がほとんど気にならないほど低くなると、従量課金のほうが自然になります。

DeepSeek V4 の値下げは、底のコストを見せたようなものです。

  • Agent タスクは非常に安くできる;
  • 長文コンテキストは必ずしも使えないほど高くない;
  • キャッシュヒットでコストを大きく下げられる;
  • 普通の開発者は固定サブスクリプションを必ずしも必要としない;
  • モデルの入口は「プラン型プラットフォーム」から「低価格 API」へ移り得る。

これは Coding Plan を提供するプラットフォームにとって不快な変化です。 従量呼び出しのほうが安く自由だとユーザーが気づけば、ひとつのプラットフォームのプランに縛られる必要はありません。

Flash と Pro をどう選ぶか

DeepSeek V4 の実用的な考え方のひとつは、Flash と Pro を分担して使うことです。

Flash は高頻度、軽量、反復可能なタスクに向いています。

  • bug 修正;
  • フロントエンド作成;
  • スクリプト作成;
  • 通常のコード理解;
  • 長いコンテキスト内の一般的な情報整理;
  • 大量のサブタスク実行。

Flash は安く、速く、同じく長いコンテキストをサポートします。 日常的な coding agent では、多くのタスクで最初から Pro を使う必要はありません。

Pro は複雑な判断やフォールバックタスクに向いています。

  • 複数ラウンドの計画;
  • 複雑な Agent ワークフロー;
  • 複数回の function call;
  • 事実確認;
  • 財務・経済リサーチ;
  • より強い知識と判断力が必要なコンテンツ生成;
  • 高リスクなコード変更。

合理的な構成は、Flash が量をこなし、Pro がフォールバックを担当する形です。 通常タスクはまず Flash で始め、長期計画、複雑な判断、事実確認、複数ツールの協調が必要になったら Pro に切り替える。 こうすればコストを抑えつつ、モデル品質も保てます。

DeepSeek がこの価格を出せる理由

DeepSeek は多くの大手企業と事業構造が異なります。 EC、SNS、ショート動画、クラウドコンピューティング、スマートフォン、自動車、オフィススイート、OS、ブラウザ、大規模な企業向け SaaS エコシステムを持っていません。

つまり、ユーザーを完全なプラットフォーム内に閉じ込める必要がありません。 安いテキストモデル能力だけを売ることができます。他の機能は、必要に応じてどこを呼び出してもよいのです。

大手企業のロジックは通常異なります。 その Coding Plan や Token Plan を買うと、クラウド、検索、画像生成、音声、データベース、開発ツールのエコシステムへ引き込まれます。 プランは単純にモデルを売るものではなく、ユーザーの入口を取りに行くものです。

DeepSeek の戦い方はより直接的です。テキストモデルの価格を下げ、Agent のデフォルトモデル入口になることを狙います。 デフォルト入口を取れれば、多くの開発者とツールチェーンは自然にそれへ適応していきます。

オープンモデルとデフォルト入口

DeepSeek V4 がオープンモデル路線を維持するなら、サードパーティのクラウドベンダーやプラットフォームが自前でデプロイし、サービスを提供する可能性があります。 DeepSeek にとって、それは普及でもあり、同時に流量の分散でもあります。

低価格の公式 API の意味はここにあります。 公式価格がすでに十分低ければ、他のプラットフォームがデプロイできたとしても、価格面で明確な優位を出すのは難しくなります。 ユーザーは、デフォルトで安く安定した入口を直接使う傾向になります。

Agent ツールでは特にそうです。 Agent タスクは長文コンテキスト、キャッシュ、ツール呼び出し、安定したスループットに依存します。 あるモデルがこれらの場面で十分安ければ、デフォルト選択肢になる可能性があります。

Coding Plan は完全に無用ではない

これは Coding Plan がすぐ消えるという意味ではありません。 それに合うユーザーはまだいます。

もし一部のユーザーが本当に高頻度で、毎日プランの上限まで使うなら、固定サブスクリプションはまだ得かもしれません。 ビュッフェと同じで、誰も元を取れないなら、ユーザーも買おうとはしません。

ただし問題は、ほとんどのユーザーがそのような極端な高頻度ユーザーではないことです。 低頻度ユーザー、軽量な開発者、たまにスクリプトを書いたりプロジェクトを直したりする人には、従量課金のほうが向いています。 DeepSeek が従量コストを下げると、プランの魅力は弱まります。

今後は、より階層化された選択が起こりやすくなります。

  • 高頻度のヘビーユーザーは Coding Plan を買い続ける;
  • 普通のユーザーは低価格 API へ移る;
  • Agent ツールはタスクに応じて Flash / Pro を自動選択する;
  • プラットフォームのプランは、ワークフロー、IDE 統合、デプロイ、チーム管理、セキュリティ監査など、モデル以外の価値をより多く提供する必要がある。

まとめ

DeepSeek V4 の発表は、ベンチマークによって最大の衝撃を作ったわけではありません。 本当に業界の期待を変えたのは、その後の値下げでした。

入力 Token とキャッシュヒット価格が非常に低くなると、AI Agent の利用コストは変わります。 これまで高価に見えていた長文コンテキスト、コードプロジェクト分析、複数ラウンドのツール呼び出しが、今では数毛から数元の日常的な消費になる可能性があります。

これは Coding Plan と Token Plan のビジネスロジックを直接揺さぶります。 ユーザーが従量課金で、モデルとツールを自由に組み合わせられ、さらにコストも十分低いなら、特定のプラットフォームプランに縛られる必要はありません。

DeepSeek V4 が今回本当に動かしたのは、モデル能力ランキングだけではなく、AI Agent のコスト構造とデフォルト入口をめぐる競争です。

参考情報:

记录并分享
Hugo で構築されています。
テーマ StackJimmy によって設計されています。