DeepSeek V4 の値下げは AI Agent のコストモデルをどう書き換えるか

DeepSeek V4 の発表は、特別に大きな話題を作ったわけではありません。大規模な発表会もなく、すべての競合を一目で圧倒するようなベンチマークの物語もありませんでした。しかし数日後、本当に業界へ影響する部分が見え始めました。連続的な値下げです。

今回の変化で重要なのは、「モデルが少し強くなった」ことではなく、「利用コストが別の水準まで下がった」ことです。 Token 価格が、普通の Agent タスクなら数毛から数元で完了できるほど低くなると、多くの Coding Plan や Token Plan のビジネスロジックは見直しを迫られます。

発表当日は爆発的ではなかった

DeepSeek V4 に対する最初の反応は、そこまで熱狂的ではありませんでした。多くの人は R1 のような強い衝撃を期待していました。ベンチマークの全面的なリード、国産計算資源の検証、マルチモーダルと Agent 能力の同時爆発です。しかし実際に発表されると、それは堅実なアップグレードに近いものでした。

V4 Pro は確かに強いモデルです。特にコード、数学、長文コンテキスト、agentic coding では良い性能を見せます。ただし、同種のモデルを一瞬で色あせさせるような製品ではありません。そのため発表当日の世論には少し気まずさがありました。褒めたいけれど、十分に爆発的な切り口が見つかりにくかったのです。

本当の転換点は発表当日ではなく、その後の価格調整でした。

連続値下げこそが重要

DeepSeek V4 の発表後、価格は連続して下がり始めました。 DeepSeek の公式価格ページと元記事の整理によると、当時のおおよその価格は次のとおりです。

DeepSeek V4 Flash：入力 100 万 Token あたり約 1 元。キャッシュヒット後は 100 万 Token あたり約 2 分；
DeepSeek V4 Pro：入力 100 万 Token あたり約 3 元。キャッシュヒット後は 100 万 Token あたり約 2.5 分；
全シリーズの入力キャッシュヒット価格は、初回価格の 1/10 に低下；
V4 Pro は一時 75% 割引期間にあり、割引は 2026 年 5 月 31 日 23:59 まで延長されました。

米ドルの API 価格で見ると、さらに直感的です。

モデル	キャッシュヒット入力	非キャッシュ入力	出力	コンテキスト
`deepseek-v4-flash`	$0.0028 / 100万 Token	$0.14 / 100万 Token	$0.28 / 100万 Token	1M
`deepseek-v4-pro` プロモーション価格	$0.003625 / 100万 Token	$0.435 / 100万 Token	$0.87 / 100万 Token	1M
`deepseek-v4-pro` 通常価格	$0.0145 / 100万 Token	$1.74 / 100万 Token	$3.48 / 100万 Token	1M

ここで注意すべき点が 2 つあります。

第一に、V4 Pro の $0.435 / $0.87 はプロモーション価格であり、長期的な通常価格ではありません。 DeepSeek の公式説明では、この 75% 割引は 2026 年 5 月 31 日 15:59 UTC まで延長されています。

第二に、Agent のコストモデルで重要なのはキャッシュヒット価格です。 Flash のキャッシュヒット入力は $0.0028 / 100万 Token まで低く、Pro のプロモーション期間中のキャッシュヒット入力は $0.003625 / 100万 Token です。これは、繰り返し使われるプロジェクトコンテキスト、ツール定義、システムプロンプト、履歴要約が、完全な入力価格で課金されなくなることを意味します。

この価格のもっとも重要な点は、多くのタスクで Token コストが「気になりにくくなる」ことです。以前の開発者は、1 回の Agent タスクが大量のコンテキストを消費し、コードを何度も読み書きし、ツールを頻繁に呼び出すことを心配していました。今はキャッシュヒット率が十分に高ければ、コストをかなり低く抑えられます。

GPT、Claude との価格比較

DeepSeek 自体の価格だけを見ても、差はまだ感じにくいかもしれません。同時期によく使われるクローズドモデルと並べると、違いはより明確になります。

モデル	入力	キャッシュ入力	出力	適した場面
`deepseek-v4-flash`	$0.14 / M	$0.0028 / M	$0.28 / M	高頻度 Agent、通常の coding、バッチタスク
`deepseek-v4-pro` プロモーション価格	$0.435 / M	$0.003625 / M	$0.87 / M	複雑な coding、計画、事実確認
`deepseek-v4-pro` 通常価格	$1.74 / M	$0.0145 / M	$3.48 / M	プロモーション終了後の Pro コスト基準
GPT-5.5	$5 / M	$0.50 / M	$30 / M	高品質な複雑タスク、汎用推論
GPT-5.4	$2.50 / M	$0.25 / M	$15 / M	プログラミングと専門タスクの中位選択肢
GPT-5.4 mini	$0.75 / M	$0.075 / M	$4.50 / M	低コストの汎用/サブタスクモデル
Claude Opus 4.7	$5 / M	$0.50 / M	$25 / M	高品質な執筆、複雑推論、長時間タスク
Claude Sonnet 4.6	$3 / M	$0.30 / M	$15 / M	プログラミング、Agent、総合タスク
Claude Haiku 4.5	$1 / M	$0.10 / M	$5 / M	軽量タスク、要約、分類

この表で最も目立つのは出力価格です。 Agent はコンテキストを読むだけでなく、計画、パッチ、説明、ログ、次のアクションを継続的に生成します。出力が多い場合、DeepSeek V4 Pro のプロモーション価格 $0.87 / M は、GPT-5.5 の $30 / M や Claude Sonnet 4.6 の $15 / M と比べて、差がどんどん広がります。

V4 Pro の通常出力価格 $3.48 / M で計算しても、GPT-5.4、GPT-5.5、Claude Sonnet / Opus より明らかに低い水準です。タスクを Flash で処理できるなら、出力価格はさらに $0.28 / M まで下がります。

キャッシュ入力の差はさらに極端です。 DeepSeek V4 Flash のキャッシュ入力は $0.0028 / M である一方、GPT-5.5 と Claude Opus 4.7 のキャッシュ入力はいずれも $0.50 / M です。これは同じ桁の話ではありません。同じコードリポジトリを繰り返し読む Agent にとって、この差は通常のチャットよりも重要です。

Agent タスクが特に影響を受ける理由

AI Agent は普通のチャットとは違います。普通のチャットはたいてい一問一答で、入力コンテキストは比較的限られています。 Agent タスクは、プロジェクトファイルを繰り返し読み、計画を生成し、ツールを呼び出し、結果を確認し、さらにコードを修正します。

この種のタスクには 2 つの特徴があります。

Token 消費が大きい；
繰り返しコンテキストが多い。

2 点目が非常に重要です。コードプロジェクトでは、モデルは同じファイル群、ディレクトリ構造、エラーログ、変更結果を何度も読みます。プラットフォームがキャッシュヒットをサポートしていれば、繰り返し入力のコストは大幅に下がります。

元記事では実際の体験として、DeepSeek V4 Pro と Flash を Claude Code のようなツールに接続し、プロンプトリポジトリを取得してローカル検索サイトを作らせた例が紹介されています。タスクは最終的に完了し、総コストは 8 毛強ほどで、そのうち Pro のキャッシュヒット率は 98.7% に達しました。

この例は現実的な問題を示しています。Agent タスクが「同じプロジェクトを中心に繰り返し作業する」ほど、キャッシュヒットの価値は高くなります。 Web サイト生成、bug 修正、フロントエンド修正が数毛から数元で済むなら、サブスクリプションプランの魅力は下がります。

簡略化したタスクで差を見積もることもできます。 1 回の coding agent タスクが次を含むと仮定します。

50 万 Token の入力。そのうち 80% がキャッシュヒット可能；
5 万 Token の出力；
ツール呼び出し、検索、プラットフォーム上乗せ分は計算せず、モデル Token コストだけを見る。

おおよそのコストは次のとおりです。

モデル	推定コスト
DeepSeek V4 Flash	約 $0.03
DeepSeek V4 Pro プロモーション価格	約 $0.09
DeepSeek V4 Pro 通常価格	約 $0.36
GPT-5.4 mini	約 $0.30
GPT-5.4	約 $1.01
GPT-5.5	約 $1.75
Claude Sonnet 4.6	約 $1.11
Claude Opus 4.7	約 $1.65

この見積もりは、DeepSeek がすべてのタスクで優れているという意味ではありません。モデル品質、ツール呼び出しの安定性、長文コンテキスト検索能力、コードスタイル、事実の信頼性は個別に評価する必要があります。ただしコスト面では、DeepSeek V4 は「Agent にもう数ラウンド走らせる」ことの限界コストをかなり低くしました。これにより開発者は、毎回 Token 請求を心配するのではなく、より長いワークフロー、より頻繁なセルフチェック、より多くの候補案を設計しやすくなります。

Coding Plan と Token Plan の違い

多くの AI 製品はいま、Coding Plan と Token Plan という 2 種類のプランを提供しています。

大まかな違いは次のとおりです。

Coding Plan は通常、主にプログラミング向け；
Token Plan は通常、STT、TTS、画像生成、検索、embedding、RAG など、より多くの機能を含む；
STT は音声から文字への変換；
TTS は文字から音声への変換；
Coding Plan はユーザーをプログラミング場面に制限しがちで、他の機能は別途購入が必要になることが多い。

ビジネスの観点では、Coding Plan はビュッフェに近いものです。ユーザーは固定料金を前払いし、ベンダーは大多数の人が枠を使い切らないことに賭けます。多く使う人も少なく使う人もいて、平均するとプラットフォームは利益を出せます。

しかし従量制の Token 価格が十分に低くなると、ユーザーは計算し始めます。なぜ必ずプランを買わなければならないのか。 1 か月の実際の利用コストが数元から十数元程度なら、40 元や 200 元のプランは必ずしも割に合いません。

値下げがサブスクリプションモデルを揺さぶる理由

サブスクリプションプランが成立するには前提があります。ユーザーが単発利用を高いと感じるか、毎回の呼び出しコストを計算したくないことです。 Token 価格が高いとき、プランは安心に見えます。 Token 価格がほとんど気にならないほど低くなると、従量課金のほうが自然になります。

DeepSeek V4 の値下げは、底のコストを見せたようなものです。

Agent タスクは非常に安くできる；
長文コンテキストは必ずしも使えないほど高くない；
キャッシュヒットでコストを大きく下げられる；
普通の開発者は固定サブスクリプションを必ずしも必要としない；
モデルの入口は「プラン型プラットフォーム」から「低価格 API」へ移り得る。

これは Coding Plan を提供するプラットフォームにとって不快な変化です。従量呼び出しのほうが安く自由だとユーザーが気づけば、ひとつのプラットフォームのプランに縛られる必要はありません。

Flash と Pro をどう選ぶか

DeepSeek V4 の実用的な考え方のひとつは、Flash と Pro を分担して使うことです。

Flash は高頻度、軽量、反復可能なタスクに向いています。

bug 修正；
フロントエンド作成；
スクリプト作成；
通常のコード理解；
長いコンテキスト内の一般的な情報整理；
大量のサブタスク実行。

Flash は安く、速く、同じく長いコンテキストをサポートします。日常的な coding agent では、多くのタスクで最初から Pro を使う必要はありません。

Pro は複雑な判断やフォールバックタスクに向いています。

複数ラウンドの計画；
複雑な Agent ワークフロー；
複数回の function call；
事実確認；
財務・経済リサーチ；
より強い知識と判断力が必要なコンテンツ生成；
高リスクなコード変更。

合理的な構成は、Flash が量をこなし、Pro がフォールバックを担当する形です。通常タスクはまず Flash で始め、長期計画、複雑な判断、事実確認、複数ツールの協調が必要になったら Pro に切り替える。こうすればコストを抑えつつ、モデル品質も保てます。

DeepSeek がこの価格を出せる理由

DeepSeek は多くの大手企業と事業構造が異なります。 EC、SNS、ショート動画、クラウドコンピューティング、スマートフォン、自動車、オフィススイート、OS、ブラウザ、大規模な企業向け SaaS エコシステムを持っていません。

つまり、ユーザーを完全なプラットフォーム内に閉じ込める必要がありません。安いテキストモデル能力だけを売ることができます。他の機能は、必要に応じてどこを呼び出してもよいのです。

大手企業のロジックは通常異なります。その Coding Plan や Token Plan を買うと、クラウド、検索、画像生成、音声、データベース、開発ツールのエコシステムへ引き込まれます。プランは単純にモデルを売るものではなく、ユーザーの入口を取りに行くものです。

DeepSeek の戦い方はより直接的です。テキストモデルの価格を下げ、Agent のデフォルトモデル入口になることを狙います。デフォルト入口を取れれば、多くの開発者とツールチェーンは自然にそれへ適応していきます。

オープンモデルとデフォルト入口

DeepSeek V4 がオープンモデル路線を維持するなら、サードパーティのクラウドベンダーやプラットフォームが自前でデプロイし、サービスを提供する可能性があります。 DeepSeek にとって、それは普及でもあり、同時に流量の分散でもあります。

低価格の公式 API の意味はここにあります。公式価格がすでに十分低ければ、他のプラットフォームがデプロイできたとしても、価格面で明確な優位を出すのは難しくなります。ユーザーは、デフォルトで安く安定した入口を直接使う傾向になります。

Agent ツールでは特にそうです。 Agent タスクは長文コンテキスト、キャッシュ、ツール呼び出し、安定したスループットに依存します。あるモデルがこれらの場面で十分安ければ、デフォルト選択肢になる可能性があります。

Coding Plan は完全に無用ではない

これは Coding Plan がすぐ消えるという意味ではありません。それに合うユーザーはまだいます。

もし一部のユーザーが本当に高頻度で、毎日プランの上限まで使うなら、固定サブスクリプションはまだ得かもしれません。ビュッフェと同じで、誰も元を取れないなら、ユーザーも買おうとはしません。

ただし問題は、ほとんどのユーザーがそのような極端な高頻度ユーザーではないことです。低頻度ユーザー、軽量な開発者、たまにスクリプトを書いたりプロジェクトを直したりする人には、従量課金のほうが向いています。 DeepSeek が従量コストを下げると、プランの魅力は弱まります。

今後は、より階層化された選択が起こりやすくなります。

高頻度のヘビーユーザーは Coding Plan を買い続ける；
普通のユーザーは低価格 API へ移る；
Agent ツールはタスクに応じて Flash / Pro を自動選択する；
プラットフォームのプランは、ワークフロー、IDE 統合、デプロイ、チーム管理、セキュリティ監査など、モデル以外の価値をより多く提供する必要がある。

まとめ

DeepSeek V4 の発表は、ベンチマークによって最大の衝撃を作ったわけではありません。本当に業界の期待を変えたのは、その後の値下げでした。

入力 Token とキャッシュヒット価格が非常に低くなると、AI Agent の利用コストは変わります。これまで高価に見えていた長文コンテキスト、コードプロジェクト分析、複数ラウンドのツール呼び出しが、今では数毛から数元の日常的な消費になる可能性があります。

これは Coding Plan と Token Plan のビジネスロジックを直接揺さぶります。ユーザーが従量課金で、モデルとツールを自由に組み合わせられ、さらにコストも十分低いなら、特定のプラットフォームプランに縛られる必要はありません。

DeepSeek V4 が今回本当に動かしたのは、モデル能力ランキングだけではなく、AI Agent のコスト構造とデフォルト入口をめぐる競争です。

参考情報：