DeepSeek V4 の発表は、特別に大きな話題を作ったわけではありません。 大規模な発表会もなく、すべての競合を一目で圧倒するようなベンチマークの物語もありませんでした。 しかし数日後、本当に業界へ影響する部分が見え始めました。連続的な値下げです。
今回の変化で重要なのは、「モデルが少し強くなった」ことではなく、「利用コストが別の水準まで下がった」ことです。 Token 価格が、普通の Agent タスクなら数毛から数元で完了できるほど低くなると、多くの Coding Plan や Token Plan のビジネスロジックは見直しを迫られます。
発表当日は爆発的ではなかった
DeepSeek V4 に対する最初の反応は、そこまで熱狂的ではありませんでした。 多くの人は R1 のような強い衝撃を期待していました。ベンチマークの全面的なリード、国産計算資源の検証、マルチモーダルと Agent 能力の同時爆発です。 しかし実際に発表されると、それは堅実なアップグレードに近いものでした。
V4 Pro は確かに強いモデルです。特にコード、数学、長文コンテキスト、agentic coding では良い性能を見せます。 ただし、同種のモデルを一瞬で色あせさせるような製品ではありません。 そのため発表当日の世論には少し気まずさがありました。褒めたいけれど、十分に爆発的な切り口が見つかりにくかったのです。
本当の転換点は発表当日ではなく、その後の価格調整でした。
連続値下げこそが重要
DeepSeek V4 の発表後、価格は連続して下がり始めました。 DeepSeek の公式価格ページと元記事の整理によると、当時のおおよその価格は次のとおりです。
- DeepSeek V4 Flash:入力 100 万 Token あたり約 1 元。キャッシュヒット後は 100 万 Token あたり約 2 分;
- DeepSeek V4 Pro:入力 100 万 Token あたり約 3 元。キャッシュヒット後は 100 万 Token あたり約 2.5 分;
- 全シリーズの入力キャッシュヒット価格は、初回価格の 1/10 に低下;
- V4 Pro は一時 75% 割引期間にあり、割引は 2026 年 5 月 31 日 23:59 まで延長されました。
米ドルの API 価格で見ると、さらに直感的です。
| モデル | キャッシュヒット入力 | 非キャッシュ入力 | 出力 | コンテキスト |
|---|---|---|---|---|
deepseek-v4-flash |
$0.0028 / 100万 Token | $0.14 / 100万 Token | $0.28 / 100万 Token | 1M |
deepseek-v4-pro プロモーション価格 |
$0.003625 / 100万 Token | $0.435 / 100万 Token | $0.87 / 100万 Token | 1M |
deepseek-v4-pro 通常価格 |
$0.0145 / 100万 Token | $1.74 / 100万 Token | $3.48 / 100万 Token | 1M |
ここで注意すべき点が 2 つあります。
第一に、V4 Pro の $0.435 / $0.87 はプロモーション価格であり、長期的な通常価格ではありません。 DeepSeek の公式説明では、この 75% 割引は 2026 年 5 月 31 日 15:59 UTC まで延長されています。
第二に、Agent のコストモデルで重要なのはキャッシュヒット価格です。 Flash のキャッシュヒット入力は $0.0028 / 100万 Token まで低く、Pro のプロモーション期間中のキャッシュヒット入力は $0.003625 / 100万 Token です。 これは、繰り返し使われるプロジェクトコンテキスト、ツール定義、システムプロンプト、履歴要約が、完全な入力価格で課金されなくなることを意味します。
この価格のもっとも重要な点は、多くのタスクで Token コストが「気になりにくくなる」ことです。 以前の開発者は、1 回の Agent タスクが大量のコンテキストを消費し、コードを何度も読み書きし、ツールを頻繁に呼び出すことを心配していました。 今はキャッシュヒット率が十分に高ければ、コストをかなり低く抑えられます。
GPT、Claude との価格比較
DeepSeek 自体の価格だけを見ても、差はまだ感じにくいかもしれません。 同時期によく使われるクローズドモデルと並べると、違いはより明確になります。
| モデル | 入力 | キャッシュ入力 | 出力 | 適した場面 |
|---|---|---|---|---|
deepseek-v4-flash |
$0.14 / M | $0.0028 / M | $0.28 / M | 高頻度 Agent、通常の coding、バッチタスク |
deepseek-v4-pro プロモーション価格 |
$0.435 / M | $0.003625 / M | $0.87 / M | 複雑な coding、計画、事実確認 |
deepseek-v4-pro 通常価格 |
$1.74 / M | $0.0145 / M | $3.48 / M | プロモーション終了後の Pro コスト基準 |
| GPT-5.5 | $5 / M | $0.50 / M | $30 / M | 高品質な複雑タスク、汎用推論 |
| GPT-5.4 | $2.50 / M | $0.25 / M | $15 / M | プログラミングと専門タスクの中位選択肢 |
| GPT-5.4 mini | $0.75 / M | $0.075 / M | $4.50 / M | 低コストの汎用/サブタスクモデル |
| Claude Opus 4.7 | $5 / M | $0.50 / M | $25 / M | 高品質な執筆、複雑推論、長時間タスク |
| Claude Sonnet 4.6 | $3 / M | $0.30 / M | $15 / M | プログラミング、Agent、総合タスク |
| Claude Haiku 4.5 | $1 / M | $0.10 / M | $5 / M | 軽量タスク、要約、分類 |
この表で最も目立つのは出力価格です。 Agent はコンテキストを読むだけでなく、計画、パッチ、説明、ログ、次のアクションを継続的に生成します。 出力が多い場合、DeepSeek V4 Pro のプロモーション価格 $0.87 / M は、GPT-5.5 の $30 / M や Claude Sonnet 4.6 の $15 / M と比べて、差がどんどん広がります。
V4 Pro の通常出力価格 $3.48 / M で計算しても、GPT-5.4、GPT-5.5、Claude Sonnet / Opus より明らかに低い水準です。 タスクを Flash で処理できるなら、出力価格はさらに $0.28 / M まで下がります。
キャッシュ入力の差はさらに極端です。 DeepSeek V4 Flash のキャッシュ入力は $0.0028 / M である一方、GPT-5.5 と Claude Opus 4.7 のキャッシュ入力はいずれも $0.50 / M です。 これは同じ桁の話ではありません。 同じコードリポジトリを繰り返し読む Agent にとって、この差は通常のチャットよりも重要です。
Agent タスクが特に影響を受ける理由
AI Agent は普通のチャットとは違います。 普通のチャットはたいてい一問一答で、入力コンテキストは比較的限られています。 Agent タスクは、プロジェクトファイルを繰り返し読み、計画を生成し、ツールを呼び出し、結果を確認し、さらにコードを修正します。
この種のタスクには 2 つの特徴があります。
- Token 消費が大きい;
- 繰り返しコンテキストが多い。
2 点目が非常に重要です。 コードプロジェクトでは、モデルは同じファイル群、ディレクトリ構造、エラーログ、変更結果を何度も読みます。 プラットフォームがキャッシュヒットをサポートしていれば、繰り返し入力のコストは大幅に下がります。
元記事では実際の体験として、DeepSeek V4 Pro と Flash を Claude Code のようなツールに接続し、プロンプトリポジトリを取得してローカル検索サイトを作らせた例が紹介されています。 タスクは最終的に完了し、総コストは 8 毛強ほどで、そのうち Pro のキャッシュヒット率は 98.7% に達しました。
この例は現実的な問題を示しています。Agent タスクが「同じプロジェクトを中心に繰り返し作業する」ほど、キャッシュヒットの価値は高くなります。 Web サイト生成、bug 修正、フロントエンド修正が数毛から数元で済むなら、サブスクリプションプランの魅力は下がります。
簡略化したタスクで差を見積もることもできます。 1 回の coding agent タスクが次を含むと仮定します。
- 50 万 Token の入力。そのうち 80% がキャッシュヒット可能;
- 5 万 Token の出力;
- ツール呼び出し、検索、プラットフォーム上乗せ分は計算せず、モデル Token コストだけを見る。
おおよそのコストは次のとおりです。
| モデル | 推定コスト |
|---|---|
| DeepSeek V4 Flash | 約 $0.03 |
| DeepSeek V4 Pro プロモーション価格 | 約 $0.09 |
| DeepSeek V4 Pro 通常価格 | 約 $0.36 |
| GPT-5.4 mini | 約 $0.30 |
| GPT-5.4 | 約 $1.01 |
| GPT-5.5 | 約 $1.75 |
| Claude Sonnet 4.6 | 約 $1.11 |
| Claude Opus 4.7 | 約 $1.65 |
この見積もりは、DeepSeek がすべてのタスクで優れているという意味ではありません。 モデル品質、ツール呼び出しの安定性、長文コンテキスト検索能力、コードスタイル、事実の信頼性は個別に評価する必要があります。 ただしコスト面では、DeepSeek V4 は「Agent にもう数ラウンド走らせる」ことの限界コストをかなり低くしました。 これにより開発者は、毎回 Token 請求を心配するのではなく、より長いワークフロー、より頻繁なセルフチェック、より多くの候補案を設計しやすくなります。
Coding Plan と Token Plan の違い
多くの AI 製品はいま、Coding Plan と Token Plan という 2 種類のプランを提供しています。
大まかな違いは次のとおりです。
- Coding Plan は通常、主にプログラミング向け;
- Token Plan は通常、STT、TTS、画像生成、検索、embedding、RAG など、より多くの機能を含む;
- STT は音声から文字への変換;
- TTS は文字から音声への変換;
- Coding Plan はユーザーをプログラミング場面に制限しがちで、他の機能は別途購入が必要になることが多い。
ビジネスの観点では、Coding Plan はビュッフェに近いものです。 ユーザーは固定料金を前払いし、ベンダーは大多数の人が枠を使い切らないことに賭けます。 多く使う人も少なく使う人もいて、平均するとプラットフォームは利益を出せます。
しかし従量制の Token 価格が十分に低くなると、ユーザーは計算し始めます。なぜ必ずプランを買わなければならないのか。 1 か月の実際の利用コストが数元から十数元程度なら、40 元や 200 元のプランは必ずしも割に合いません。
値下げがサブスクリプションモデルを揺さぶる理由
サブスクリプションプランが成立するには前提があります。ユーザーが単発利用を高いと感じるか、毎回の呼び出しコストを計算したくないことです。 Token 価格が高いとき、プランは安心に見えます。 Token 価格がほとんど気にならないほど低くなると、従量課金のほうが自然になります。
DeepSeek V4 の値下げは、底のコストを見せたようなものです。
- Agent タスクは非常に安くできる;
- 長文コンテキストは必ずしも使えないほど高くない;
- キャッシュヒットでコストを大きく下げられる;
- 普通の開発者は固定サブスクリプションを必ずしも必要としない;
- モデルの入口は「プラン型プラットフォーム」から「低価格 API」へ移り得る。
これは Coding Plan を提供するプラットフォームにとって不快な変化です。 従量呼び出しのほうが安く自由だとユーザーが気づけば、ひとつのプラットフォームのプランに縛られる必要はありません。
Flash と Pro をどう選ぶか
DeepSeek V4 の実用的な考え方のひとつは、Flash と Pro を分担して使うことです。
Flash は高頻度、軽量、反復可能なタスクに向いています。
- bug 修正;
- フロントエンド作成;
- スクリプト作成;
- 通常のコード理解;
- 長いコンテキスト内の一般的な情報整理;
- 大量のサブタスク実行。
Flash は安く、速く、同じく長いコンテキストをサポートします。 日常的な coding agent では、多くのタスクで最初から Pro を使う必要はありません。
Pro は複雑な判断やフォールバックタスクに向いています。
- 複数ラウンドの計画;
- 複雑な Agent ワークフロー;
- 複数回の function call;
- 事実確認;
- 財務・経済リサーチ;
- より強い知識と判断力が必要なコンテンツ生成;
- 高リスクなコード変更。
合理的な構成は、Flash が量をこなし、Pro がフォールバックを担当する形です。 通常タスクはまず Flash で始め、長期計画、複雑な判断、事実確認、複数ツールの協調が必要になったら Pro に切り替える。 こうすればコストを抑えつつ、モデル品質も保てます。
DeepSeek がこの価格を出せる理由
DeepSeek は多くの大手企業と事業構造が異なります。 EC、SNS、ショート動画、クラウドコンピューティング、スマートフォン、自動車、オフィススイート、OS、ブラウザ、大規模な企業向け SaaS エコシステムを持っていません。
つまり、ユーザーを完全なプラットフォーム内に閉じ込める必要がありません。 安いテキストモデル能力だけを売ることができます。他の機能は、必要に応じてどこを呼び出してもよいのです。
大手企業のロジックは通常異なります。 その Coding Plan や Token Plan を買うと、クラウド、検索、画像生成、音声、データベース、開発ツールのエコシステムへ引き込まれます。 プランは単純にモデルを売るものではなく、ユーザーの入口を取りに行くものです。
DeepSeek の戦い方はより直接的です。テキストモデルの価格を下げ、Agent のデフォルトモデル入口になることを狙います。 デフォルト入口を取れれば、多くの開発者とツールチェーンは自然にそれへ適応していきます。
オープンモデルとデフォルト入口
DeepSeek V4 がオープンモデル路線を維持するなら、サードパーティのクラウドベンダーやプラットフォームが自前でデプロイし、サービスを提供する可能性があります。 DeepSeek にとって、それは普及でもあり、同時に流量の分散でもあります。
低価格の公式 API の意味はここにあります。 公式価格がすでに十分低ければ、他のプラットフォームがデプロイできたとしても、価格面で明確な優位を出すのは難しくなります。 ユーザーは、デフォルトで安く安定した入口を直接使う傾向になります。
Agent ツールでは特にそうです。 Agent タスクは長文コンテキスト、キャッシュ、ツール呼び出し、安定したスループットに依存します。 あるモデルがこれらの場面で十分安ければ、デフォルト選択肢になる可能性があります。
Coding Plan は完全に無用ではない
これは Coding Plan がすぐ消えるという意味ではありません。 それに合うユーザーはまだいます。
もし一部のユーザーが本当に高頻度で、毎日プランの上限まで使うなら、固定サブスクリプションはまだ得かもしれません。 ビュッフェと同じで、誰も元を取れないなら、ユーザーも買おうとはしません。
ただし問題は、ほとんどのユーザーがそのような極端な高頻度ユーザーではないことです。 低頻度ユーザー、軽量な開発者、たまにスクリプトを書いたりプロジェクトを直したりする人には、従量課金のほうが向いています。 DeepSeek が従量コストを下げると、プランの魅力は弱まります。
今後は、より階層化された選択が起こりやすくなります。
- 高頻度のヘビーユーザーは Coding Plan を買い続ける;
- 普通のユーザーは低価格 API へ移る;
- Agent ツールはタスクに応じて Flash / Pro を自動選択する;
- プラットフォームのプランは、ワークフロー、IDE 統合、デプロイ、チーム管理、セキュリティ監査など、モデル以外の価値をより多く提供する必要がある。
まとめ
DeepSeek V4 の発表は、ベンチマークによって最大の衝撃を作ったわけではありません。 本当に業界の期待を変えたのは、その後の値下げでした。
入力 Token とキャッシュヒット価格が非常に低くなると、AI Agent の利用コストは変わります。 これまで高価に見えていた長文コンテキスト、コードプロジェクト分析、複数ラウンドのツール呼び出しが、今では数毛から数元の日常的な消費になる可能性があります。
これは Coding Plan と Token Plan のビジネスロジックを直接揺さぶります。 ユーザーが従量課金で、モデルとツールを自由に組み合わせられ、さらにコストも十分低いなら、特定のプラットフォームプランに縛られる必要はありません。
DeepSeek V4 が今回本当に動かしたのは、モデル能力ランキングだけではなく、AI Agent のコスト構造とデフォルト入口をめぐる競争です。
参考情報: