<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>大規模モデル価格 on KnightLiブログ</title>
        <link>https://www.knightli.com/ja/tags/%E5%A4%A7%E8%A6%8F%E6%A8%A1%E3%83%A2%E3%83%87%E3%83%AB%E4%BE%A1%E6%A0%BC/</link>
        <description>Recent content in 大規模モデル価格 on KnightLiブログ</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>ja</language>
        <lastBuildDate>Fri, 01 May 2026 19:47:47 +0800</lastBuildDate><atom:link href="https://www.knightli.com/ja/tags/%E5%A4%A7%E8%A6%8F%E6%A8%A1%E3%83%A2%E3%83%87%E3%83%AB%E4%BE%A1%E6%A0%BC/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>DeepSeek V4 の値下げは AI Agent のコストモデルをどう書き換えるか</title>
        <link>https://www.knightli.com/ja/2026/05/01/deepseek-v4-price-cuts-ai-agent-economics/</link>
        <pubDate>Fri, 01 May 2026 19:47:47 +0800</pubDate>
        
        <guid>https://www.knightli.com/ja/2026/05/01/deepseek-v4-price-cuts-ai-agent-economics/</guid>
        <description>&lt;p&gt;DeepSeek V4 の発表は、特別に大きな話題を作ったわけではありません。
大規模な発表会もなく、すべての競合を一目で圧倒するようなベンチマークの物語もありませんでした。
しかし数日後、本当に業界へ影響する部分が見え始めました。連続的な値下げです。&lt;/p&gt;
&lt;p&gt;今回の変化で重要なのは、「モデルが少し強くなった」ことではなく、「利用コストが別の水準まで下がった」ことです。
Token 価格が、普通の Agent タスクなら数毛から数元で完了できるほど低くなると、多くの Coding Plan や Token Plan のビジネスロジックは見直しを迫られます。&lt;/p&gt;
&lt;h2 id=&#34;発表当日は爆発的ではなかった&#34;&gt;発表当日は爆発的ではなかった
&lt;/h2&gt;&lt;p&gt;DeepSeek V4 に対する最初の反応は、そこまで熱狂的ではありませんでした。
多くの人は R1 のような強い衝撃を期待していました。ベンチマークの全面的なリード、国産計算資源の検証、マルチモーダルと Agent 能力の同時爆発です。
しかし実際に発表されると、それは堅実なアップグレードに近いものでした。&lt;/p&gt;
&lt;p&gt;V4 Pro は確かに強いモデルです。特にコード、数学、長文コンテキスト、agentic coding では良い性能を見せます。
ただし、同種のモデルを一瞬で色あせさせるような製品ではありません。
そのため発表当日の世論には少し気まずさがありました。褒めたいけれど、十分に爆発的な切り口が見つかりにくかったのです。&lt;/p&gt;
&lt;p&gt;本当の転換点は発表当日ではなく、その後の価格調整でした。&lt;/p&gt;
&lt;h2 id=&#34;連続値下げこそが重要&#34;&gt;連続値下げこそが重要
&lt;/h2&gt;&lt;p&gt;DeepSeek V4 の発表後、価格は連続して下がり始めました。
DeepSeek の公式価格ページと元記事の整理によると、当時のおおよその価格は次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;DeepSeek V4 Flash：入力 100 万 Token あたり約 1 元。キャッシュヒット後は 100 万 Token あたり約 2 分；&lt;/li&gt;
&lt;li&gt;DeepSeek V4 Pro：入力 100 万 Token あたり約 3 元。キャッシュヒット後は 100 万 Token あたり約 2.5 分；&lt;/li&gt;
&lt;li&gt;全シリーズの入力キャッシュヒット価格は、初回価格の 1/10 に低下；&lt;/li&gt;
&lt;li&gt;V4 Pro は一時 75% 割引期間にあり、割引は 2026 年 5 月 31 日 23:59 まで延長されました。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;米ドルの API 価格で見ると、さらに直感的です。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;モデル&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;キャッシュヒット入力&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;非キャッシュ入力&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;出力&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;コンテキスト&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-flash&lt;/code&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.0028 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.14 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.28 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;1M&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-pro&lt;/code&gt; プロモーション価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.003625 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.435 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.87 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;1M&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-pro&lt;/code&gt; 通常価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.0145 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$1.74 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$3.48 / 100万 Token&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;1M&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;ここで注意すべき点が 2 つあります。&lt;/p&gt;
&lt;p&gt;第一に、V4 Pro の $0.435 / $0.87 はプロモーション価格であり、長期的な通常価格ではありません。
DeepSeek の公式説明では、この 75% 割引は 2026 年 5 月 31 日 15:59 UTC まで延長されています。&lt;/p&gt;
&lt;p&gt;第二に、Agent のコストモデルで重要なのはキャッシュヒット価格です。
Flash のキャッシュヒット入力は $0.0028 / 100万 Token まで低く、Pro のプロモーション期間中のキャッシュヒット入力は $0.003625 / 100万 Token です。
これは、繰り返し使われるプロジェクトコンテキスト、ツール定義、システムプロンプト、履歴要約が、完全な入力価格で課金されなくなることを意味します。&lt;/p&gt;
&lt;p&gt;この価格のもっとも重要な点は、多くのタスクで Token コストが「気になりにくくなる」ことです。
以前の開発者は、1 回の Agent タスクが大量のコンテキストを消費し、コードを何度も読み書きし、ツールを頻繁に呼び出すことを心配していました。
今はキャッシュヒット率が十分に高ければ、コストをかなり低く抑えられます。&lt;/p&gt;
&lt;h2 id=&#34;gptclaude-との価格比較&#34;&gt;GPT、Claude との価格比較
&lt;/h2&gt;&lt;p&gt;DeepSeek 自体の価格だけを見ても、差はまだ感じにくいかもしれません。
同時期によく使われるクローズドモデルと並べると、違いはより明確になります。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;モデル&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;入力&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;キャッシュ入力&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;出力&lt;/th&gt;
          &lt;th&gt;適した場面&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-flash&lt;/code&gt;&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.14 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.0028 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.28 / M&lt;/td&gt;
          &lt;td&gt;高頻度 Agent、通常の coding、バッチタスク&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-pro&lt;/code&gt; プロモーション価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.435 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.003625 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.87 / M&lt;/td&gt;
          &lt;td&gt;複雑な coding、計画、事実確認&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;deepseek-v4-pro&lt;/code&gt; 通常価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$1.74 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.0145 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$3.48 / M&lt;/td&gt;
          &lt;td&gt;プロモーション終了後の Pro コスト基準&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.5&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$5 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.50 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$30 / M&lt;/td&gt;
          &lt;td&gt;高品質な複雑タスク、汎用推論&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.4&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$2.50 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.25 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$15 / M&lt;/td&gt;
          &lt;td&gt;プログラミングと専門タスクの中位選択肢&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.4 mini&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.75 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.075 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$4.50 / M&lt;/td&gt;
          &lt;td&gt;低コストの汎用/サブタスクモデル&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Opus 4.7&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$5 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.50 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$25 / M&lt;/td&gt;
          &lt;td&gt;高品質な執筆、複雑推論、長時間タスク&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Sonnet 4.6&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$3 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.30 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$15 / M&lt;/td&gt;
          &lt;td&gt;プログラミング、Agent、総合タスク&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Haiku 4.5&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$1 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$0.10 / M&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;$5 / M&lt;/td&gt;
          &lt;td&gt;軽量タスク、要約、分類&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;この表で最も目立つのは出力価格です。
Agent はコンテキストを読むだけでなく、計画、パッチ、説明、ログ、次のアクションを継続的に生成します。
出力が多い場合、DeepSeek V4 Pro のプロモーション価格 $0.87 / M は、GPT-5.5 の $30 / M や Claude Sonnet 4.6 の $15 / M と比べて、差がどんどん広がります。&lt;/p&gt;
&lt;p&gt;V4 Pro の通常出力価格 $3.48 / M で計算しても、GPT-5.4、GPT-5.5、Claude Sonnet / Opus より明らかに低い水準です。
タスクを Flash で処理できるなら、出力価格はさらに $0.28 / M まで下がります。&lt;/p&gt;
&lt;p&gt;キャッシュ入力の差はさらに極端です。
DeepSeek V4 Flash のキャッシュ入力は $0.0028 / M である一方、GPT-5.5 と Claude Opus 4.7 のキャッシュ入力はいずれも $0.50 / M です。
これは同じ桁の話ではありません。
同じコードリポジトリを繰り返し読む Agent にとって、この差は通常のチャットよりも重要です。&lt;/p&gt;
&lt;h2 id=&#34;agent-タスクが特に影響を受ける理由&#34;&gt;Agent タスクが特に影響を受ける理由
&lt;/h2&gt;&lt;p&gt;AI Agent は普通のチャットとは違います。
普通のチャットはたいてい一問一答で、入力コンテキストは比較的限られています。
Agent タスクは、プロジェクトファイルを繰り返し読み、計画を生成し、ツールを呼び出し、結果を確認し、さらにコードを修正します。&lt;/p&gt;
&lt;p&gt;この種のタスクには 2 つの特徴があります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Token 消費が大きい；&lt;/li&gt;
&lt;li&gt;繰り返しコンテキストが多い。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;2 点目が非常に重要です。
コードプロジェクトでは、モデルは同じファイル群、ディレクトリ構造、エラーログ、変更結果を何度も読みます。
プラットフォームがキャッシュヒットをサポートしていれば、繰り返し入力のコストは大幅に下がります。&lt;/p&gt;
&lt;p&gt;元記事では実際の体験として、DeepSeek V4 Pro と Flash を Claude Code のようなツールに接続し、プロンプトリポジトリを取得してローカル検索サイトを作らせた例が紹介されています。
タスクは最終的に完了し、総コストは 8 毛強ほどで、そのうち Pro のキャッシュヒット率は 98.7% に達しました。&lt;/p&gt;
&lt;p&gt;この例は現実的な問題を示しています。Agent タスクが「同じプロジェクトを中心に繰り返し作業する」ほど、キャッシュヒットの価値は高くなります。
Web サイト生成、bug 修正、フロントエンド修正が数毛から数元で済むなら、サブスクリプションプランの魅力は下がります。&lt;/p&gt;
&lt;p&gt;簡略化したタスクで差を見積もることもできます。
1 回の coding agent タスクが次を含むと仮定します。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;50 万 Token の入力。そのうち 80% がキャッシュヒット可能；&lt;/li&gt;
&lt;li&gt;5 万 Token の出力；&lt;/li&gt;
&lt;li&gt;ツール呼び出し、検索、プラットフォーム上乗せ分は計算せず、モデル Token コストだけを見る。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;おおよそのコストは次のとおりです。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;モデル&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;推定コスト&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;DeepSeek V4 Flash&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $0.03&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;DeepSeek V4 Pro プロモーション価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $0.09&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;DeepSeek V4 Pro 通常価格&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $0.36&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.4 mini&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $0.30&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.4&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $1.01&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;GPT-5.5&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $1.75&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Sonnet 4.6&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $1.11&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Opus 4.7&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;約 $1.65&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;この見積もりは、DeepSeek がすべてのタスクで優れているという意味ではありません。
モデル品質、ツール呼び出しの安定性、長文コンテキスト検索能力、コードスタイル、事実の信頼性は個別に評価する必要があります。
ただしコスト面では、DeepSeek V4 は「Agent にもう数ラウンド走らせる」ことの限界コストをかなり低くしました。
これにより開発者は、毎回 Token 請求を心配するのではなく、より長いワークフロー、より頻繁なセルフチェック、より多くの候補案を設計しやすくなります。&lt;/p&gt;
&lt;h2 id=&#34;coding-plan-と-token-plan-の違い&#34;&gt;Coding Plan と Token Plan の違い
&lt;/h2&gt;&lt;p&gt;多くの AI 製品はいま、Coding Plan と Token Plan という 2 種類のプランを提供しています。&lt;/p&gt;
&lt;p&gt;大まかな違いは次のとおりです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Coding Plan は通常、主にプログラミング向け；&lt;/li&gt;
&lt;li&gt;Token Plan は通常、STT、TTS、画像生成、検索、embedding、RAG など、より多くの機能を含む；&lt;/li&gt;
&lt;li&gt;STT は音声から文字への変換；&lt;/li&gt;
&lt;li&gt;TTS は文字から音声への変換；&lt;/li&gt;
&lt;li&gt;Coding Plan はユーザーをプログラミング場面に制限しがちで、他の機能は別途購入が必要になることが多い。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;ビジネスの観点では、Coding Plan はビュッフェに近いものです。
ユーザーは固定料金を前払いし、ベンダーは大多数の人が枠を使い切らないことに賭けます。
多く使う人も少なく使う人もいて、平均するとプラットフォームは利益を出せます。&lt;/p&gt;
&lt;p&gt;しかし従量制の Token 価格が十分に低くなると、ユーザーは計算し始めます。なぜ必ずプランを買わなければならないのか。
1 か月の実際の利用コストが数元から十数元程度なら、40 元や 200 元のプランは必ずしも割に合いません。&lt;/p&gt;
&lt;h2 id=&#34;値下げがサブスクリプションモデルを揺さぶる理由&#34;&gt;値下げがサブスクリプションモデルを揺さぶる理由
&lt;/h2&gt;&lt;p&gt;サブスクリプションプランが成立するには前提があります。ユーザーが単発利用を高いと感じるか、毎回の呼び出しコストを計算したくないことです。
Token 価格が高いとき、プランは安心に見えます。
Token 価格がほとんど気にならないほど低くなると、従量課金のほうが自然になります。&lt;/p&gt;
&lt;p&gt;DeepSeek V4 の値下げは、底のコストを見せたようなものです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Agent タスクは非常に安くできる；&lt;/li&gt;
&lt;li&gt;長文コンテキストは必ずしも使えないほど高くない；&lt;/li&gt;
&lt;li&gt;キャッシュヒットでコストを大きく下げられる；&lt;/li&gt;
&lt;li&gt;普通の開発者は固定サブスクリプションを必ずしも必要としない；&lt;/li&gt;
&lt;li&gt;モデルの入口は「プラン型プラットフォーム」から「低価格 API」へ移り得る。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;これは Coding Plan を提供するプラットフォームにとって不快な変化です。
従量呼び出しのほうが安く自由だとユーザーが気づけば、ひとつのプラットフォームのプランに縛られる必要はありません。&lt;/p&gt;
&lt;h2 id=&#34;flash-と-pro-をどう選ぶか&#34;&gt;Flash と Pro をどう選ぶか
&lt;/h2&gt;&lt;p&gt;DeepSeek V4 の実用的な考え方のひとつは、Flash と Pro を分担して使うことです。&lt;/p&gt;
&lt;p&gt;Flash は高頻度、軽量、反復可能なタスクに向いています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;bug 修正；&lt;/li&gt;
&lt;li&gt;フロントエンド作成；&lt;/li&gt;
&lt;li&gt;スクリプト作成；&lt;/li&gt;
&lt;li&gt;通常のコード理解；&lt;/li&gt;
&lt;li&gt;長いコンテキスト内の一般的な情報整理；&lt;/li&gt;
&lt;li&gt;大量のサブタスク実行。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Flash は安く、速く、同じく長いコンテキストをサポートします。
日常的な coding agent では、多くのタスクで最初から Pro を使う必要はありません。&lt;/p&gt;
&lt;p&gt;Pro は複雑な判断やフォールバックタスクに向いています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;複数ラウンドの計画；&lt;/li&gt;
&lt;li&gt;複雑な Agent ワークフロー；&lt;/li&gt;
&lt;li&gt;複数回の function call；&lt;/li&gt;
&lt;li&gt;事実確認；&lt;/li&gt;
&lt;li&gt;財務・経済リサーチ；&lt;/li&gt;
&lt;li&gt;より強い知識と判断力が必要なコンテンツ生成；&lt;/li&gt;
&lt;li&gt;高リスクなコード変更。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;合理的な構成は、Flash が量をこなし、Pro がフォールバックを担当する形です。
通常タスクはまず Flash で始め、長期計画、複雑な判断、事実確認、複数ツールの協調が必要になったら Pro に切り替える。
こうすればコストを抑えつつ、モデル品質も保てます。&lt;/p&gt;
&lt;h2 id=&#34;deepseek-がこの価格を出せる理由&#34;&gt;DeepSeek がこの価格を出せる理由
&lt;/h2&gt;&lt;p&gt;DeepSeek は多くの大手企業と事業構造が異なります。
EC、SNS、ショート動画、クラウドコンピューティング、スマートフォン、自動車、オフィススイート、OS、ブラウザ、大規模な企業向け SaaS エコシステムを持っていません。&lt;/p&gt;
&lt;p&gt;つまり、ユーザーを完全なプラットフォーム内に閉じ込める必要がありません。
安いテキストモデル能力だけを売ることができます。他の機能は、必要に応じてどこを呼び出してもよいのです。&lt;/p&gt;
&lt;p&gt;大手企業のロジックは通常異なります。
その Coding Plan や Token Plan を買うと、クラウド、検索、画像生成、音声、データベース、開発ツールのエコシステムへ引き込まれます。
プランは単純にモデルを売るものではなく、ユーザーの入口を取りに行くものです。&lt;/p&gt;
&lt;p&gt;DeepSeek の戦い方はより直接的です。テキストモデルの価格を下げ、Agent のデフォルトモデル入口になることを狙います。
デフォルト入口を取れれば、多くの開発者とツールチェーンは自然にそれへ適応していきます。&lt;/p&gt;
&lt;h2 id=&#34;オープンモデルとデフォルト入口&#34;&gt;オープンモデルとデフォルト入口
&lt;/h2&gt;&lt;p&gt;DeepSeek V4 がオープンモデル路線を維持するなら、サードパーティのクラウドベンダーやプラットフォームが自前でデプロイし、サービスを提供する可能性があります。
DeepSeek にとって、それは普及でもあり、同時に流量の分散でもあります。&lt;/p&gt;
&lt;p&gt;低価格の公式 API の意味はここにあります。
公式価格がすでに十分低ければ、他のプラットフォームがデプロイできたとしても、価格面で明確な優位を出すのは難しくなります。
ユーザーは、デフォルトで安く安定した入口を直接使う傾向になります。&lt;/p&gt;
&lt;p&gt;Agent ツールでは特にそうです。
Agent タスクは長文コンテキスト、キャッシュ、ツール呼び出し、安定したスループットに依存します。
あるモデルがこれらの場面で十分安ければ、デフォルト選択肢になる可能性があります。&lt;/p&gt;
&lt;h2 id=&#34;coding-plan-は完全に無用ではない&#34;&gt;Coding Plan は完全に無用ではない
&lt;/h2&gt;&lt;p&gt;これは Coding Plan がすぐ消えるという意味ではありません。
それに合うユーザーはまだいます。&lt;/p&gt;
&lt;p&gt;もし一部のユーザーが本当に高頻度で、毎日プランの上限まで使うなら、固定サブスクリプションはまだ得かもしれません。
ビュッフェと同じで、誰も元を取れないなら、ユーザーも買おうとはしません。&lt;/p&gt;
&lt;p&gt;ただし問題は、ほとんどのユーザーがそのような極端な高頻度ユーザーではないことです。
低頻度ユーザー、軽量な開発者、たまにスクリプトを書いたりプロジェクトを直したりする人には、従量課金のほうが向いています。
DeepSeek が従量コストを下げると、プランの魅力は弱まります。&lt;/p&gt;
&lt;p&gt;今後は、より階層化された選択が起こりやすくなります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;高頻度のヘビーユーザーは Coding Plan を買い続ける；&lt;/li&gt;
&lt;li&gt;普通のユーザーは低価格 API へ移る；&lt;/li&gt;
&lt;li&gt;Agent ツールはタスクに応じて Flash / Pro を自動選択する；&lt;/li&gt;
&lt;li&gt;プラットフォームのプランは、ワークフロー、IDE 統合、デプロイ、チーム管理、セキュリティ監査など、モデル以外の価値をより多く提供する必要がある。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;まとめ&#34;&gt;まとめ
&lt;/h2&gt;&lt;p&gt;DeepSeek V4 の発表は、ベンチマークによって最大の衝撃を作ったわけではありません。
本当に業界の期待を変えたのは、その後の値下げでした。&lt;/p&gt;
&lt;p&gt;入力 Token とキャッシュヒット価格が非常に低くなると、AI Agent の利用コストは変わります。
これまで高価に見えていた長文コンテキスト、コードプロジェクト分析、複数ラウンドのツール呼び出しが、今では数毛から数元の日常的な消費になる可能性があります。&lt;/p&gt;
&lt;p&gt;これは Coding Plan と Token Plan のビジネスロジックを直接揺さぶります。
ユーザーが従量課金で、モデルとツールを自由に組み合わせられ、さらにコストも十分低いなら、特定のプラットフォームプランに縛られる必要はありません。&lt;/p&gt;
&lt;p&gt;DeepSeek V4 が今回本当に動かしたのは、モデル能力ランキングだけではなく、AI Agent のコスト構造とデフォルト入口をめぐる競争です。&lt;/p&gt;
&lt;p&gt;参考情報：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://api-docs.deepseek.com/quick_start/pricing/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;DeepSeek API Docs：Models &amp;amp; Pricing&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://openai.com/api/pricing/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;OpenAI API Pricing&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://platform.claude.com/docs/en/about-claude/pricing&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Anthropic Claude API Pricing&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
