AIデータセンターがHDD需要を再び押し上げる理由

AIの学習と推論はGPUを消費するだけではありません。checkpoint、学習データ、ログ、監査記録も継続的に生み出します。大量のコールドデータが、HDDをデータセンターのストレージ基盤として再び重要な存在にしています。

この2年、AIインフラをめぐる議論の多くはGPU、HBM、先端パッケージング、電力供給に集中してきました。しかし学習・推論システムの背後には、見落とされやすい別のボトルネックがあります。ストレージです。

大規模モデルは、GPU上で一度計算すれば終わるものではありません。学習中にはcheckpoint、オプティマイザーの状態、学習ログ、データのバージョン、中間結果が継続的に生成されます。推論段階でも、ユーザーとのやり取りの記録、コンプライアンス目的の保存データ、監査データ、システムログが生まれます。これらのデータは必ずしも最速の媒体に置く必要はありませんが、すぐに削除できるものでもありません。

これが、HDDが再び重要になっている理由です。

AI学習は大量のコールドデータを生み出す

大規模モデルの学習では、定期的にcheckpointを保存する必要があります。checkpointは学習過程のセーブポイントのようなものです。学習の途中で障害が起きても、最初からやり直すのではなく、あるcheckpointから再開できます。

大規模モデルでは、1つのcheckpointだけで数TBになることがあります。完全な学習は数週間から数か月続く場合があり、その間に多数のcheckpointが保存されます。後から一部を削除するとしても、学習過程の確認、ロールバック、実験の再現、モデル監査には大量のデータ保持が必要です。

checkpointだけでなく、学習データそのものも膨張しています。高品質なテキスト、画像、動画、コードのデータは、クレンジング、重複排除、分割、バージョン管理が必要です。合成データ、強化学習データ、マルチモーダルデータが学習パイプラインに入るにつれ、ストレージへの圧力はさらに高まります。

こうしたデータには次の特徴があります。

  • 容量が非常に大きい。
  • 必ずしも頻繁にアクセスされるわけではない。
  • 長期保存が必要になる。
  • 容量あたりのコストに非常に敏感である。

この種のデータをすべて高価な高速ストレージに置くのは合理的ではありません。

なぜすべてをSSDにしないのか

SSDは明らかに高速ですが、データセンターは速度だけを見て設計できません。PB級、あるいはそれ以上のコールドデータでは、容量あたりのコストがシステムの持続可能性を直接左右します。

AIクラスター内のストレージは、いくつかの階層に分けられます。

  • HBMとGPUメモリは、最もホットで緊急度の高いデータを扱う。
  • DRAMは一時的な受け渡しを担う。
  • SSDは高頻度アクセスや低レイテンシ要求の強いデータを扱う。
  • HDDは大量のコールドデータ、バックアップ、ログ、checkpointアーカイブ、長期保存を担う。

つまり、SSDが重要ではないのではありません。すべての階層を置き換えられるわけではないのです。真に大規模なシステムには階層型ストレージが必要です。ホットデータは速度を重視し、コールドデータは容量、コスト、信頼性を重視します。

AI企業が学習の残存データ、モデルのバージョン、合成データ、推論ログ、監査記録を長期的に保存し始めるほど、HDDの価値は再び大きくなります。

HDDの供給が逼迫する理由

HDD市場は長年、目立った成長分野とは見られてきませんでした。消費者向けPCもSSDへの移行が進んでいます。しかしデータセンターの需要ロジックは異なります。

クラウド事業者やAI企業が必要としているのは、大容量で、納期が読みやすく、TBあたりのコストが低いニアラインHDDです。HDDメーカーにとって、こうした顧客は長期供給契約を結ぶことが多く、細かな消費者市場より優先度も高くなります。

その結果、次のようなことが起こります。

  1. 大容量エンタープライズHDDの生産能力が大口顧客に早期に押さえられる。
  2. 消費者向けHDDや一般流通に回る供給が少なくなる。
  3. 新しい生産能力の立ち上げには時間がかかり、短期的な不足をすぐには補えない。
  4. HDDが、かつての低注目ハードウェアからAIインフラの一部へと変わる。

さらに重要なのは、HDD業界そのものがすでに高度に集中していることです。主要サプライヤーは限られており、先進的な大容量HDDの生産を増やすことは、単に工場を増やせばすぐ終わる話ではありません。HAMRなどの新技術は1台あたりの容量を高められますが、技術的な量産から安定した大規模供給に至るまでには時間がかかります。

ストレージ価格の上昇は消費者にも波及する

AIデータセンターが吸収しているのはGPUと電力だけではありません。ストレージのサプライチェーンにも影響します。

エンタープライズSSD、メモリ、HDDの生産能力がクラウド事業者やAIインフラへより多く向かうと、消費者向け市場も価格圧力を受ける可能性があります。一般ユーザーが目にするSSD、メモリ、HDDの値上がりは、単なる小売市場の変動だけではなく、上流の生産能力の再配分に由来する場合があります。

この影響は通常、直線的ではありません。大口顧客は長期契約を結び、価格、納期、生産能力の割り当てがより安定します。一方、消費者市場はスポット市場の変動を受けやすくなります。その結果、AIデータセンター需要の拡大が、最終的には一般消費者のストレージ購入価格も押し上げるという現象が起こります。

投資の視点では慎重さが必要

AIがストレージ需要を押し上げていることは事実です。ただし、それはストレージ関連企業すべてが長期的に恩恵を受けるという意味ではありません。

HDDとフラッシュメモリには、依然として循環的な性質があります。価格上昇、生産能力の逼迫、長期契約は短期業績を改善します。しかし新たな生産能力が立ち上がったり、需要成長が鈍化したりすれば、業界は再び需給バランスの調整局面に戻る可能性があります。ハードウェア企業を見るうえで重要なのは、一度の値上げではなく、需要が続くのか、粗利率が改善するのか、過剰な能力拡張にならないのか、顧客構成が健全かどうかです。

より堅実な見方をすれば、AIはストレージ業界の需要構造を変えつつあります。以前は外部から見ると計算能力に注目が集まりがちでしたが、今後はデータ保存、データガバナンス、モデルライフサイクル管理へ向かうコストが増えていきます。

結論

AIは計算能力を消費するだけではありません。データも生み続けます。

GPUは計算を担い、HBMは高速にデータを供給し、SSDはホットデータへのアクセスを支え、HDDは巨大なコールドデータの土台を受け止めます。大規模モデルの学習、合成データ、推論ログ、コンプライアンス保存が増え続ける限り、データセンターには低コストで大容量のストレージ媒体が大量に必要です。

HDDはAI時代の主役ハードウェアには見えないかもしれません。それでも、AIインフラに欠かせない一層になりつつあります。モデルが高度になるほど、巨大なストレージシステムから離れられません。計算資源が高価になるほど、すでに投入したコストを守るために、信頼できるcheckpointとアーカイブ能力が必要になります。

记录并分享
Hugo で構築されています。
テーマ StackJimmy によって設計されています。