2026年1月4日の土曜日、AWSはEC2 Capacity Blocks for ML(GPUを期間予約で確保するサービス)の料金を、正式なアナウンスなしに約15%引き上げた[1][2]。対象はNVIDIA H200(大規模AI向けデータセンターGPU)を搭載するP5e系インスタンスである。
クラウドの計算資源は時間とともに安くなる。多くの企業のAI投資計画は、この暗黙の前提の上に立ってきた。ハードウェアの世代交代と事業者間競争が値下げを駆動するという経験則は、ストレージやCPUでは長く成立してきたからである。今回の値上げは、GPUに限ってはこの前提が崩れたことを示す画期になった。
本稿では値上げの中身を数字で確認し、背景にある供給構造、そして値上げを前提とした調達戦略の組み立て直しを整理する。AI基盤の予算を持つ管理職と、その見積もりを作るインフラエンジニアの両方に関わる話である。
AWSはなぜ告知なくH200を値上げしたのか
値上げは2026年1月4日に適用された。データセンター専門メディアDCDの報道によれば、主要リージョンでの変化は次の通りである[1]。
| インスタンス | 構成 | 旧価格(ドル/時) | 新価格(ドル/時) | 上昇率 |
|---|---|---|---|---|
| p5e.48xlarge | H200×8 | 34.61 | 39.80 | 約15% |
| p5en.48xlarge | H200×8 | 36.18 | 41.61 | 約15% |
| p5e.48xlarge(米西部・北カリフォルニア) | H200×8 | 43.26 | 49.75 | 約15% |
Capacity Blocksは学習ジョブ等のために期間を区切ってGPU容量を前払い予約する仕組みで、従来はオンデマンドより4〜5割安い水準に設定されてきた。例えばH100世代のp5.48xlargeはオンデマンド毎時55.04ドル(約8,531円/時。以下1ドル=155円換算)に対し、Capacity Blocksでは34.608ドル(約5,364円/時)である[5]。つまり今回上がったのは「高い定価」ではなく、確保性と引き換えの割安枠の方であり、利用者の逃げ場は狭い。
AWSは理由を「需給パターン」と説明した[1][2]。Capacity Blocksはもともと需給に応じて料金が変動する建て付けのサービスだが、ほぼ全リージョンで一斉に15%上がる動きは、恒常的な需要超過を事業者自身が認めたことを意味する。
土曜日という適用タイミングも示唆的だ。値下げは大々的に発表し、値上げは静かに反映する。クラウド料金を「常に下がるもの」として扱ってきた利用者側の期待と、事業者の行動はすでにずれている。
H200の供給不足はなぜ続くのか:需要3倍の構造を読む
値上げの背景には素直な需給がある。報道によれば、NVIDIAには2026年分として約200万個のH200の注文が入っているのに対し、確保できている在庫は約70万個にとどまる[1]。需要が供給の3倍近くある以上、転売市場と同じ力学でレンタル価格は上がる。
しかも需要側は生成AIの学習・推論基盤の構築ラッシュが続いており、短期に冷える要素が乏しい。後継世代のGPUが出ても、当面は新世代がさらに高い価格帯に乗り、旧世代の値下がりが従来より緩やかになるという構造が予想される。
一方で市場全体を見ると、価格は一様ではない。2026年5月時点のH200のオンデマンド価格は事業者により1GPUあたり毎時1.45〜13.78ドル(約225〜2,136円/GPU/時)と約10倍の開きがあり、中央値は4ドル弱(約620円)である[3]。ハイパースケーラーは高く、GPU特化の新興事業者(ネオクラウド)は毎時2.5ドル前後(約388円)の水準を出している[3]。高い側にはSLA・コンプライアンス・他サービス統合という対価が含まれており、この差は「同じ商品の価格差」ではなく「別の商品」と捉えるべきだ。
値上げ後のGPU調達コストをどう計算し直すか
値上げを所与とすると、調達の選択肢は再計算が必要になる。H200搭載サーバ(8GPU構成)の購入価格はおおむね32万〜42万ドル(約4,960万〜6,510万円)、GPU単体ではSXM形態で3.2万〜4万ドル(約496万〜620万円)とされる[4]。
判断の軸は稼働率である。各種の試算では、稼働率が60〜70%を超えて恒常的に回るワークロードでは購入が有利になり、24時間稼働で80%超なら8〜12カ月で投資回収に達するという目安が示されている[4]。逆に1日12時間未満の断続利用なら、値上げ後でもクラウドが安い。
| 調達手段 | 向くワークロード | リスク |
|---|---|---|
| オンデマンド/Capacity Blocks | 実験・短期学習・需要が読めない段階 | 値上げ・確保失敗 |
| 長期予約(1〜12カ月) | 稼働が読める推論・定常学習 | コミット過剰 |
| ネオクラウド | コスト最優先の学習ジョブ | SLA・データ統制 |
| オンプレ購入 | 稼働率60%超の恒常利用 | 初期投資・陳腐化 |
なお購入の試算では、GPU本体価格に電力・冷却・ラック設置・保守人員・ネットワーク増強が上乗せされる点に注意したい。本体価格だけの比較は購入側を実際より有利に見せる。逆にクラウド側には、需要ピーク時に確保自体に失敗するリスクという、価格に表れないコストがある。
現実解は単一手段への集中ではなく、基礎負荷をオンプレか長期予約で持ち、変動分をクラウドで吸収するポートフォリオ型になる。値上げはこの配分計算の前提値を変えた、という整理が正確だ。
まとめ
AWSのH200値上げは単発の価格改定ではなく、GPUに関して「クラウドは待てば安くなる」という前提が当面通用しないことの表明である。需要3倍の供給構造が解消するまで、価格は下方硬直的に推移すると見るべきだ。
実務としては、第一にAI基盤の予算計画から「年率数%の値下がり」前提を外す。第二に自社GPUワークロードの実稼働率を計測し、購入・予約・オンデマンドの損益分岐を自社の数字で引き直す。前提が崩れたときに最初にやるべきことは、新しい前提で計算をやり直すことである。
よくある質問(FAQ)
Q. AWSのH200値上げはどのリージョン・インスタンスが対象ですか?
A. p5e.48xlargeとp5en.48xlargeが主要対象で、米東部・米西部(北カリフォルニア含む)など複数リージョンで一斉に約15%引き上げられました。
Q. クラウドGPUの値上げが続く中、オンプレミス購入に切り替えるべきですか?
A. 自社GPUワークロードの実稼働率が60〜70%を恒常的に超える場合は購入が有利ですが、電力・冷却・保守コストも含めた全体計算が必要です。断続利用ならクラウドが依然コスト優位です。
Q. Capacity Blocksとオンデマンドはどちらを使うべきですか?
A. 需要が読めない実験・短期学習はCapacity Blocks(またはオンデマンド)、稼働が安定した推論・定常学習は長期予約、コスト最優先ならネオクラウドという使い分けが基本です。
出典
[1] DCD: AWS quietly increases prices for H200 EC2 instances by 15% — https://www.datacenterdynamics.com/en/news/aws-quietly-increases-prices-for-h200-ec2-instances-by-15/[2] The Register: AWS raises GPU prices 15% on a Saturday — https://www.theregister.com/2026/01/05/aws_price_increase/
[3] Thunder Compute: NVIDIA H200 Price Comparison (June 2026) — https://www.thundercompute.com/blog/nvidia-h200-pricing
[4] Mercatus: H200 Price in 2026: OEM, Cloud, and Total System Cost — https://www.mercatus-ai.com/blog/h200-price
[5] AWS Machine Learning Blog: Secure short-term GPU capacity for ML workloads with EC2 Capacity Blocks for ML and SageMaker training plans — https://aws.amazon.com/blogs/machine-learning/secure-short-term-gpu-capacity-for-ml-workloads-with-ec2-capacity-blocks-for-ml-and-sagemaker-training-plans/