建設されたデータセンターの計算資源が必要とされる量を超える事はあるのか
AI計算資源は何GW投入されるのか
要約
2026年6月30日時点で、すでに稼働しているAI向け計算資源の電力規模は、世界全体で 約15〜20GW、中心推定は 約17GW と見ます。
これはGPU/AIアクセラレーター系サーバーだけのIT負荷ではなく、冷却・電源ロスなどを含めた「施設側の総負荷」ベースです。IT負荷だけなら 約12〜15GW、中心約13GW です。2026年6月末に稼働してるAI用データセンターをGW計算
IEAは、世界のデータセンター電力消費を2024年時点で約415TWh、2030年に約945TWhと見ています。また、AI導入が主因のアクセラレーテッドサーバーの電力消費は年率30%で伸び、2030年までのデータセンター電力増加分のほぼ半分を占めるとしています
ここから逆算すると、AI向けアクセラレーテッドサーバーの2026年時点の年間電力はおよそ106〜117TWh。1GWを1年間連続稼働すると8.76TWhなので、IT負荷では約12〜13GW台になります。
ただし、実際に電力系統から見る負荷はサーバーだけではありません。IEAは、サーバーが現代的データセンター電力の平均約60%を占め、冷却は効率的なハイパースケールで約7%、非効率な施設では30%超まで変わると説明しています。AI向け設備は高密度・高効率側に寄るため、IT負荷に1.25〜1.5倍程度を乗せるのが妥当です。
したがって、建設中・計画中・電力契約だけの案件を除いた「すでに稼働済み」のAI計算資源は、施設総負荷で 15〜20GW、中心値17GW と推定します。
米国側の大きさを見る補助線として、DOE/LBNLは米国データセンター全体の電力消費を2023年176TWh、2028年325〜580TWhと見ています。世界推定17GWのうち、米国が最大シェアを占めると考えるのが自然です。
含めないもの
建設中のAIキャンパス、発表済みプロジェクト、将来拡張枠、電力契約のみ、系統接続待ち、一般クラウドや通常データセンターの非AI負荷は含めていません。
運用主体でみたデータセンター運用GW数
| 運用主体 | 中心推定 | レンジ |
|---|---|---|
| Microsoft / Azure + OpenAI on Azure | 3.2GW | 2.6〜3.8GW |
| Amazon AWS + Anthropic on AWS | 2.6GW | 2.0〜3.2GW |
| Google / DeepMind / GCP TPU | 2.3GW | 1.8〜2.9GW |
| 中国系ハイパースケーラー合算 | 2.3GW | 1.7〜3.0GW |
| Meta first-party AI | 2.1GW | 1.6〜2.6GW |
| Oracle OCI / Stargate稼働分 | 1.2GW | 0.8〜1.6GW |
| CoreWeave | 1.1GW | 0.9〜1.4GW |
| その他ネオクラウド | 1.0GW | 0.6〜1.5GW |
| xAIなどAIラボ自前クラスター | 1.2GW | 0.8〜1.7GW |
注意点は、これは「運用主体ベース」の内訳です。CoreWeaveのGPUをMicrosoft/OpenAIやMetaが使っている場合でも、ここではCoreWeave側に置いています。需要者ベースで見ると、Microsoft/OpenAI、Meta、Anthropic側がもう少し大きく見えます。
AWSは全体のデータセンター容量では非常に大きい一方、非AIのクラウド負荷も厚いため、AI専用分だけではMicrosoft/AzureやGoogle、Metaとの差が縮まります。Axiosが紹介したJefferies/Aterioの北米データセンター容量では、AWS 10.6GW、Microsoft 5.5GW、Google 5.2GW、Meta 4.8GWとされていますが、これはAI専用容量ではありません。
中国系は透明性が低いため、Alibaba、Tencent、ByteDance、Baidu、Huawei系クラウド/AI基盤を合算しました。内訳イメージはByteDanceとAlibabaがやや大きく、Tencent、Baidu、Huawei系が続く形です。
2027年6月末に運用されてると推定されるGW数
| 区分 | 2027年6月末 中心推定 |
|---|---|
| Microsoft / Azure + OpenAI | 約4.6GW |
| AWS + Anthropic | 約4.2GW |
| Google / DeepMind / GCP TPU | 約3.7GW |
| 中国系ハイパースケーラー合算 | 約3.6GW |
| Meta | 約3.5GW |
| Oracle OCI / Stargate稼働分 | 約2.4GW |
| CoreWeave | 約1.9GW |
| その他ネオクラウド | 約1.6GW |
| xAIなどAIラボ自前 | 約1.5GW |
本文
IEAは、AI利用を主因とするアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これだけを機械的に当てると、2026年6月末の17GWは2027年6月末に約22GW前後になります。
ただし2026年から2027年前半にかけては、Microsoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、CoreWeave、xAI、中国系AIクラウドの稼働化が重なるため、単純な30%成長より上振れすると見ます。
そのため、建設中・予定・電力契約だけの案件を除いた「稼働済み」ベースでは、2027年6月末の中心値を 27GW と置くのが妥当です。AIサーバーのIT負荷だけなら 約20〜22GW、冷却・電源ロスを含む施設総負荷で 約27GW です。
2028年6月末に運用されてると推定されるGW数
| 区分 | 2028年6月末 中心推定 |
|---|---|
| Microsoft / Azure + OpenAI | 約6.4GW |
| AWS + Anthropic | 約6.0GW |
| Google / DeepMind / GCP TPU | 約5.8GW |
| 中国系ハイパースケーラー合算 | 約5.2GW |
| Meta | 約5.0GW |
| Oracle OCI / Stargate稼働分 | 約4.0GW |
| CoreWeave | 約3.1GW |
| その他ネオクラウド | 約2.5GW |
| xAIなどAIラボ自前 | 約3.0GW |
IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これを下限線に置くと、2028年6月末には2027年比で大きく増えます。さらに、Google TPU、AWS/Anthropic、Microsoft/OpenAI、Meta、Oracle/Stargate、CoreWeave、中国系AIクラウド、xAI系自前設備の稼働化が重なるため、中心推定は 41GW としました。
これはサーバー本体だけではなく、冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約30〜34GW 程度です。
2029年6月末に運用されてると推定されるGW数
2029年6月末、稼働済みAI計算資源は60GW級に近づくのか
2029年6月30日時点で稼働済みのAI向け計算資源は、世界全体で 約49〜70GW、中心推定は 約58GW と見ます。
2028年6月末推定の 41GW から +17GW程度、2026年6月末の 17GW からは約 3.4倍 です
| 区分 | 2029年6月末 中心推定 |
|---|---|
| Microsoft / Azure + OpenAI | 約9.0GW |
| AWS + Anthropic | 約8.6GW |
| Google / DeepMind / GCP TPU | 約8.0GW |
| 中国系ハイパースケーラー合算 | 約7.2GW |
| Meta | 約6.7GW |
| Oracle OCI / Stargate稼働分 | 約6.5GW |
| CoreWeave | 約4.1GW |
| その他ネオクラウド | 約3.3GW |
| xAIなどAIラボ自前 | 約4.6GW |
本文
IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びると見ています。これを下限線に置きつつ、2028〜2029年前半に稼働化するMicrosoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、中国系AIクラウド、CoreWeave、xAI系設備を積み上げると、2029年6月末の中心推定は 58GW になります。
これは冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約43〜48GW 程度です。Stargateなどの発表済み巨大計画は全量を入れず、2029年6月30日までに実際に稼働していそうな分だけを含めています。
GPUサーバー構成比率から計算能力を推定
2026年6月末に運用されてると推定されるGPU
ただし GB200/B200系はすでに2割前後 まで入ってきており、2026年後半以降に主役がBlackwell系へ移る前夜、という構成です
| 種別 | 構成比 |
|---|---|
| H100 / H800 / H100 NVL | 36% |
| GB200 / B200 / 初期GB300 | 20% |
| H200 / H20 / H200 NVL | 18% |
| A100 / A800 / V100残存 | 8% |
| Google TPU系 | 6% |
| AWS Trainium / Inferentia | 4% |
| AMD MI300系 | 4% |
| Huawei Ascend / 中国AI ASIC | 3% |
| その他: Gaudi / Cerebras / MTIAなど | 1% |
NVIDIA系だけで見ると約 82%。その中では、H100/H200などHopper系がまだ過半、Blackwell系が約4分の1弱という見方です。
2026年6月末時点では、世界のAI計算資源の中心はまだH100系です。前回推定したAIサーバーIT負荷約13GWをベースに、GPU/AIアクセラレーターの電力シェアで見ると、H100/H800/H100 NVLが約36%、H200/H20系が約18%、GB200/B200などBlackwell系が約20%と見ます。
注意点は、これは「台数シェア」ではなく「電力シェア」です。GB200/B200は1個あたりの電力が大きいため、台数シェアより電力シェアが大きく見えます。またGoogle TPUやAWS TrainiumはGPUではありませんが、AI計算資源としては重要なので別枠で含めています。
2026年6月末の計算能力ベースライン
今後比較する基準値としては、以下で置くのが使いやすいです。すべて 稼働済み分のみ、かつ denseピーク性能 です。※「denseピーク性能(Dense Peak Performance)」とは、主にAIやスーパーコンピュータの分野で使われる用語で、「AIプロセッサ(GPUなど)が、すべての計算回路をフル稼働させた状態で発揮できる理論上の最高処理速度」を意味します
| 指標 | 中心推定 | レンジ |
|---|---|---|
| AIサーバーIT負荷 | 13GW | 12〜15GW |
| FP16 / BF16ピーク | 約10 ZFLOPS | 8.5〜12 ZFLOPS |
| FP8ピーク | 約19 ZFLOPS | 16〜23 ZFLOPS |
| NVFP4 / FP4ピーク | 約13 ZFLOPS | 10〜16 ZFLOPS |
| H100 SXM相当 | 約1,000万個相当 | 850万〜1,200万個相当 |
本文
2026年6月末時点のAI計算資源を、今後比較するための基準値にすると、FP16/BF16のdenseピークで約10ZFLOPS、FP8で約19ZFLOPSと推定できます。これはH100換算で約1,000万個相当の計算能力です。
ただし、NVFP4/FP4は主にGB200/B200などBlackwell系で使える低精度性能なので、全GPU共通の性能ではありません。2026年6月末ではBlackwell系の導入が進み始めている段階のため、FP4系ピークは約13ZFLOPSにとどまると見ます。
今後の比較では、
2026年6月末 = 100
として、2027年以降のFP16/BF16、FP8、FP4性能が何倍になるかを見るのが分かりやすいです。
2027年6月末に運用されてると推定されるGPU
2027年6月末は、GPU構成の主役が H100/H200系からGB200/GB300系へ移るタイミング と見ます。
前提は、前回推定の AIサーバーIT負荷 約21GW、施設総負荷 約27GW です。
| 種別 | 推定比率 |
|---|---|
| GB200 / B200 / GB300 / B300 | 42% |
| H100 / H800 / H100 NVL | 19% |
| H200 / H20 / H200 NVL | 12% |
| Google TPU系 | 8% |
| AWS Trainium / Inferentia | 5% |
| AMD MI300 / MI350系 | 4% |
| A100 / A800 / V100残存 | 3% |
| Huawei Ascend / 中国AI ASIC | 3% |
| Vera Rubin系 初期導入 | 2% |
| その他 | 2% |
2027年6月末の計算能力ベースライン
電力は2026年6月末比で約1.6倍ですが、Blackwell系の比率上昇で、特にFP4系の計算能力は約5倍まで跳ねる見方です。
| 指標 | 2027年6月末 | 2026年6月末=100 |
|---|---|---|
| FP16 / BF16 dense | 約26 ZFLOPS | 約260 |
| FP8 dense | 約54 ZFLOPS | 約280 |
| NVFP4 / FP4 dense | 約70 ZFLOPS | 約540 |
| H100 SXM相当 | 約2,600万個相当 | 約260 |
2028年6月末に運用されてると推定されるGPU
2028年6月末は、AI計算資源の主役が Blackwell系中心からRubin系併存へ移り始める段階 と見ます。
前提は、前回推定の AIサーバーIT負荷 約32GW、施設総負荷 約41GWです。
| 種別 | 推定比率 |
|---|---|
| GB200 / B200 / GB300 / B300 | 36% |
| Vera Rubin / Rubin CPX系 | 20% |
| H100 / H800 / H100 NVL | 8% |
| H200 / H20 / H200 NVL | 6% |
| Google TPU系 | 9% |
| AWS Trainium / Inferentia | 7% |
| AMD MI300 / MI350 / MI400初期 | 5% |
| Huawei Ascend / 中国AI ASIC | 4% |
| A100 / A800 / V100残存 | 2% |
| その他 | 3% |
2028年6月末の計算能力ベースライン
NVIDIA系全体では約72%。ただし内訳は、Hopper中心ではなく Blackwell + Rubinで56% まで進む見方です。
電力は2026年6月末比で約2.5倍ですが、Rubin/Blackwell比率の上昇により、FP4系の理論ピークは約17倍まで伸びる推定です。
| 指標 | 2028年6月末 | 2026年6月末=100 |
|---|---|---|
| FP16 / BF16 dense | 約58 ZFLOPS | 約580 |
| FP8 dense | 約130 ZFLOPS | 約680 |
| NVFP4 / FP4 dense | 約220 ZFLOPS | 約1,690 |
| H100 SXM相当 | 約5,800万個相当 | 約580 |
2029年6月末に運用されてると推定されるGPU
前提は、前回推定の AIサーバーIT負荷 約45GW、施設総負荷 約58GWです。
| 種別 | 推定比率 |
|---|---|
| Vera Rubin / Rubin Ultra系 | 34% |
| GB200 / B200 / GB300 / B300 | 25% |
| Feynman系 初期導入 | 5% |
| H100 / H800 / H100 NVL | 4% |
| H200 / H20 / H200 NVL | 3% |
| Google TPU系 | 9% |
| AWS Trainium / Inferentia | 7% |
| AMD MI350 / MI400 / MI500初期 | 6% |
| Huawei Ascend / 中国AI ASIC | 4% |
| A100残存 / その他ASIC | 3% |
2029年6月末の計算能力ベースライン
| 指標 | 2029年6月末 | 2026年6月末=100 |
|---|---|---|
| FP16 / BF16 dense | 約115 ZFLOPS | 約1,150 |
| FP8 dense | 約270 ZFLOPS | 約1,420 |
| NVFP4 / FP4 dense | 約600 ZFLOPS | 約4,620 |
| H100 SXM相当 | 約1.1億個相当 | 約1,150 |
今後使用するトークン数を推定する
2026年6月に使用した総トークン数を推定する
これは 約5,000兆トークン/月です。レンジは広めに 3〜8P tokens/月。ここでは学習用のtoken-passではなく、推論サービスでモデルが処理した入力・出力・内部推論・RAG・長文コンテキストを含めています。
推定式は次のように置きました。
200億 model calls/day × 8,000 processed tokens/call × 30日 = 4.8P tokens/月
内訳イメージは、消費者向けチャット・AI検索が約2.0P、API・業務・コード生成が約1.5P、Agent/RAG/長文処理が約1.0P、翻訳・要約・バッチ処理が約0.5Pです。
この数字は、前回までの 2026年6月末のAI向けIT負荷 約13GWとも整合します。推論に使われる平均電力を3〜5GW程度、処理トークンあたりの電力量をおおむね0.5〜1.3mWh/tokenと置くと、月間3〜8P tokens程度に収まります
| 指標 | 2026年6月の推定 |
|---|---|
| 世界の推論処理トークン | 約5P tokens/月 |
| レンジ | 3〜8P tokens/月 |
| 日本語表記 | 約5,000兆トークン/月 |
| ユーザーに見える入出力だけ | 約1P tokens/月 |
| 学習・合成データのtoken-pass | 別枠、約1〜3P token-pass/月程度 |
前回の2026年6月推定 5P tokens/月 に対して、約3.6倍です。
推定式はこう置きます。
500億 model calls/day × 12,000 processed tokens/call × 30日 = 18P tokens/月
内訳イメージは、消費者向けチャット・AI検索が約6.0P、API・業務・コード生成が約5.0P、Agent/RAG/長文処理が約5.0P、翻訳・要約・バッチ処理が約2.0Pです。
電力側からも検算すると、2027年6月末のAI向けIT負荷を約21GW、そのうち推論平均を7〜10GW程度と置いた場合、月間電力量は約5.0〜7.2TWh。これを18P tokensで割ると、0.28〜0.40mWh/tokenとなり、2026年より効率改善しつつ処理量が大きく伸びる前提と整合します
| 指標 | 2027年6月の推定 |
|---|---|
| 推論処理トークン | 約18P tokens/月 |
| 日本語表記 | 約1.8京トークン/月 |
| レンジ | 11〜30P tokens/月 |
| 2026年6月比 | 約3.6倍 |
| 見える入出力だけ | 約3.5P tokens/月 |
0 件のコメント :
コメントを投稿