AI用GPUと電力から計算資源を予測する（2026年6月末）

建設されたデータセンターの計算資源が必要とされる量を超える事はあるのか

予測はCHATGPTpro5.5を利用

さらに他AIを使って内容をチェック

AI計算資源は何GW投入されるのか

要約

2026年6月30日時点で、すでに稼働しているAI向け計算資源の電力規模は、世界全体で 約15〜20GW、中心推定は 約17GW と見ます。

これはGPU/AIアクセラレーター系サーバーだけのIT負荷ではなく、冷却・電源ロスなどを含めた「施設側の総負荷」ベースです。IT負荷だけなら 約12〜15GW、中心約13GW です。

2026年6月末に稼働してるAI用データセンターをGW計算

IEAは、世界のデータセンター電力消費を2024年時点で約415TWh、2030年に約945TWhと見ています。また、AI導入が主因のアクセラレーテッドサーバーの電力消費は年率30%で伸び、2030年までのデータセンター電力増加分のほぼ半分を占めるとしています

ここから逆算すると、AI向けアクセラレーテッドサーバーの2026年時点の年間電力はおよそ106〜117TWh。1GWを1年間連続稼働すると8.76TWhなので、IT負荷では約12〜13GW台になります。

ただし、実際に電力系統から見る負荷はサーバーだけではありません。IEAは、サーバーが現代的データセンター電力の平均約60%を占め、冷却は効率的なハイパースケールで約7%、非効率な施設では30%超まで変わると説明しています。AI向け設備は高密度・高効率側に寄るため、IT負荷に1.25〜1.5倍程度を乗せるのが妥当です。

したがって、建設中・計画中・電力契約だけの案件を除いた「すでに稼働済み」のAI計算資源は、施設総負荷で 15〜20GW、中心値17GW と推定します。

米国側の大きさを見る補助線として、DOE/LBNLは米国データセンター全体の電力消費を2023年176TWh、2028年325〜580TWhと見ています。世界推定17GWのうち、米国が最大シェアを占めると考えるのが自然です。

含めないもの
建設中のAIキャンパス、発表済みプロジェクト、将来拡張枠、電力契約のみ、系統接続待ち、一般クラウドや通常データセンターの非AI負荷は含めていません。

運用主体でみたデータセンター運用GW数

運用主体	中心推定	レンジ
Microsoft / Azure + OpenAI on Azure	3.2GW	2.6〜3.8GW
Amazon AWS + Anthropic on AWS	2.6GW	2.0〜3.2GW
Google / DeepMind / GCP TPU	2.3GW	1.8〜2.9GW
中国系ハイパースケーラー合算	2.3GW	1.7〜3.0GW
Meta first-party AI	2.1GW	1.6〜2.6GW
Oracle OCI / Stargate稼働分	1.2GW	0.8〜1.6GW
CoreWeave	1.1GW	0.9〜1.4GW
その他ネオクラウド	1.0GW	0.6〜1.5GW
xAIなどAIラボ自前クラスター	1.2GW	0.8〜1.7GW

注意点は、これは「運用主体ベース」の内訳です。CoreWeaveのGPUをMicrosoft/OpenAIやMetaが使っている場合でも、ここではCoreWeave側に置いています。需要者ベースで見ると、Microsoft/OpenAI、Meta、Anthropic側がもう少し大きく見えます。

AWSは全体のデータセンター容量では非常に大きい一方、非AIのクラウド負荷も厚いため、AI専用分だけではMicrosoft/AzureやGoogle、Metaとの差が縮まります。Axiosが紹介したJefferies/Aterioの北米データセンター容量では、AWS 10.6GW、Microsoft 5.5GW、Google 5.2GW、Meta 4.8GWとされていますが、これはAI専用容量ではありません。

中国系は透明性が低いため、Alibaba、Tencent、ByteDance、Baidu、Huawei系クラウド/AI基盤を合算しました。内訳イメージはByteDanceとAlibabaがやや大きく、Tencent、Baidu、Huawei系が続く形です。

2027年6月末に運用されてると推定されるＧＷ数

前回の2026年6月末推定 17GW から、約 +10GW、およそ 1.6倍

区分	2027年6月末中心推定
Microsoft / Azure + OpenAI	約4.6GW
AWS + Anthropic	約4.2GW
Google / DeepMind / GCP TPU	約3.7GW
中国系ハイパースケーラー合算	約3.6GW
Meta	約3.5GW
Oracle OCI / Stargate稼働分	約2.4GW
CoreWeave	約1.9GW
その他ネオクラウド	約1.6GW
xAIなどAIラボ自前	約1.5GW

本文
IEAは、AI利用を主因とするアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これだけを機械的に当てると、2026年6月末の17GWは2027年6月末に約22GW前後になります。

ただし2026年から2027年前半にかけては、Microsoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、CoreWeave、xAI、中国系AIクラウドの稼働化が重なるため、単純な30%成長より上振れすると見ます。

そのため、建設中・予定・電力契約だけの案件を除いた「稼働済み」ベースでは、2027年6月末の中心値を 27GW と置くのが妥当です。AIサーバーのIT負荷だけなら 約20〜22GW、冷却・電源ロスを含む施設総負荷で 約27GW です。

2028年6月末に運用されてると推定されるＧＷ数

2028年6月末、稼働済みAI計算資源は40GWを超える

区分	2028年6月末中心推定
Microsoft / Azure + OpenAI	約6.4GW
AWS + Anthropic	約6.0GW
Google / DeepMind / GCP TPU	約5.8GW
中国系ハイパースケーラー合算	約5.2GW
Meta	約5.0GW
Oracle OCI / Stargate稼働分	約4.0GW
CoreWeave	約3.1GW
その他ネオクラウド	約2.5GW
xAIなどAIラボ自前	約3.0GW

IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これを下限線に置くと、2028年6月末には2027年比で大きく増えます。さらに、Google TPU、AWS/Anthropic、Microsoft/OpenAI、Meta、Oracle/Stargate、CoreWeave、中国系AIクラウド、xAI系自前設備の稼働化が重なるため、中心推定は 41GW としました。

これはサーバー本体だけではなく、冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約30〜34GW 程度です。

2029年6月末に運用されてると推定されるＧＷ数

2029年6月末、稼働済みAI計算資源は60GW級に近づくのか

2029年6月30日時点で稼働済みのAI向け計算資源は、世界全体で 約49〜70GW、中心推定は 約58GW と見ます。
2028年6月末推定の 41GW から +17GW程度、2026年6月末の 17GW からは約 3.4倍 です

区分	2029年6月末中心推定
Microsoft / Azure + OpenAI	約9.0GW
AWS + Anthropic	約8.6GW
Google / DeepMind / GCP TPU	約8.0GW
中国系ハイパースケーラー合算	約7.2GW
Meta	約6.7GW
Oracle OCI / Stargate稼働分	約6.5GW
CoreWeave	約4.1GW
その他ネオクラウド	約3.3GW
xAIなどAIラボ自前	約4.6GW

本文
IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びると見ています。これを下限線に置きつつ、2028〜2029年前半に稼働化するMicrosoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、中国系AIクラウド、CoreWeave、xAI系設備を積み上げると、2029年6月末の中心推定は 58GW になります。

これは冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約43〜48GW 程度です。Stargateなどの発表済み巨大計画は全量を入れず、2029年6月30日までに実際に稼働していそうな分だけを含めています。

GPUサーバー構成比率から計算能力を推定

2026年6月末に運用されてると推定されるGPU

2026年6月末の稼働済みAI計算資源は、まだ H100系が最大勢力 です。
ただし GB200/B200系はすでに2割前後 まで入ってきており、2026年後半以降に主役がBlackwell系へ移る前夜、という構成です

種別	構成比
H100 / H800 / H100 NVL	36%
GB200 / B200 / 初期GB300	20%
H200 / H20 / H200 NVL	18%
A100 / A800 / V100残存	8%
Google TPU系	6%
AWS Trainium / Inferentia	4%
AMD MI300系	4%
Huawei Ascend / 中国AI ASIC	3%
その他: Gaudi / Cerebras / MTIAなど	1%

本文

NVIDIA系だけで見ると約 82%。その中では、H100/H200などHopper系がまだ過半、Blackwell系が約4分の1弱という見方です。

2026年6月末時点では、世界のAI計算資源の中心はまだH100系です。前回推定したAIサーバーIT負荷約13GWをベースに、GPU/AIアクセラレーターの電力シェアで見ると、H100/H800/H100 NVLが約36%、H200/H20系が約18%、GB200/B200などBlackwell系が約20%と見ます。

注意点は、これは「台数シェア」ではなく「電力シェア」です。GB200/B200は1個あたりの電力が大きいため、台数シェアより電力シェアが大きく見えます。またGoogle TPUやAWS TrainiumはGPUではありませんが、AI計算資源としては重要なので別枠で含めています。

2026年6月末の計算能力ベースライン

今後比較する基準値としては、以下で置くのが使いやすいです。すべて 稼働済み分のみ、かつ denseピーク性能 です。

※「denseピーク性能（Dense Peak Performance）」とは、主にAIやスーパーコンピュータの分野で使われる用語で、「AIプロセッサ（GPUなど）が、すべての計算回路をフル稼働させた状態で発揮できる理論上の最高処理速度」を意味します

指標	中心推定	レンジ
AIサーバーIT負荷	13GW	12〜15GW
FP16 / BF16ピーク	約10 ZFLOPS	8.5〜12 ZFLOPS
FP8ピーク	約19 ZFLOPS	16〜23 ZFLOPS
NVFP4 / FP4ピーク	約13 ZFLOPS	10〜16 ZFLOPS
H100 SXM相当	約1,000万個相当	850万〜1,200万個相当

本文
2026年6月末時点のAI計算資源を、今後比較するための基準値にすると、FP16/BF16のdenseピークで約10ZFLOPS、FP8で約19ZFLOPSと推定できます。これはH100換算で約1,000万個相当の計算能力です。

ただし、NVFP4/FP4は主にGB200/B200などBlackwell系で使える低精度性能なので、全GPU共通の性能ではありません。2026年6月末ではBlackwell系の導入が進み始めている段階のため、FP4系ピークは約13ZFLOPSにとどまると見ます。

今後の比較では、
2026年6月末 = 100
として、2027年以降のFP16/BF16、FP8、FP4性能が何倍になるかを見るのが分かりやすいです。

2027年6月末に運用されてると推定されるGPU

2027年6月末は、GPU構成の主役が H100/H200系からGB200/GB300系へ移るタイミング と見ます。
前提は、前回推定の AIサーバーIT負荷約21GW、施設総負荷約27GW です。

種別	推定比率
GB200 / B200 / GB300 / B300	42%
H100 / H800 / H100 NVL	19%
H200 / H20 / H200 NVL	12%
Google TPU系	8%
AWS Trainium / Inferentia	5%
AMD MI300 / MI350系	4%
A100 / A800 / V100残存	3%
Huawei Ascend / 中国AI ASIC	3%
Vera Rubin系初期導入	2%
その他	2%

2027年6月末の計算能力ベースライン

電力は2026年6月末比で約1.6倍ですが、Blackwell系の比率上昇で、特にFP4系の計算能力は約5倍まで跳ねる見方です。

指標	2027年6月末	2026年6月末=100
FP16 / BF16 dense	約26 ZFLOPS	約260
FP8 dense	約54 ZFLOPS	約280
NVFP4 / FP4 dense	約70 ZFLOPS	約540
H100 SXM相当	約2,600万個相当	約260

2028年6月末に運用されてると推定されるGPU

2028年6月末は、AI計算資源の主役が Blackwell系中心からRubin系併存へ移り始める段階 と見ます。
前提は、前回推定の AIサーバーIT負荷約32GW、施設総負荷約41GWです。

種別	推定比率
GB200 / B200 / GB300 / B300	36%
Vera Rubin / Rubin CPX系	20%
H100 / H800 / H100 NVL	8%
H200 / H20 / H200 NVL	6%
Google TPU系	9%
AWS Trainium / Inferentia	7%
AMD MI300 / MI350 / MI400初期	5%
Huawei Ascend / 中国AI ASIC	4%
A100 / A800 / V100残存	2%
その他	3%

2028年6月末の計算能力ベースライン

NVIDIA系全体では約72%。ただし内訳は、Hopper中心ではなく Blackwell + Rubinで56% まで進む見方です。

電力は2026年6月末比で約2.5倍ですが、Rubin/Blackwell比率の上昇により、FP4系の理論ピークは約17倍まで伸びる推定です。

指標	2028年6月末	2026年6月末=100
FP16 / BF16 dense	約58 ZFLOPS	約580
FP8 dense	約130 ZFLOPS	約680
NVFP4 / FP4 dense	約220 ZFLOPS	約1,690
H100 SXM相当	約5,800万個相当	約580

2029年6月末に運用されてると推定されるGPU

2029年6月末は、AI計算資源の中心が Rubin / Rubin Ultra系 に移り、Blackwell系が大きく残る構成と見ます。
前提は、前回推定の AIサーバーIT負荷約45GW、施設総負荷約58GWです。

NVIDIA系全体では約72%。ただし中身は、Hopper/Blackwell中心ではなく Rubin以降が主役 になります

種別	推定比率
Vera Rubin / Rubin Ultra系	34%
GB200 / B200 / GB300 / B300	25%
Feynman系初期導入	5%
H100 / H800 / H100 NVL	4%
H200 / H20 / H200 NVL	3%
Google TPU系	9%
AWS Trainium / Inferentia	7%
AMD MI350 / MI400 / MI500初期	6%
Huawei Ascend / 中国AI ASIC	4%
A100残存 / その他ASIC	3%

2029年6月末の計算能力ベースライン

電力は2026年6月末比で約3.5倍ですが、Rubin/Rubin UltraとFeynman初期導入により、FP4系の理論ピークは約46倍まで伸びる推定です。

指標	2029年6月末	2026年6月末=100
FP16 / BF16 dense	約115 ZFLOPS	約1,150
FP8 dense	約270 ZFLOPS	約1,420
NVFP4 / FP4 dense	約600 ZFLOPS	約4,620
H100 SXM相当	約1.1億個相当	約1,150

今後使用するトークン数を推定する

2026年6月に使用した総トークン数を推定する

結論として、2026年6月の1か月に世界で処理された生成AI推論トークンは、中心推定で約5P tokens/月と置くのがよさそうです。
これは 約5,000兆トークン/月です。レンジは広めに 3〜8P tokens/月。ここでは学習用のtoken-passではなく、推論サービスでモデルが処理した入力・出力・内部推論・RAG・長文コンテキストを含めています。

推定式は次のように置きました。

200億 model calls/day × 8,000 processed tokens/call × 30日 = 4.8P tokens/月

内訳イメージは、消費者向けチャット・AI検索が約2.0P、API・業務・コード生成が約1.5P、Agent/RAG/長文処理が約1.0P、翻訳・要約・バッチ処理が約0.5Pです。

この数字は、前回までの 2026年6月末のAI向けIT負荷約13GWとも整合します。推論に使われる平均電力を3〜5GW程度、処理トークンあたりの電力量をおおむね0.5〜1.3mWh/tokenと置くと、月間3〜8P tokens程度に収まります

指標	2026年6月の推定
世界の推論処理トークン	約5P tokens/月
レンジ	3〜8P tokens/月
日本語表記	約5,000兆トークン/月
ユーザーに見える入出力だけ	約1P tokens/月
学習・合成データのtoken-pass	別枠、約1〜3P token-pass/月程度

2027年6月に使用する総トークン数を推定する

2027年6月1日〜6月30日の1か月では、世界の生成AI推論トークン消費は中心推定で約18P tokens/月と置きます。
前回の2026年6月推定 5P tokens/月 に対して、約3.6倍です。

推定式はこう置きます。

500億 model calls/day × 12,000 processed tokens/call × 30日 = 18P tokens/月

内訳イメージは、消費者向けチャット・AI検索が約6.0P、API・業務・コード生成が約5.0P、Agent/RAG/長文処理が約5.0P、翻訳・要約・バッチ処理が約2.0Pです。

電力側からも検算すると、2027年6月末のAI向けIT負荷を約21GW、そのうち推論平均を7〜10GW程度と置いた場合、月間電力量は約5.0〜7.2TWh。これを18P tokensで割ると、0.28〜0.40mWh/tokenとなり、2026年より効率改善しつつ処理量が大きく伸びる前提と整合します

指標	2027年6月の推定
推論処理トークン	約18P tokens/月
日本語表記	約1.8京トークン/月
レンジ	11〜30P tokens/月
2026年6月比	約3.6倍
見える入出力だけ	約3.5P tokens/月

2027年6月に使用する総トークン数を推定する

この記事をシェアする