AI用GPUと電力から計算資源を予測する(2026年6月末)

建設されたデータセンターの計算資源が必要とされる量を超える事はあるのか

予測はCHATGPTpro5.5を利用
さらに他AIを使って内容をチェック

AI計算資源は何GW投入されるのか

要約

2026年6月30日時点で、すでに稼働しているAI向け計算資源の電力規模は、世界全体で 約15〜20GW、中心推定は 約17GW と見ます。

これはGPU/AIアクセラレーター系サーバーだけのIT負荷ではなく、冷却・電源ロスなどを含めた「施設側の総負荷」ベースです。IT負荷だけなら 約12〜15GW、中心約13GW です。

2026年6月末に稼働してるAI用データセンターをGW計算

IEAは、世界のデータセンター電力消費を2024年時点で約415TWh、2030年に約945TWhと見ています。また、AI導入が主因のアクセラレーテッドサーバーの電力消費は年率30%で伸び、2030年までのデータセンター電力増加分のほぼ半分を占めるとしています

ここから逆算すると、AI向けアクセラレーテッドサーバーの2026年時点の年間電力はおよそ106〜117TWh。1GWを1年間連続稼働すると8.76TWhなので、IT負荷では約12〜13GW台になります。

ただし、実際に電力系統から見る負荷はサーバーだけではありません。IEAは、サーバーが現代的データセンター電力の平均約60%を占め、冷却は効率的なハイパースケールで約7%、非効率な施設では30%超まで変わると説明しています。AI向け設備は高密度・高効率側に寄るため、IT負荷に1.25〜1.5倍程度を乗せるのが妥当です。

したがって、建設中・計画中・電力契約だけの案件を除いた「すでに稼働済み」のAI計算資源は、施設総負荷で 15〜20GW、中心値17GW と推定します。

米国側の大きさを見る補助線として、DOE/LBNLは米国データセンター全体の電力消費を2023年176TWh、2028年325〜580TWhと見ています。世界推定17GWのうち、米国が最大シェアを占めると考えるのが自然です。

含めないもの
建設中のAIキャンパス、発表済みプロジェクト、将来拡張枠、電力契約のみ、系統接続待ち、一般クラウドや通常データセンターの非AI負荷は含めていません。

運用主体でみたデータセンター運用GW数


運用主体中心推定レンジ
Microsoft / Azure + OpenAI on Azure3.2GW2.6〜3.8GW
Amazon AWS + Anthropic on AWS2.6GW2.0〜3.2GW
Google / DeepMind / GCP TPU2.3GW1.8〜2.9GW
中国系ハイパースケーラー合算2.3GW1.7〜3.0GW
Meta first-party AI2.1GW1.6〜2.6GW
Oracle OCI / Stargate稼働分1.2GW0.8〜1.6GW
CoreWeave1.1GW0.9〜1.4GW
その他ネオクラウド1.0GW0.6〜1.5GW
xAIなどAIラボ自前クラスター1.2GW0.8〜1.7GW


注意点は、これは「運用主体ベース」の内訳です。CoreWeaveのGPUをMicrosoft/OpenAIやMetaが使っている場合でも、ここではCoreWeave側に置いています。需要者ベースで見ると、Microsoft/OpenAI、Meta、Anthropic側がもう少し大きく見えます。

AWSは全体のデータセンター容量では非常に大きい一方、非AIのクラウド負荷も厚いため、AI専用分だけではMicrosoft/AzureやGoogle、Metaとの差が縮まります。Axiosが紹介したJefferies/Aterioの北米データセンター容量では、AWS 10.6GW、Microsoft 5.5GW、Google 5.2GW、Meta 4.8GWとされていますが、これはAI専用容量ではありません。

中国系は透明性が低いため、Alibaba、Tencent、ByteDance、Baidu、Huawei系クラウド/AI基盤を合算しました。内訳イメージはByteDanceとAlibabaがやや大きく、Tencent、Baidu、Huawei系が続く形です。


2027年6月末に運用されてると推定されるGW数

前回の2026年6月末推定 17GW から、約 +10GW、およそ 1.6倍 
区分2027年6月末 中心推定
Microsoft / Azure + OpenAI約4.6GW
AWS + Anthropic約4.2GW
Google / DeepMind / GCP TPU約3.7GW
中国系ハイパースケーラー合算約3.6GW
Meta約3.5GW
Oracle OCI / Stargate稼働分約2.4GW
CoreWeave約1.9GW
その他ネオクラウド約1.6GW
xAIなどAIラボ自前約1.5GW


本文
IEAは、AI利用を主因とするアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これだけを機械的に当てると、2026年6月末の17GWは2027年6月末に約22GW前後になります。

ただし2026年から2027年前半にかけては、Microsoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、CoreWeave、xAI、中国系AIクラウドの稼働化が重なるため、単純な30%成長より上振れすると見ます。

そのため、建設中・予定・電力契約だけの案件を除いた「稼働済み」ベースでは、2027年6月末の中心値を 27GW と置くのが妥当です。AIサーバーのIT負荷だけなら 約20〜22GW、冷却・電源ロスを含む施設総負荷で 約27GW です。


2028年6月末に運用されてると推定されるGW数

2028年6月末、稼働済みAI計算資源は40GWを超える

区分2028年6月末 中心推定
Microsoft / Azure + OpenAI約6.4GW
AWS + Anthropic約6.0GW
Google / DeepMind / GCP TPU約5.8GW
中国系ハイパースケーラー合算約5.2GW
Meta約5.0GW
Oracle OCI / Stargate稼働分約4.0GW
CoreWeave約3.1GW
その他ネオクラウド約2.5GW
xAIなどAIラボ自前約3.0GW


IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びるとしています。これを下限線に置くと、2028年6月末には2027年比で大きく増えます。さらに、Google TPU、AWS/Anthropic、Microsoft/OpenAI、Meta、Oracle/Stargate、CoreWeave、中国系AIクラウド、xAI系自前設備の稼働化が重なるため、中心推定は 41GW としました。

これはサーバー本体だけではなく、冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約30〜34GW 程度です。

2029年6月末に運用されてると推定されるGW数

2029年6月末、稼働済みAI計算資源は60GW級に近づくのか

2029年6月30日時点で稼働済みのAI向け計算資源は、世界全体で 約49〜70GW、中心推定は 約58GW と見ます。
2028年6月末推定の 41GW から +17GW程度、2026年6月末の 17GW からは約 3.4倍 です

区分2029年6月末 中心推定
Microsoft / Azure + OpenAI約9.0GW
AWS + Anthropic約8.6GW
Google / DeepMind / GCP TPU約8.0GW
中国系ハイパースケーラー合算約7.2GW
Meta約6.7GW
Oracle OCI / Stargate稼働分約6.5GW
CoreWeave約4.1GW
その他ネオクラウド約3.3GW
xAIなどAIラボ自前約4.6GW


本文
IEAは、AI向けアクセラレーテッドサーバーの電力消費が年率約30%で伸びると見ています。これを下限線に置きつつ、2028〜2029年前半に稼働化するMicrosoft/OpenAI、AWS/Anthropic、Google TPU、Meta、Oracle/Stargate、中国系AIクラウド、CoreWeave、xAI系設備を積み上げると、2029年6月末の中心推定は 58GW になります。

これは冷却・電源ロスを含む施設総負荷ベースです。AIサーバーのIT負荷だけなら 約43〜48GW 程度です。Stargateなどの発表済み巨大計画は全量を入れず、2029年6月30日までに実際に稼働していそうな分だけを含めています。

GPUサーバー構成比率から計算能力を推定

2026年6月末に運用されてると推定されるGPU

2026年6月末の稼働済みAI計算資源は、まだ H100系が最大勢力 です。
ただし GB200/B200系はすでに2割前後 まで入ってきており、2026年後半以降に主役がBlackwell系へ移る前夜、という構成です


種別構成比
H100 / H800 / H100 NVL36%
GB200 / B200 / 初期GB30020%
H200 / H20 / H200 NVL18%
A100 / A800 / V100残存8%
Google TPU系6%
AWS Trainium / Inferentia4%
AMD MI300系4%
Huawei Ascend / 中国AI ASIC3%
その他: Gaudi / Cerebras / MTIAなど1%



本文

NVIDIA系だけで見ると約 82%。その中では、H100/H200などHopper系がまだ過半、Blackwell系が約4分の1弱という見方です。

2026年6月末時点では、世界のAI計算資源の中心はまだH100系です。前回推定したAIサーバーIT負荷約13GWをベースに、GPU/AIアクセラレーターの電力シェアで見ると、H100/H800/H100 NVLが約36%、H200/H20系が約18%、GB200/B200などBlackwell系が約20%と見ます。

注意点は、これは「台数シェア」ではなく「電力シェア」です。GB200/B200は1個あたりの電力が大きいため、台数シェアより電力シェアが大きく見えます。またGoogle TPUやAWS TrainiumはGPUではありませんが、AI計算資源としては重要なので別枠で含めています。


2026年6月末の計算能力ベースライン

今後比較する基準値としては、以下で置くのが使いやすいです。すべて 稼働済み分のみ、かつ denseピーク性能 です。

※「denseピーク性能(Dense Peak Performance)」とは、主にAIやスーパーコンピュータの分野で使われる用語で、「AIプロセッサ(GPUなど)が、すべての計算回路をフル稼働させた状態で発揮できる理論上の最高処理速度」を意味します

指標中心推定レンジ
AIサーバーIT負荷13GW12〜15GW
FP16 / BF16ピーク約10 ZFLOPS8.5〜12 ZFLOPS
FP8ピーク約19 ZFLOPS16〜23 ZFLOPS
NVFP4 / FP4ピーク約13 ZFLOPS10〜16 ZFLOPS
H100 SXM相当約1,000万個相当850万〜1,200万個相当



本文
2026年6月末時点のAI計算資源を、今後比較するための基準値にすると、FP16/BF16のdenseピークで約10ZFLOPS、FP8で約19ZFLOPSと推定できます。これはH100換算で約1,000万個相当の計算能力です。

ただし、NVFP4/FP4は主にGB200/B200などBlackwell系で使える低精度性能なので、全GPU共通の性能ではありません。2026年6月末ではBlackwell系の導入が進み始めている段階のため、FP4系ピークは約13ZFLOPSにとどまると見ます。

今後の比較では、
2026年6月末 = 100
として、2027年以降のFP16/BF16、FP8、FP4性能が何倍になるかを見るのが分かりやすいです。


2027年6月末に運用されてると推定されるGPU

2027年6月末は、GPU構成の主役が H100/H200系からGB200/GB300系へ移るタイミング と見ます。
前提は、前回推定の AIサーバーIT負荷 約21GW、施設総負荷 約27GW です。

種別推定比率
GB200 / B200 / GB300 / B30042%
H100 / H800 / H100 NVL19%
H200 / H20 / H200 NVL12%
Google TPU系8%
AWS Trainium / Inferentia5%
AMD MI300 / MI350系4%
A100 / A800 / V100残存3%
Huawei Ascend / 中国AI ASIC3%
Vera Rubin系 初期導入2%
その他2%


2027年6月末の計算能力ベースライン

電力は2026年6月末比で約1.6倍ですが、Blackwell系の比率上昇で、特にFP4系の計算能力は約5倍まで跳ねる見方です。

指標2027年6月末2026年6月末=100
FP16 / BF16 dense約26 ZFLOPS約260
FP8 dense約54 ZFLOPS約280
NVFP4 / FP4 dense約70 ZFLOPS約540
H100 SXM相当約2,600万個相当約260



2028年6月末に運用されてると推定されるGPU

2028年6月末は、AI計算資源の主役が Blackwell系中心からRubin系併存へ移り始める段階 と見ます。
前提は、前回推定の AIサーバーIT負荷 約32GW、施設総負荷 約41GWです。

種別推定比率
GB200 / B200 / GB300 / B30036%
Vera Rubin / Rubin CPX系20%
H100 / H800 / H100 NVL8%
H200 / H20 / H200 NVL6%
Google TPU系9%
AWS Trainium / Inferentia7%
AMD MI300 / MI350 / MI400初期5%
Huawei Ascend / 中国AI ASIC4%
A100 / A800 / V100残存2%
その他3%


2028年6月末の計算能力ベースライン

NVIDIA系全体では約72%。ただし内訳は、Hopper中心ではなく Blackwell + Rubinで56% まで進む見方です。

電力は2026年6月末比で約2.5倍ですが、Rubin/Blackwell比率の上昇により、FP4系の理論ピークは約17倍まで伸びる推定です。

指標2028年6月末2026年6月末=100
FP16 / BF16 dense約58 ZFLOPS約580
FP8 dense約130 ZFLOPS約680
NVFP4 / FP4 dense約220 ZFLOPS約1,690
H100 SXM相当約5,800万個相当約580



2029年6月末に運用されてると推定されるGPU

2029年6月末は、AI計算資源の中心が Rubin / Rubin Ultra系 に移り、Blackwell系が大きく残る構成と見ます。
前提は、前回推定の AIサーバーIT負荷 約45GW、施設総負荷 約58GWです。
NVIDIA系全体では約72%。ただし中身は、Hopper/Blackwell中心ではなく Rubin以降が主役 になります

種別推定比率
Vera Rubin / Rubin Ultra系34%
GB200 / B200 / GB300 / B30025%
Feynman系 初期導入5%
H100 / H800 / H100 NVL4%
H200 / H20 / H200 NVL3%
Google TPU系9%
AWS Trainium / Inferentia7%
AMD MI350 / MI400 / MI500初期6%
Huawei Ascend / 中国AI ASIC4%
A100残存 / その他ASIC3%



2029年6月末の計算能力ベースライン

電力は2026年6月末比で約3.5倍ですが、Rubin/Rubin UltraとFeynman初期導入により、FP4系の理論ピークは約46倍まで伸びる推定です。
指標2029年6月末2026年6月末=100
FP16 / BF16 dense約115 ZFLOPS約1,150
FP8 dense約270 ZFLOPS約1,420
NVFP4 / FP4 dense約600 ZFLOPS約4,620
H100 SXM相当約1.1億個相当約1,150



今後使用するトークン数を推定する



2026年6月に使用した総トークン数を推定する

結論として、2026年6月の1か月に世界で処理された生成AI推論トークンは、中心推定で約5P tokens/月と置くのがよさそうです。
これは 約5,000兆トークン/月です。レンジは広めに 3〜8P tokens/月。ここでは学習用のtoken-passではなく、推論サービスでモデルが処理した入力・出力・内部推論・RAG・長文コンテキストを含めています。

推定式は次のように置きました。

200億 model calls/day × 8,000 processed tokens/call × 30日 = 4.8P tokens/月

内訳イメージは、消費者向けチャット・AI検索が約2.0P、API・業務・コード生成が約1.5P、Agent/RAG/長文処理が約1.0P、翻訳・要約・バッチ処理が約0.5Pです。

この数字は、前回までの 2026年6月末のAI向けIT負荷 約13GWとも整合します。推論に使われる平均電力を3〜5GW程度、処理トークンあたりの電力量をおおむね0.5〜1.3mWh/tokenと置くと、月間3〜8P tokens程度に収まります


指標2026年6月の推定
世界の推論処理トークン約5P tokens/月
レンジ3〜8P tokens/月
日本語表記約5,000兆トークン/月
ユーザーに見える入出力だけ約1P tokens/月
学習・合成データのtoken-pass別枠、約1〜3P token-pass/月程度


2027年6月に使用する総トークン数を推定する

2027年6月1日〜6月30日の1か月では、世界の生成AI推論トークン消費は中心推定で約18P tokens/月と置きます。
前回の2026年6月推定 5P tokens/月 に対して、約3.6倍です。

推定式はこう置きます。

500億 model calls/day × 12,000 processed tokens/call × 30日 = 18P tokens/月

内訳イメージは、消費者向けチャット・AI検索が約6.0P、API・業務・コード生成が約5.0P、Agent/RAG/長文処理が約5.0P、翻訳・要約・バッチ処理が約2.0Pです。

電力側からも検算すると、2027年6月末のAI向けIT負荷を約21GW、そのうち推論平均を7〜10GW程度と置いた場合、月間電力量は約5.0〜7.2TWh。これを18P tokensで割ると、0.28〜0.40mWh/tokenとなり、2026年より効率改善しつつ処理量が大きく伸びる前提と整合します

指標2027年6月の推定
推論処理トークン約18P tokens/月
日本語表記約1.8京トークン/月
レンジ11〜30P tokens/月
2026年6月比約3.6倍
見える入出力だけ約3.5P tokens/月



2027年6月に使用する総トークン数を推定する
この記事をシェアする
 

0 件のコメント :

コメントを投稿