Signals+ ニュースレター登録
Signals+はコネクティビティ、デジタルヘルス、モビリティ、スマートインダストリーに関する最新情報をお届けします。
ありがとうございます。ご登録のメールアドレスにお送りしたメールを確認し、ニュースレター登録を完了させてください。
世界中の人々の生活に影響を与える、画期的なテクノロジーに関する最新情報をタイムリーにお届けします。
閉じるハイパースケール・データセンターの未来を支えるのは「800V」の電源電圧
主なポイント
|
ハイパースケールのAIが広く使われるようになったことから、それに関連する処理負荷が急激に増大しています。それに伴い、データセンターの設計に関する原則が変化しつつあります。データセンターを運営する事業者は、各サーバ・ラックに、より多くのGPUを実装すべく尽力しています。その成果として演算密度は急激に増大しました。それに伴い、ラックが消費する電力の量も急増しました。2年ほど前、120kWであったラックの消費電力は、間もなく600kWに達する見込みです。2020年代の終わりには、最先端のラックの消費電力は1MWに達すると予想されています1。
電力需要がそのようなレベルに達すると、48Vの電源電圧を使用する従来のアーキテクチャは物理的な限界を迎えることになります。例えば、システムで使用するケーブルがかさばって非常に扱いにくい状態になります。また、電流量の急増によって効率が低下することになるでしょう。それに対し、800Vの電源電圧を使用するアーキテクチャへ移行すれば、電流量を低減し、損失を最小限に抑えることができます。それだけでなく、サイドカーの電源ユニットを使用することも可能になるでしょう。それにより、メインのラック内のスペースを解放し、コンピューティング・トレイを追加できるようになります。48Vから800Vへの移行は、大規模かつ先進的なAIのトレーニングや推論を提供するハイパースケーラ(事業者)にとって不可欠なことです。つまり、この移行を果たすことにより、膨大なデータセットを使用してAIのトレーニングを実施し、モデルを構築することが可能になります。また、それらのモデルを使用した推論により、リアルタイムのインサイト(洞察)と出力を提供できるようになります。
引き続き重要な役割を果たす「48V」
上述したような理由から、膨大な電力を消費するAIラック向けのものとして、±400V/800Vのアーキテクチャが登場しました。その一方で、48Vの配電用バックプレーンも、今後5年以上にわたって非常に重要なものであり続けるでしょう。その理由としては、大規模かつ成熟したエコシステムが構築されている、安全性に関するプロファイルを管理しやすい、レトロフィットの互換性が得られる、数多くのサーバやアクセラレータの電力に関する要件にマッチしているといったことが挙げられます。
48Vに対応する製品については、既に標準化が実現されています。そして、多くの製品が認証を受けています。実際、OCP ORv3(Open Rack V3)に準拠するハイパースケーラ向けのカスタム・ラックをはじめ、48Vに対応する数多くの製品が出荷されています。48Vに関連するエコシステムは大規模なものであり、既に成熟しています。特に大規模な展開を図りたいハイパースケーラは、実証済みの信頼性とサプライ・チェーンのレジリエンスを重視します。
アナログ・デバイセズは、800Vを必要とするハイパースケール・データセンター向けの製品を提供していきます。同時に、優れた費用対効果と実績を重視して48Vのインフラを使用したいと考えているお客様に対しても最適な製品を提供し続けます。
AIの未来を支えるのは「800V」
800Vへの移行は、単なる段階的なアップグレードではありません。そうではなく、データセンターの電力に関するエコシステムを根本的に再設計することになります。より高い電源電圧を使用すれば、同じ量の電力を供給する際に必要な電流量を大幅に削減できます。48Vから800Vへの移行は一見、単純な変更に感じられるかもしれません。しかし、実際には非常に重要な戦略的な意味を持ちます。
スケーラビリティの解放
800Vのアーキテクチャにより、ラック当たり数MWの電力を供給できるようになります。それにより、現在、演算密度を制限している物理的な障壁がなくなります。その結果、ラック当たりのGPUの数を増やし、インターコネクトを高速化し、より強力なAIのクラスタを構成できるようになります。
効率の向上
800V DCという高い電圧によって電力を分配するということは、必要な電力を供給するための電流量を低減できるということを意味します。それにより、給電用の導体の抵抗成分によって生じる損失を大幅に削減できます。そのため、ケーブル配線の簡素化、電力密度の向上、配電に伴う熱負荷の低減を図れます。また、800Vの電源電圧、削減された電力変換段、DCネイティブなアーキテクチャの組み合わせにより、大電力を消費するAI対応のデータセンターにおいて、インフラで生じる損失、材料の使用量、総所有コストを削減することが可能になります。
アーキテクチャの革新
800Vのモデルは、分散型の電力アーキテクチャをサポートします。このモデルでは、電力分配ユニットやバッテリ・バックアップ・ユニットといったかさばるコンポーネントを、IT向けのメインのラックからサイドカーへ移設することが可能になります。それにより、同ラック内の貴重なスペースが解放され、コンピューティング・トレイを追加できるようになります。
単なる給電を超えて - データセンターのインテリジェント化を図る
800Vの電源電圧を採用すれば、より多くの電力の供給とラックの密度の増大に対応できます。つまり、800Vへの移行はその必要性によって牽引されています。実用的な観点から見れば、システムの規模が拡大するにつれて、より高い電源電圧を使用するアーキテクチャの採用は必須になります。それと同時に、保護用の機能と電力パスの管理機能に対するニーズも高まっています。800Vという高い電圧を使用する環境では、ホット・スワップ・コントローラが重要な要素になります。同コントローラはシステムの最初の防衛線(保護機構)として機能します。それだけでなく、ラック全体にわたってより戦略的な役割を担うことになります。
800Vを使用するシステムを対象として、新たなホット・スワップ・コントローラが提供されるようになりました。それらの製品は、高度な保護機能やデータ・アクイジション機能を備えるデバイスとして設計されています。そうした製品を採用すれば、テレメトリによって電圧、電流、電力、温度に関するデータをリアルタイムに取得できます。それらのデータは単に運用に利用するためのものではありません。そうではなく、より的確な意思決定を行うために活用されます。つまり、システム・レベルの実用的なインサイトが得られるようになります。それらのインサイトは、以下のような用途に役立ちます。
- 故障の予測と防止:消費電力のデータの履歴を分析することで、システムに壊滅的な問題が生じる前にコンポーネントの故障を特定することができます。それにより、事後対応型の保守のモデルから事前対応型の保守のモデルに移行することが可能になります。
- キャパシティ・プランニングの最適化:負荷のプロファイリングをリアルタイムに実施することで、エネルギー需要を正確に把握することができます。それにより、ラック・レベルのよりスマートなキャパシティ・プランニングが可能になり、オーバー・プロビジョニングを防止できます。テレメトリによって、単なる運用向けのデータを取得するだけではなく、システム・レベルの実用的なインサイトが得られるようになることから、より的確な意思決定を行うことが可能になります。
- エネルギー需要の予測精度の向上:テレメトリによって取得した精度の高いデータを、エネルギー需要の予測に使用する高度なモデルに供給できるようになります。このことは、コストの管理に役立ちます。例えば、調達に関する戦略を策定したり、より有利な契約を結ぶための交渉に使用したりすることが可能です。
高電圧を使用するデータセンターには、継続的に稼働することが求められます。つまり、電力に依存する処理システムを絶え間なく運用しなければなりません。そのためには、電力密度の管理機能(高電圧の制御と保護)、信頼性を支えるテレメトリ/診断の機能、高度な電力監視機能(予知保全のためのシステム診断)などが必要です。
ホット・スワップ技術は高電圧を使用するシステムを支える“隠れたヒーロー”
使用する電源電圧が高くなるにつれてリスクも増大します。ホット・スワップ技術は、データセンターの信頼性を確保するために長年にわたって重要な役割を果たしてきました。この技術は、800Vの環境においても、以下に挙げる要件を満たすために不可欠なものになります。
- 大規模な環境における安全性:800Vを使用する場合、通電したままの状態でトレイを抜き挿しすると、アーク放電や重大な障害が生じる可能性があります。ホット・スワップ・コントローラによって突入電流を管理し、障害から隔離すれば、そうした危険性を軽減できます。
- 稼働時間の確保:ハイパースケールのラックを使用する場合、数百万米ドル(数億円)ものコストがかかることになるでしょう。そのため、システムのダウンタイムが生じると、収益の面で大きな損失を被る可能性があります。ホット・スワップ技術を適用すれば、システムを遮断することなくメンテナンスを実施できることが保証されます。
- インテリジェントな制御:次世代のホット・スワップ・コントローラには、テレメトリ機能が統合されます。それらの機能を利用すれば、リアルタイムの監視や予測に向けた診断が可能になります。
アナログ・デバイセズは、高電圧に対応する革新的なホット・スワップ製品を提供しています。それらの製品はシステムに容易に統合できます。そして、それらは信頼性の向上に貢献するモジュールとして機能します。個々のソリューションは、高電圧に対応して突入電流を効果的に制限する次世代のホット・スワップ・コントローラ機能と堅牢性の高い保護機能を組み合わせることで実現されています。また、システムの診断を実施するための包括的なテレメトリ機能や高度なセンシング機能も備えています。そうした様々な機能を利用することで、極めて過酷な環境下でも安全かつ効率的な給電を実現できます。重要なのは、システム・レベルの観点を持って、ラック用の電源の開発に取り組むことです。それにより、開発者は、クラウド・サーバのプロバイダやシステム・インテグレータが新たなインサイトを取得してコストを削減できるよう支援することが可能になります。
テレメトリの機能と予測用のインテリジェンス
将来のハイパースケールな電源システムは、単にスイッチング処理を行うだけのものではありません。そうではなく、インサイトも提供するシステムに進化します。例えば、ホット・スワップ用のモジュールに組み込まれたテレメトリ機能により、以下のようなことが実現されます。
- 故障の予測:何らかの問題によってシステムの稼働が中断される前に異常を検知します。
- キャパシティ・プランニング:ラックの利用とエネルギーの分配についての最適化を実施します。
- エネルギー需要の予測:持続可能性と費用対効果を高めます。
これらの機能により、給電用のシステムは、受動的な要素から、稼働時間と性能に対して能動的に貢献する要素へと変革されます。その中核を成すのは、高度な監視機能や保護機能を組み合わせたホット・スワップ技術です。アナログ・デバイセズはこのイノベーションを推進し、データセンターの信頼性、拡張性、将来への対応力を確保できるようにするために尽力しています。
今後の展望
ハイパースケール・データセンターにおける800Vへの移行については、「実施すべきか否か」を議論する段階は過ぎました。問題は「いつ実施するのか」です。データセンターのインフラに関する選択は、将来のイノベーションを推進する能力を左右することになります。この移行を牽引する事業者は、決定的な優位性を獲得することになります。つまり、AIに関する取り組みを、競合他社よりも迅速かつ効率的に展開することが可能になります。
とはいえ、多くの事業者は、多くのアプリケーションの基盤として48Vの電源電圧を使い続けることになるでしょう。重要なのは、48Vのアーキテクチャと800Vのアーキテクチャの両方をサポートし、インテリジェンス、安全性、モジュール性を給電用のシステムに組み込むことです。そのことが、データセンターにおけるニーズの変化に対応し、私たちの未来を切り開く上での鍵になります。
参考資料
1 Sean Graham「Data Center Vision: How Datacenter Infrastructure will evolve to Support AI and Accelerated Compute(データセンターについての展望 - データセンターのインフラはAIと高速コンピューティングをサポートするためにどう進化するのか?)」IDC Research Inc.、2025年3月