概要
本稿のテーマは、Open Compute Project(OCP)のOpen Rack Version 3(ORV3)に準拠するバッテリ・バックアップ・ユニット(BBU:Battery Backup Unit)です。その種のBBUに求められるシステム・レベルの要件について説明することにします。まずは、停電が発生した際にも電力を供給可能な効率的かつインテリジェントなBBUを用意することの意義について解説します。その上で、ORV3の仕様を満たすよう開発されたリファレンス設計を紹介します。特に、そのリファレンス設計に盛り込まれたアナログ/デジタル・ソリューション、電気/機械ソリューション、アーキテクチャについて詳しく解説します。
はじめに
インターネットは、データ・センターに支えられながら世界中のコミュニティをつなぐ役割を果たしています。FacebookやInstagramを運営するMeta PlatformsやX(旧Twitter)を運営するXなどのソーシャル・メディア企業は、データ・センターを基盤として情報の配信/保存を行っています。また、Yahoo!やGoogleなどは、データ・センターを利用して主要な検索エンジンやストレージの機能を運用しています。それだけでなく、世界中のほぼすべての大企業や政府機関も、信頼性の高いデータ・センターの機能を必要としています。なぜなら、主要なビジネス機能を運用/維持するためには、インテリジェントなコンピューティング、ストレージ、検索機能を活用することが必須だからです。ユーザの数が年々増えているなか、需要の増加と技術の進化に対応するために、データ・センターの容量はとてつもない速度で増加し続けています。そのような状況に対応するためには、データ・センターのシステム・アーキテクチャも進化させていく必要があります。
OCPは、データ・センターの設計のオープン化を推し進めているコミュニティです。同コミュニティは、Open Rack Version 2(ORV2)規格の基盤となるシステム・アーキテクチャを定義しました。その中では、バックプレーンの公称電圧は12V、システムの電力は3kWと定められています。しかし、データ・センターの利用が拡大するにつれて電力に対するニーズはより高まっています。12Vのシステムに対する電力の要件が過剰に厳しくなった結果、全体的なシステム性能に悪影響が生じるようになりました。この問題に対処するために、システムの電力はそのままで、バックプレーンの電圧を48Vに引き上げるという動きが生じました。そうすれば、必要な電流量と銅製の配線パターンの量を最小限に抑えて、バックプレーンにおける放熱量を低減することができるからです。このような変更を行えば、全体的なシステム効率が向上し、複雑な冷却システムの必要性が低下します。そうした基本的なコンセプトに基づいて策定されたのがOCPのORV3規格です。
データ・センターを運用する上では、基本的かつ必須の要件として高い信頼性が求められます。BBUを追加すれば、システムに冗長性を持たせることができます。電源電圧が低下したり、停電が生じたりした場合には、次のような対処を図る必要があります。まずは、システムが電源電圧に問題があるという状況を認識し、重要なデータを保存する必要があります。その上で、別の施設や別の場所に存在するであろう別のデータ・センターのサーバに運用を切り替えなければなりません。これらの処理はシームレスに行われる必要があります。ただ、完了に至るまでには間違いなくある程度の時間が必要になります。各ラックにバックアップ用の電源システムを適用すれば、システムを維持するための電力をレギュレートできます。最新の規格であるORV3は、この用途で使われるBBUの仕様を定めたものです。ORV3に対応したBBUでは、リチウム・イオン・バッテリによる電力の蓄積とコンディショニングをベースとして機能します。1台のBBUにつき、システムを4分間にわたって稼働させられる15kWの電力を供給できます。ORV3にはこのような要件が定義されています。
アナログ・デバイセズはこの仕様に基づいて、BBUのリファレンス設計を開発しました。このソリューションは、いくつかの要素を組み合わせることで構成されています。1つは、充電動作/放電動作に特化した単一の回路用の双方向パワー・コンバータです。また、バッテリ管理(バッテリ・マネージメント)システム(BMS:Battery Management System)デバイスも重要な要素です。加えて、システムのホストとして機能し、ファームウェアとGUI(Graphical User Interface)の実行をサポートするマイクロコントローラも備えています。更に、OCPと協力して開発したハードウェア増幅器も搭載しています。
設計上の要件、ハードウェアの実装
OCPは、Revision 1.3の仕様を提供すると共に、BBUモジュール用の規格に準拠するための構想や設計に必要な要件の概要を示す予定です。アナログ・デバイセズのBBUモジュールのリファレンス設計は、ORV3が提案する48Vの電圧に基づき、図2のようにして実現されています。主な構成要素は、BMSを備えるバッテリ・パック、チャージャ/ディスチャージャ回路、その他の機能ブロックなどです。
当然のことながら、BBUモジュールの回路についてはいくつもの要件が存在します。それに加えて、その使用期間中に必要になるいくつかの動作モードを用意する必要があります。具体的には、以下のような機能を実装しなければなりません。
- スリーブ・モード:BBU モジュールを長時間にわたって保管する際にセルの放電電流を最小限に抑えるためのモードです。BBU モジュールの輸送時または保管時、あるいは稼働中のバスバーに接続されていないときに使用します。このモードでは、BBU のモニタリングやレポートは行われません。BBU は、バスバーの電圧が 46V を上回る状態が 100 ミリ秒~ 200 ミリ秒続いたことが検出され、PSKILL 信号がローである場合にスリープ・モードを終了させて起動します。
- スタンバイ・モード:BBU モジュールが満充電されて健全な状態にある場合に、放電の事象に備えてバスバーの電圧を常時モニタリングするモードです。BBU モジュールは、使用期間中の大半、このモードで動作することになります。BBU モジュールのステータスとパラメータは、通信バスを介して上流のラック・モニタで確認できます。
- 放電モード:バスバーの電圧が 2 ミリ秒以上にわたって48.5V を下回ると、BBU モジュールは放電モードに移行します。その際、BBU モジュールは 2 ミリ秒以内にバスバーの電圧の供給を引き継ぎます。その後、4分間にわたってバックアップを行うことが求められます。
- 充電モード:すべての条件が満たされている場合に、BBU モジュールが内部充電回路を有効にし、バッテリ・パックを充電するモードです。放電によってバッテリの容量がどれだけ残っているのかに応じ、充電電流は 0A ~ 5.5A の値に設定されます。通信バスを介し、上流のシステムによって充電電流をオーバーライドすることも可能です。算出された充電電流に基づいて、チャージャのタイムアウト制御を行うための機構も必要になります。
- SOH チェック・モード:BBU モジュールによってバッテリ・パックを強制的に放電することで、バッテリ・パックの容量を定期的にテストするためのモードです。BBU モジュールは、バッテリの EOL(End of Life)の状態を判定するために、SOH(State of Health)のテストを 90 日おきに実行します。
- システム制御モード:BBU は、上流のシステムが通信バスを介してチャージャ/ディスチャージャの動作を制御できるようにする必要があります。
OCPの規格が定めているのは、BBUモジュールの動作に関する要件だけではありません。バッテリ・パックの容量や、バッテリ・セルの種類、バッテリ・パックの構成について、以下のように規定しています。
- バッテリ・パックの容量:BBU モジュールは、4 年間にわたり、3kW のバックアップ電力を最大 4 分間供給できるものでなければなりません。
- バッテリ・セルの種類:BBU モジュールでは、18650 型のリチウム・イオン・バッテリを使用します。そのセル電圧は 3.5V~ 4.2V、最小バッテリ容量は 1.5Ah、連続定格放電電流は30A と定められています。
- バッテリ・パックの構成:BBU モジュールでは、11S6P(直列に接続した 11 個のセルを 6 並列に接続)のバッテリ・パック構成を使用します。
また、BBUモジュールにはBMSを用意する必要があります。BMSの役割は、バッテリの充放電のアルゴリズム、保護機能、制御信号、通信用インターフェースを提供することです。BMSには、バッテリ・パックのセルの電圧を±1%(0.1V)以内に維持するためのセル・バランシング回路も必要です。
アナログ・デバイセズが開発したリファレンス設計では、図3のブロック図に示した各種のコンポーネントを採用しました。特定のタスクを担う様々な要素を統合することにより、電源電圧の問題が生じた場合にも確実に電力を供給し、モジュールの状態を確認し、障害を検出し、モジュールによる通信を行えるように回路を構成しています。まず、このBBUモジュールでは双方向/同期整流方式の昇降圧コントローラ「LT8228」を採用しています。同ICは、ライン電力の供給が中断した場合には電力変換を行います。また、障害が発生していないときにはバッテリ・チャージャとして機能します。同ICと連携動作するものとして、4相/同期整流方式の昇圧DC/DC位相エクスパンダ「LT8551」も採用しました。これにより、放電電力の容量を1個のBBUモジュールあたり3kWに増やします。電力変換IC以外では、Arm®ベースで超低消費電力のマイクロコントローラ「MAX32690」を使用しています。このICがシステムの全般的な動作を司ります。2チャンネルのパワー・システム・マネージャ「LTC2971」は、電力パスの高精度のセンシングと障害の検出の機能を担います。それに加えて、電圧ドループという重要な機能を実現します。高精度のファン・スピード・コントローラ「MAX31760」は、充電/放電動作を行う際、システムを冷却するために使用します。同ICが内蔵するEEPROMはデータ・ストレージとして機能します。それにより、ユーザはBBUモジュールを動作させている期間中に、使用可能な任意のデータを復元することができます。パワー・コンバータとハウスキーピング機能を実行するマイクロコントローラに加えて、BMS ICも実装しています。16チャンネルを備えるマルチセル・バッテリ・モニタ「ADBMS6948」は、バッテリの電圧レベルをモニタリングするために使用します。同ICが内蔵するクーロン・カウンタは、セル・バランシングや、バッテリの寿命の計算に使用する充電状態(SOC:State of Charge)とSOHのレベルの判定に利用されます。バッテリの状態をモニタリングする処理を実行するのは、Armベースで超低消費電力のマイクロコントローラ「MAX32625」です。2つのマイクロコントローラは、トータルの消費電力を抑えることにより、BBUがスリープ・モードで動作する際のバッテリの寿命を引き延ばせるよう慎重に選択しました。
このリファレンス設計で提供されるのは、このアプリケーションに最適なICだけではありません。図4(a)に示したBBUモジュールや、図5に示したBBUシェルフの製造/構築も支援しています。これらのモジュール/シェルフは、OCPのORV3で定められた機械的仕様に準拠する形で回路を収容/実装できるようになっています。BBUシェルフには、BBUモジュール用のスロットが6つ用意されています。つまり、1つのBBUシェルフにより、必要に応じて最大18kWのバックアップ電力を供給することが可能です。
BBUモジュールのリファレンス設計では、図4(a)、(b)に示したような機械的な構造のレンダリング結果や気流シミュレーションの結果が得られます。これらは、このリファレンス設計が提供するメリットの1つです。このように視覚化を行うことで、リファレンス設計の実体を正確かつ訴求力を伴う形で表現することができます。機械構造の解析は、設計上の問題や潜在的な変化の早期発見に役立ちます。このことは、設計プロセス全体に対してメリットをもたらします。時間とコストをかけて実際にプロトタイプを構築する必要性が低下することも魅力の1つです。加えて、気流シミュレーションは、性能の解析や潜在的な問題の検出に利用できます。このことは、設計効率の向上につながります。熱管理の検証も可能であり、ホットスポットの検出、熱損失の最適化、システムの全体的な信頼性の向上に役立ちます。更に、安全性と仕様への準拠度を考慮しながらバッテリ・パックの空間について計画を策定すれば、リスクを低減することが可能になります。
リファレンス設計の評価結果
ここからは、BBUモジュールのリファレンス設計によってどのような性能が得られるのかを明らかにしていきます。具体的には、定常動作における各種の測定結果、機能的な性能を表す各種信号波形、温度性能、遷移動作の様子などを示すことにします。それぞれの評価は、表1に示す基本的な条件の下で行いました。
放電モード(昇圧動作) | 充電モード(降圧動作) |
入力電圧:30V~44V | 入力電圧:49V~53V |
出力電圧:47.5V~48V | 出力電圧:48V |
出力負荷:0A~63.2A | 出力負荷:0A~5A |
スイッチング周波数:150kHz | スイッチング周波数:400kHz |
効率と電力損失
ORV3では、BBUが満たすべき効率と電力損失の値を仕様として定めています。アナログ・デバイセズがリファレンス設計として開発したBBUモジュールは、それらの仕様を上回る性能を備えています。ORV3では、放電効率、充電効率の下限値をそれぞれ97%、95%と定めています。それに対し、BBUモジュールを放電モードで使用した場合の平均効率(実測値)は、半負荷時(31.6A)で98.5%、全負荷時(63.2A)で98%でした(図6)。非常に大きなインダクタ、ドレイン‐ソース間のオン抵抗が小さいMOSFET、慎重に選択したスイッチング周波数の効果により、高い効率が得られています。また、リップル電流も小さく抑えられました。一方、このBBUモジュールの充電モードでは、5Aの負荷電流の場合で97%という高い平均効率が得られます。同じ値のインダクタを使用して400kHzのスイッチング周波数で動作させると、効率は高くなり、電力損失は最小限に抑えられます。高い効率、少ない電力損失を実現できれば、バッテリの寿命を延ばすことが可能になります。また、放熱のために必要なファンの速度を下げることができます。
なお、BBUの放電モード/充電モードにおける全体的な電力損失には、MOSFETの制御と同期に依存する導通損失の影響も及びます。
出力の電圧ドループ
ORV3に対応するBBUの仕様では、放電モードにおける電圧ドループの値を定めています。同仕様では、システムが負荷を駆動する際、BBUのバックプレーン電圧を意図的に低下させることになっています。それがここで言う電圧ドループです。BBUのバックプレーン電圧は、LTC2971が内蔵するD/Aコンバータを使用して測定したシステムの負荷電流に応じ、リアルタイムに変更されます。その結果、無負荷時から全負荷時までの電圧ドループは、ORV3の仕様で定められている±1%未満の範囲内に収まります。その実測結果を図7に示しました。
スイッチング波形
スイッチング波形の確認は、性能の評価や障害に関する解析に役立ちます。また、効率を最適化したり、EMI(電磁干渉)を低減したり、安全性について考察したりするための貴重な情報を得ることができます。それらの情報を基にすることで、問題の特定と解決、システム性能の最適化、データ・センターにおけるBBUモジュールの確実で効率的な動作を確保することが可能になります。
BBUモジュールの放電モードでは、30V~44Vのバッテリ・パックの電圧を48Vのバックプレーンの電圧に変換します。その際にはスイッチング動作が重要になります。その動作は、同期動作を行うパワーMOSFETを使用することによって実現されます。そのMOSFETは、LT8228のPWM(Pulse Width Modulation)信号と、同ICの動作をリピートするLT8551によって正確にレギュレートされます。この動作において重要なのは、スイッチング周波数と、電圧の上昇につながる各相の電流シェアリングです。ここで図8をご覧ください。これは、メインのコンバータとそれに対応する多相エクスパンダのスイッチング波形(全負荷時)です。この双方向コンバータは充電モードにおいて単相で動作し、49V~53Vのバックプレーンの電圧を、バッテリ・パックを充電するための44Vまで降圧します。この降圧処理は、同期動作するパワーMOSFETを高速にスイッチングし、インダクタの電流を増大させることによって実現します。図9に示したのは、負荷が5Aの場合の双方向コンバータのスイッチング波形です。
熱性能
熱性能と効率については、慎重にバランスをとる必要があります。BBUモジュールは、高温に耐えて過熱することなく動作を継続できるように設計しなければなりません。ただ、最適な効率で動作してできるだけ多くの入力電力を出力電力に変換できるようにすることも重要です。ここで図10をご覧ください。これは、BBUモジュールを放電モード、全負荷の条件で約4分間にわたり動作させた場合の熱画像です。これを見ると、同モジュールのボードの測定温度は高くても40°C~60°C程度に抑えられていることがわかります。また、充電モードにおいて同期動作するMOSFETの温度は50°C未満です。空冷システムを適切に構成すれば、コンポーネントの温度を低く抑えて熱暴走を防ぐことができます。バッテリ・スタックに含まれるセル間のギャップと気流が適切になるように設計すれば、十分な熱性能が得られます(図11)。
遷移動作
最後に、BBUモジュールの遷移動作について確認しておきます。電力の状態が変動したり供給が中断したりした際には、BBUモジュールの遷移動作が重要になります。電源に問題が生じたら、バッテリ・パックのエネルギーをデータ・センターのバックプレーンに完全に伝送し、重要なシステム/デバイスの機能を4分間確実に維持しなければなりません。BBUモジュールは、バックプレーンのバスバーの電圧を常時監視します。バスバーの電圧がBBUモジュールの動作レベルである48.5Vを2ミリ秒継続して下回った場合には、2ミリ秒以内にバックプレーンの電圧を引き上げて、バスバーに十分な電力を供給する必要があります。バスバーの電圧は、遷移動作の間、決して46Vを下回ってはなりません。バスバーの電圧が200ミリ秒以上継続して48.5V以上であることが検出されたら、BBUモジュールは放電モードを終了します(図12)。
まとめ
データ・センターでは、エネルギーを節約するために48Vを使用するシステムに移行しつつあります。48Vを使用するサーバ・ラックでは、12Vを使用するサーバ・ラックよりも電流量を少なく抑えられます。また、銅配線による損失を減らし、電力バスバーのサイズを抑えることも可能になります。このような理由から、48Vを使用するシステムは、電力、放熱、サイズ、コストの面で効率的だと言えます。また、データ・センターのサーバで使用されるマイクロプロセッサとメモリに対しては、次のような方法が最も適しています。すなわち、フロントエンドのレギュレートされていない高効率の段の後に、負荷に対して適切にチューニングされた電圧レギュレータを配置することです。このようなレベルの考察や、OCPによる最新のイノベーションは重要な意味を持ちます。それらは、より効率的な配電やスマートなBBUを実現し、連続的かつ完全な動作をサポートする上での基盤になるからです。
BBUのモジュールとシェルフは、適切なデバイスを選択して適切に実装しなければなりません。それらは、全体的な設計の簡素化、バッテリの寿命の延長、設計/開発にかかる時間の短縮、設計/製造コストの最小化につながります。また、機械的なシミュレーションを実行すれば、プロトタイプの開発工程を短縮することができます。それだけでなく、熱管理の改善に利用できるデータを取得し、設計の確実性を高めることが可能になります。更に、円滑かつ確実なBBUの動作を保証するには、巧妙に設計された適切なファームウェアのアルゴリズムとシーケンスを採用しなければなりません。
次回(Part 2)は、様々なBBUモジュールで使用される主要なマイクロコントローラの機能と動作について説明します。BBUのハウスキーピング用の設計を行う際には、それらが重要になります。また、適切なワークフローのルーチンを構築して実行するためには、有益な情報をどのようにモニタリングして使用するかが重要になります。これについても詳しく説明します。