技術記事
AI プロセッサ・クラスターへ電力を供給
垂直給電により、最大100kA、複数のコア電圧の給電が可能に
By Paul Yeaman, Senior Director, Applications Engineering
近年、AIプロセッサ ASIC・クラスターで構成されたスーパーコンピュータが出現したことにより、電力供給ネットワークには、数年前には想像もできなかった高い性能が求められています。ASIC クラスターが消費する電流は100キロアンペアに迫り、この大電流を供給するためには、電源システムのアーキテクチャ、トポロジ、制御システム、パッケージングのすべての技術革新が必要です。急増する消費電力に対応するには48V給電が必須です。さらに、クラスターではプロセッサが密集して水平方向の給電が難しいため、新たな給電アプローチが必要です。
1V未満の電圧を48Vから直接負荷に給電するVicorの Factorized Power Architecture (FPA™) は、中間バスコンバータとマルチフェーズ PoLレギュレータで構成する一般的な48V中間バスアーキテクチャ (IBA) とは大きく異なります。革新的なソリューションであるFPAを使うことで、プロセッサ・クラスターへ給電するときの課題に対処することができ、大電流を供給するシステムに必要な垂直給電(VPD)が実現します。
クラスターへ電力供給するときの課題
例えば自動運転のためのAIをトレーニングするには、テラフロップス級の処理能力が必要であり、広い帯域幅を確保するための高密度のASICクラスターが必要です。クラスター内のプロセッサは各々600A~1000Aの電流が必要であるため、VR(電圧レギュレータ)がプロセッサの電源ピンから物理的に近くなければ、PCBやサブストレートのインピーダンスによる損失が大きくなります。そのため、たとえシングルプロセッサのアクセラレータカードであっても電力供給に課題が生じます。
また、人工知能(AI)の急速な発展には、GPUやAI用プロセッサが大きな役割を果たしており、これらに用いるシリコン・プロセスノードは、7nmや5nmから近い将来には3nmになると予想されます。このプロセスノードにおけるコア動作電圧は現在0.75~0.85Vです。AIに必要なワークロードのパフォーマンスを確保するため、データセンターや高性能コンピュータはサーバラックシステムで構築されます。GPUやプロセッサをアクセラレータカードに搭載し、そのカード4枚あるいは8枚がクラスターとして1つのサーバラックに格納されます。しかし、CerabrasとTeslaは最近、AI ASICそのものをクラスター化するという別のアプローチを発表しました。これにより、極めて高速かつ高密度のスーパーコンピュータを実現できる一方で、電力供給と放熱性能/冷却の面で、重要な課題が生じます。
ASIC/GPUクラスターの場合、シングルまたはデュアルプロセッサのAIカードのような、水平方向の給電(LPD)のためのスペースはありません。そして、高速 I/O は、ハードスイッチングのマルチフェーズ降圧レギュレータから生じるスイッチングノイズに極めて敏感です。ハードスイッチングのマルチフェーズVRがプロセッサに近づくと、I/OはVRのノイズの影響を受けやすくなります。電力供給ネットワーク(PDN)を設計するにあたり、ノイズに敏感な I/O に十分に配慮するという課題が増えます。マルチフェーズVRは一般的に1フェーズあたり40~60Aで設計するので、ピーク電流(通常1コアあたり1500A以上)を供給するために必要なフェーズ数は、AI ASICまたはGPUあたり30フェーズを超えることになります。これはLPD方式では、不可能ではないにせよ困難です。
大電流給電の鍵を握る Factorized Power Architecture™
Factorized Power Architecture™ は、1つのコンバータを2つの主要機能に分け、それぞれを高性能化して1つのシステムを組み立てるという基本的な考え方に基づいています。その2つの機能とは、レギュレーションと電流増幅です。
レギュレーション
レギュレーション機能の効率は、電圧を調整する量に反比例します。つまり大きく電圧調整すれば効率が下がります。レギュレータは入力電圧と出力電圧が近いほど電圧の調整量が減るので、高効率になります。FPA™のシステムでは、レギュレータの入力電圧と出力電圧の差を最小限に抑えることができます。PRM™ レギュレータはゼロ電圧スイッチング (ZVS) 昇降圧トポロジを用いており、入力電圧と出力電圧の差が小さいときに効率が高いことが特徴です。ZVS によりスイッチング損失を大幅に減らすことができるので、高周波スイッチングが可能になり、コンバータの小型化が実現します。PRMは通常40V~60Vの範囲の入力電圧を、30V~50Vに調整して出力します。
ソフトスイッチングと電流増幅
PRMの後段に、降圧と電流増幅の働きをする第2ステージを配置します。これは VTM™ カレント・マルチプライヤと呼ばれており、Sine Amplitude Converter (SAC™) トポロジを用いています。VTMは、入力電圧と出力電圧が一定の比率になるように動作するDC-DCコンバータで、入出力間のインピーダンスが1MHz 超にわたり低い(数百µΩ) なので、理想トランスのように動作します。
VTMにはエネルギー蓄積素子がないため、冷却が十分であれば大電力の供給が可能です。そのため、VTMの許容出力は、温度によるプロセッサの許容損失に合わせることができます。
SACトポロジはゼロ電圧・ゼロ電流スイッチングであるため、スイッチングノイズと電力損失は非常に小さくなります。
図1: PRMとVTMによってFPAは構成されています。PRMはシステムの入力電圧範囲と必要な電力から選定します。VTMは出力電圧範囲と必要な電流値から選定します。
PRMとVTMを組み合わせてFPAを構成します。片方はレギュレーションに特化しており、もう片方は変圧と電流増幅に特化しています。
ノイズが低減し、放熱性能が向上する SM-ChiP パッケージ
高性能のレギュレータには、トポロジやアーキテクチャが重要ですが、パッケージ技術も重要です。Vicorの SM-ChiP™ パッケージは、受動部品、磁気部品、FET、制御チップのすべてを1つのデバイスとして集積することができます。さらにこのパッケージは、熱インピーダンスが極めて低いので冷却が容易であり、最も効率良く電流を取り出せるように設計されています。多くの SM-ChiP は、デバイスの表面を接地した金属シールドで覆っています。これは冷却性能を上げるだけでなく、高周波の振動電流をデバイス内に留める効果もあります。
電力供給ネットワーク(PDN)の電力損失を95%低減する垂直給電
多数のプロセッサから成るプロセッサ・クラスターでは、水平方向の給電(LPD)を構成することはほぼ不可能です。プロセッサ・クラスターの電力供給は、垂直給電(VPD)が最適なソリューションです。VPDではカレント・マルチプライヤをプロセッサの真下、基盤の裏側に配置するため、マザーボード上の電流が流れる距離を短くでき、PDNの損失を大幅に低減できます。このときVPDには2つの鍵となる特徴が必要です。
図2: GTM™ ギアード・カレント・マルチプライヤをプロセッサの裏面に配置することで、給電パフォーマンスを最大限に引き出す垂直給電(VPD)。VPDソリューションを使うことでプロセッサの上側周辺のスペースを活用できるので、高速 I/O の配線やオンボードメモリを増やしたり、プロセッサの配置密度を上げたりすることができます。
1つめは、プロセッサの真下に高周波用コンデンサを配置することです。これは10MHz 超の高周波電流をデカップリングするために必要です。2つめは、効率を最大にするために、VPDのデバイスが電流を出力する端子の物理的な位置とパターンを、プロセッサコアの電源端子の場所と正確に一致させることです。そうすることで、大電流の流れを正しく「垂直」にすることができます。
これらの機能を実現するために、VicorのVPDソリューションのデバイスは3つの層を重ねたモジュールになっています。VTMカレント・マルチプライヤの上にギアボックス、下にPRMレギュレータを配置して、48Vを安定化して各プロセッサに給電するモジュール DCM™.を構成します。ギアボックスには、高周波用カップリングコンデンサと、VTMからの電流をプロセッサの電源端子に分配するという、2つの機能があります。VTMのサイズは、プロセッサに必要な電流要件から、PRMのサイズはプロセッサの消費電力から決まります。GPUやASICが複数の電源電圧を必要とする場合は、VTMとPRMの各々の層に、複数の独立したPRM、VTMを、必要な電源電圧、電流の要件に合わせて追加することが出来ます。
図 3: Vicor の DCM は、48Vから負荷へ直接給電するための機能すべてを1つの高性能パッケージに収めた、ASICクラスター用の完全なVPDソリューションです。モジュールはPRM、VTM、ギアボックスの層からなり、それぞれがレギュレーション、電流増幅、デカップリングコンデンサと端子間の位置合わせの機能をもっています。
Vicor の FPA™ アーキテクチャ、ZVS・ZCS 制御システム、高周波スイッチングの SAC カレント・マルチプライヤ・トポロジ、SM-ChiPパッケージ技術など、これらすべてによってVPDソリューションが完成します。VPDにより、クラスターに低ノイズで電力供給する際の課題が解決されるとともに、電源モジュールは効率が高く放熱性に優れたパッケージなので、冷却・放熱の構造設計も容易になります。VPDソリューションは高性能AIシステムを実現する救世主です。VPDソリューションを使うことで、プロセッサ・クラスターは、トレーニングモデルを完成させ機械学習を非常に高いレベルまで進めることができます。それにより、膨大なデータを高速に分析することが可能になります。
ハイパフォーマンスコンピューティング向けの優れた給電方法
AI と機械学習はまだ成長の初期段階ですが、年を追うごとに成長スピードは増していくでしょう。今後はより複雑なソリューションのため、さらに高速な処理が求められます。AI ASIC プロセッサを搭載したスーパーコンピュータには、従来の方法では到底対応できないほどの電力が必要になります。電力供給に対する革新的なアプローチこそが、AIが約束する未来を実現する唯一の方法です。増え続ける大電流を供給するためには、電源システムのアーキテクチャ、トポロジ、制御システム、パッケージングすべてが連携して機能する必要があります。最適なソリューションは、カレント・マルチプライヤを用いた垂直給電(VPD)です。これは、最新のハイパフォーマンスコンピューティングの要求を満たし、将来のニーズに合わせて容易に拡張ができる、実績のあるアプローチです。小型で高効率であり、電力供給ネットワーク(PDN)の損失を最大50%も削減できます。
This article was originally published by Power System Design.
Paul Yeaman は、最新技術をもつ企業や団体と幅広く協力しながら、業界で最も厳しい電力要件を持つシステムに対して、最先端の電源ソリューションを開発・導入しています。新技術がもたらす電源の課題に常に取り組むことで、電源に関する業界トレンドを幅広く把握し、新技術を実現するための電源ソリューションを顧客が確実に実現できるよう努めています。Yeamanはパワーエレクトロニクス業界で、設計とアプリケーション・エンジニアリングの両方で20年以上の経験があります。
Paul Yeaman, Senior Director, Applications Engineering