AIインフラの重要課題:AIワークロードの課題に対応するソリューションを再定義
企業、AIファクトリー、データセンターがHPC/AIの要求に対応するためには、意思決定者が6つの重要なインフラ課題に取り組む必要があります。
資料をダウンロードソリューションのロックを解除する過去40年にわたり、データセンターはさまざまな技術革新に対応してきました。しかし、AIはこれまでにない課題をもたらし、データセンターのあり方そのものを見直す必要があります。急増する電力需要や液冷の導入など、AIによってITインフラのあらゆる要素が限界に近づいています。
本資料では、AIの進化に対応しながら、AIファクトリーに求められるインフラを効率的に整備するための実践的な知見を紹介しています。主な内容は以下の通りです。
- AIへの対応:AIがデータセンターにもたらすこれまでにない変化や、設計アプローチの進化、従来の戦略では対応しきれない理由を明らかにします。
- AI時代の電力対応: 従来のITワークロードの最大10倍の電力を消費するAI駆動のGPUに対応し、増大するエネルギー需要に対処します。変動する電力負荷の管理、リスクの低減、拡張性の確保について紹介します。
- 空冷を超える冷却:従来の冷却方式では、AI環境の要求に十分対応できません。本章では、高密度なAIサーバーとその投資を守るために重要となる液冷の役割に焦点を当て、供給、運用、さらには空冷システムとの統合に関する指針を紹介します。
- 次世代ワークロードに対応するラック設計:AI環境では、従来の基準を大きく上回る電力密度が求められます。高密度コンピューティングと統合冷却に対応する、柔軟で信頼性の高いラック設計のポイントをご覧ください。
- 統合的なシステム管理:分断された管理から脱却し、リアルタイム可視化と高度な制御を実現する統合型・拡張可能な管理プラットフォームが、AI環境に不可欠な理由をご紹介します。
図1 AIデータセンターの構築には、設計から運用までの効率化とイノベーションを実現するために、これまで分断されていた役割を横断的に統合するアプローチが求められます。
- 信頼性の高いサポートサービス:AIインフラには、専門的な保守と最適化が求められます。経験豊富なサービスと継続的なトレーニングを活用し、安定した運用を実現する方法をご覧ください。
表1 AIファクトリーの実現を支える、AIインフラの重要課題の概要重要インフラ 重要課題 冷却 液冷が前提となる 電源 チップからグリッドまで、GPU特有の増大かつ多様な負荷に対応する必要がある サービス AI環境の維持には、専門的なサービス対応が不可欠である ラック ITラックは、高密度な電力供給と冷却に対応する必要がある デザイン 電力と冷却を統合的に設計する システム管理 監視・管理は統合的に行う必要がある
次世代のコンピューティングチップやサーバーへの投資は大きく進んでおり、その多くがAIに関連しています。こうした資産を最大限に活かすためには、24時間365日の安定稼働が欠かせません。ITインフラのレジリエンスはこれまでも重要でしたが、今後はさらに重要性が増し、その実現はこれまで以上に複雑になっていくと考えています。
Vertiv 最高技術責任者(CTO)兼エグゼクティブ バイスプレジデント
本資料は、AIの需要に対応するために運用の拡張を担うITリーダーやデータセンターの実務担当者、インフラの専門家にとって重要な内容です。また、実際の課題やベストプラクティスの事例に加え、業界リーダーの知見や、ソリューション提案に基づく計画フレームワークやロードマップも紹介しています。
AIに最適化された最新のテクノロジーおよびシステム管理ソリューションを理解し、拡張性・レジリエンス・将来対応力を備えたインフラの設計と導入方法をご覧ください。