液冷システムは、ITと施設管理の従来の境界を越え、新たな課題を生み出す一方で、より統合的なサービスを実現する機会ももたらします。
分断された連携
午前2時、データセンターのラックでCDU(冷却液分配ユニット)のアラームが発生。このユニットはITの液冷システムの一部でありながら、施設側の冷水ループとも接続されています。IT部門は監視ツールを通じてアラートを受信しますが、機械系コンポーネントのトラブルシュートに必要な権限やアクセスを持っていません。一方、施設管理部門は対応に必要な専門知識を有しているものの、CDUをリアルタイムで監視していません。その結果、両チームの連携に時間を要し、対応までに45分の遅れが発生。その間にラック内の温度は上昇し始めます。
これは、液冷を導入するデータセンターで実際に起こり得るシナリオです。空冷では、IT部門と施設管理部門の役割は明確に分かれています。ITはサーバーやスイッチを管理し、施設管理部門はチラーや空調設備を担当します。しかし、液冷の導入により、この構図は変わります。CDUやマニホールド、ラック内配管といった要素は、どちらの領域にも明確に属さず、役割の境界を曖昧にします。その結果、運用上のギャップが生まれ、パフォーマンスと信頼性の双方に影響を及ぼします。
Uptime Instituteの調査部門であるUptime Intelligenceの調査によると、約17%のデータセンターが液冷を導入しており、61%以上が導入を検討しています。この結果は、液冷導入の機運が高まっていることを示しています。AIやHPCの普及によりラック密度は50kWを超え、インフラは従来の組織の境界を越え始めています。
デジタルと機械が交差する領域
液冷は、冷却設備とチップの間に新たなレイヤーを生み出します。CDUは冷却液の状態を調整・分配し、マニホールドはそれを各コンポーネントへと供給します。これらの要素は、コンピュート性能と熱管理の双方に影響を及ぼすため、責任の所在を明確にすることが重要です。
ハイパースケールのテナントが自社の液冷サーバーを導入しつつ、コロケーション事業者の施設インフラに依存する場合、運用の複雑性はさらに増大します。サービスレベル契約(SLA)では責任範囲が定義されているものの、実際の運用では複数の組織にまたがるチームが関与します。冷却液の残量は誰が監視するのか。誰が圧力アラートに対応するのか。こうした問いは、文書上の役割分担とリアルタイムの対応との間にあるギャップを浮き彫りにします。
責任分担のための4つのアプローチ
Uptime Instituteによると、ITと施設管理の従来の境界は、液冷にはうまく当てはまらないとされています。運用者は一般的に、次の4つのアプローチのいずれかを採用しています (図1参照)。
オプションA:IT主導モデル
ラック内のマニホールドからサーバーのコールドプレートに至るまで、ITチームがすべてを管理します。責任の所在が明確になる一方で、流体管理や漏えい対応といった機械系の知識がIT側に求められます。
オプションB:施設管理主導モデル
施設管理部門が、ラック内のコンポーネントを含め、すべての冷却インフラを管理します。機械系の専門性を活かせる一方で、IT機器へのアクセスや運用、トレーニング面で複雑さが増す可能性があります。
オプションC:ラック境界での責任分担
施設管理部門はラックのCDUやマニホールドまでを担当し、IT部門はサーバー内部の配管を担います。このような分担は、運用上の役割が明確に定義されているハイパースケールとコロケーションの契約で一般的に見られます。
オプションD:接続は施設管理、運用はITが担当
施設管理部門が物理的な接続を担い、IT部門が監視と基本的なメンテナンスを担当します。このモデルはマルチテナント環境に適していますが、密な連携が不可欠です。
それぞれのモデルは特定の環境で有効に機能しますが、実際の導入では、これらを組み合わせた柔軟な運用体制が求められることが多くあります。

図1. DLCシステムにおけるVertiv™のITと施設管理の責任分担オプション 出典:Uptime Institute(2023年)
求められる連携とは
液冷は、ハードウェアだけでなく、チームの働き方そのものを変えます。流体ループや制御系、障害ポイントを共有する環境では、ITと施設管理は独立して運用することはできません。連携は“あればよいもの”ではなく、インフラ運用の前提として組み込む必要があります。
では、実際の運用ではどのような取り組みが求められるのでしょうか。
可視性の共有:CDUや設備側のアラームは、ITと設備の双方から確認できる状態にする必要があります。統合ダッシュボードや共通の報告プロセスなどを通じて、両者が同じ情報をリアルタイムで把握できることが重要です。目的はシステムの統合ではなく、迅速な対応に必要な情報を共有することにあります。
相互理解の強化:IT担当者が流体力学の専門家になる必要はありませんが、漏えいアラームやポンプ障害がサーバー稼働に与える影響は理解しておくべきです。同様に、施設管理部門もサーバーのアラートを理解し、冷却性能との関係を把握する必要があります。
明確なエスカレーションルール:どのアラートに誰が対応するのか、どのタイミングで他チームへ連携するのか、緊急時に制限エリアへのアクセスをどのように確保するのかを明確に定義します。主担当者が不在の場合でも対応が滞らないよう、バックアップ連絡先を含めてルールを定義しておくことが重要です。
ベンダー対応の連携:マルチベンダー環境では、システム全体にまたがる課題に対応するための調整役が必要です。単一の窓口に集約する必要はありませんが、各ベンダーとのコミュニケーションの責任範囲と、問題発生時の調整方法を明確にしておくことが求められます。
最適な液冷導入のために
CDUのようにチームの境界にまたがるコンポーネントが存在すると、対応の遅れやパフォーマンス低下につながります。こうした課題を回避するには、ハードウェアだけでなく、明確な役割分担、可視性の共有、そして初期段階からの連携体制が不可欠です。
Vertiv™ Liquid Cooling Servicesは、この分断を解消します。設計から運用まで、インフラとITを連携させることで、引き継ぎによる遅延なくシステムを稼働させます。
Vertivのスペシャリストにご相談いただき、液冷導入を最適に進めてください。