エントリー済み

オンプレGPUクラスタ×vCluster:検証を止めないための権限委譲とIngressアーキテクチャ

中級者 - Intermediate Cloud Native Platform Engineering

クラウドGPUの高コスト化により、オンプレでGPUクラスタを複数プロダクトで共有(マルチテナント運用)するケースが増えています。しかし、マルチクラスタはセキュリティ管理やGPUリソース融通の面で運用負荷が高く困難です。
一方、単一クラスタ共有に伴う権限制限がボトルネックとなり、「PoCで用いた独自のIngress Controllerをオンプレにも導入したい」という要望に迅速に応えられない課題がありました。
本セッションでは、運用コスト抑制と開発効率を両立させるため、仮想クラスタ技術「vCluster」を導入した実践例を紹介し、開発チームへ安全に疑似Cluster Admin権限を委譲する手法を解説します。
特に、vCluster内で独自のIngress Controllerを動かすためのネットワーク構成に焦点を当てます。外部トラフィックをどう引き込み、どのような経路で疎通するのか。手軽な「Host側Ingress共有モデル」と、MetalLB経由でGlobal IPを引き込みAPISIX等を構築する「独立モデル」の2つのアーキテクチャを比較・検証した知見を深掘りします。

Speaker

Naoya Ishimoto

NTTドコモビジネス株式会社

エンジニア

2025年新卒入社
AIインフラ分野について強い関心があり、大学院進学のタイミングで機械系から情報系に転向後入社
現在は、社内向けGPUkubernetesクラスタの運用開発に従事