AI需要の拡大に伴い、データセンターの電力消費が急増しています。本セッションでは、ソフトウェアで省電力をめざすOSSの研究プロジェクト「WAO(Workload Allocation Optimizer)」を紹介します。
Pod配置(kube-scheduler)やトラフィック制御(kube-proxy)に、サーバーの消費電力プロファイルや環境メトリクスを組み込むため、スケジューラープラグインやカスタムメトリクスなどKubernetesの拡張機構をどう活用したか、実装を交えて深堀りしていきます。加えて、KubeflowやOllamaなどAIワークロードを使った実験の結果を共有し、アプローチの有効性を確認します。
Kubernetesのカスタマイズや拡張に関心のあるエンジニアや研究者を対象に、実践的なヒントやアイデアを提供できればと考えています!
主なトピック:
・WAOの概要
・CRDとカスタムメトリクスを用いたメトリクス収集・提供
・スコアプラグインによるスケジューラーの拡張
・kube-proxy(NFTablesモード)の改造によるサービスプロキシの拡張