Standardizing CloudNative ML Computing Platforms

Proposal: (採択)

中級者   Keynote

ML / LLM 基盤で実行されるワークロードが要求するプラットフォーム要件は、従来のアプリケーションとは異なる独自の側面を持っています。データ処理・学習・推論といった各フェーズにおいて、異なるリソース管理やスケジューリング、オーケストレーションの工夫が必要となり、これらを効率的に実現するための基盤整備が求められています。Kubernetesをはじめとする OSS ツールは、こうした課題に対する有力な解決策として、多くのプラットフォームで活用されています。
本セッションでは、これらの多様な要求を包括的に捉え、標準化された ML / LLM コンピューティング基盤の構築に向けた最新の取り組みをご紹介します。特に、Kubernetes WG Batch を中心とした OSS アップストリームの動向や、実際に Technical Lead として関わっているプロジェクトでの経験を交え、どのように標準化が推進され、アップストリームコミュニティが課題に取り組んでいるかをお伝えします。さらに、OSSコミュニティ内で所属企業の枠を超えてプロダクトを共に創り上げていくモチベーションやメリットについてもご紹介します。

Yuki Iwai
CyberAgent, Inc.
Software Engineer

Yuki is a Software Engineer at CyberAgent, Inc. He works on the internal platform for machine-learning applications and high-performance computing. He is currently a Technical Lead for Kubeflow WG AutoML / Training and Kubernetes Kueue. He is also Kubernetes WG Batch maintainer and kube-controller-manager Job reviewer.