PFNでは機械学習基盤としてオンプレミスや外部のクラウドサービスに構築した複数のKubernetesクラスタを運用しています。クラスタには本番環境用や検証用など用途の違いがあり、その用途に応じてマニフェストによる変更を反映するタイミングを適切に管理する必要があります。
本発表ではPFN社内で運用している複数のKubernetesクラスタを対象としたリリース管理戦略や、それを支えるGitOpsとPull Requestの活用方法、遭遇したトラブルとその解決策について詳しく共有します。GitOpsを使ったリリース管理の事例が知りたい中級者向けの内容です。