freee では Argo Rollouts による canary release を活用しており、デプロイ担当者が一つのコンテナイメージから API server・worker などの複数の Rollout を同時にデプロイしています。レイテンシやDB負荷などの基本的なメトリクスから、サービス間のエラーログなど監視対象が多く、基準が曖昧なため、障害の原因となる Rollout を Rollback する作業が属人化していました。本セッションでは、この課題を解決した Argo Workflows による GUI からの一括 Rollback 、メトリクスによるデプロイ時監視の標準化、 AnalysisTemplate による自動Rollbackの検討についてお話しします。