私たちのチームは、継続的デリバリーを効率化するために、4年前にGitOpsを採択し、ArgoCDを運用しています。ArgoCDはリアルタイムの可視性や監査性が高く、アプリケーションのデプロイだけでなく、Kubernetes環境のコンポーネント管理も大幅に簡素化できる点が魅力でした。
しかし、リソースの急激な増加に伴い、我々はアプリケーションのデプロイ時間が30分以上かかる、ApplicationのステータスがProgressingやMissingのまま数分間動かない、UIがフリーズして操作不能になるといった深刻なパフォーマンス問題に直面しました。
このセッションでは、これらの課題を解決するために行った詳細な分析と最適化のプロセスを共有します。具体的には、ボトルネックの特定方法、ArgoCDに適したメトリクスの収集や監視体制の構築、各コンポーネントの最適化手法などを紹介します。これらの取り組みで得られた知見を、具体的なデータや設定例を交えながら詳しくお話しします。