弊社では、サービスの健全性を示す重要な指標として SLI を、目標値として SLO を定義し、5 年にわたって運用してきました。
この取り組みにより、ユーザー体験の低下をアクティブに検知し、チーム横断での迅速な対応が実現できるようになりました。
本セッションでは、SLO 運用の実際の方法や、ユーザー体験の低下を検知するための工夫について詳しく解説します。また、組織としてこのような活動を継続的に行うための文化づくりや、運用上の課題とその解決策についても触れます。
SLO の定義や運用を検討中の方、すでに SLO を導入しているが実運用に悩んでいる方に、弊社の 5 年間の経験から得られた知見を共有します。