Four Golden Signalsの次の一歩:サービスレベル管理の設計戦略と最新動向

Proposal: (エントリー済み)

中級者   Operation / Monitoring / Logging

サービスレベルを検討するうえで、SRE本が提唱するFour Golden Signals(スループット、エラー率、レイテンシ、飽和率)は今や不可欠です。一方で、これら以外にも正確性や鮮度といったユーザ価値に直結する観点があり、実サービスの品質を担保するにはこれらの指標も併せて捉える必要があります。さらに、実際にサービスレベルを設計する際には、ユーザージャーニーを踏まえた測定戦略、部門間の合意形成、運用者の疲弊を避けるアラート設計など、考慮すべき事項が多岐にわたります。

本セッションでは、Four Golden Signalsの次の一歩として有用なサービスレベル指標を解説し、サービスレベル設計の手順と要点を紹介します。加えて、要件パターンを用いて運用知識に依存せずSLI候補を迅速に導出する戦略構想とそれを用いたビジネス部門との合意手法にも可能な範囲で触れます。また、最新動向としてSLO as Codeの議論や機械学習モデルの品質基準にも言及します。

本セッションは次の論点を中心に議論します。

- Four Golden Signals以外のサービスレベル指標
- サービスレベルの計測とアラート戦略
- SLIの迅速な導出戦略構想
- SLO as CodeやAIモデル向け管理指標などの最新動向

Takaya Ide
株式会社 日立製作所
Senior Researcher

研究開発グループにて、Cloud Native/SRE/Observability/Security領域の課題解決と社内展開を推進