MIXI では事業特性や開発者体験を重視し、プロダクトごとに異なるオブザーバビリティツールを採用しています。SaaS 型 から self-hosted までツールは多様で、共通基盤を前提としない状況の中で運用が行われています。
しかし、どのプロダクトにも共通する課題がありました。
課題例:
- アラートは鳴るが、調査の起点や次の行動が設計されていない
- ダッシュボードはあるが、チームの継続的な対話を生み出せていない
ツールは存在しているものの、日々の改善や意思決定に対して十分にオブザーバビリティが価値を発揮できていないことでした。Platform Engineering として私たちが目指したのは、ツールの統一ではなく"観測する文化" を根付かせることです。オブザーバビリティの成熟度を評価し、運用フローを再設計し、SRE のナレッジを AI としてワークフローに組み込むことで、調査や振り返りを支援する仕組みづくりを行いました。
本セッションではプロダクトの多様性を前提とした環境で、どのように行動様式の変化を促したのか、その実践と学びを共有します。
株式会社MIXI
SRE
2024年1月株式会社MIXIに入社。様々な事業の信頼性に横断組織として関わり、監視・運用改善やSLOの導入などをEmbedded SREとして行ってきた。現在はPlatform Engineeringグループとして、事業を横断してSREのナレッジや文化を展開できる仕組み作りを行いながら、Enablingを中心に各事業のサービスに携わっている。得意なことはパフォーマンス最適化。