SEV1からSEV4またはSEV5までのラベルだけで、深刻さやインシデントの傾向を語れますか?これらのラベルは序数尺度であり、単純な件数集計では「SEV1が1件、SEV2が3件、SEV3が10件、どれが最も深刻か」に答えられません。
さらには、同じSEVレベルでも条件によって実際に受ける影響度が異なるケースも存在することが浮き彫りになってきました。
本セッションでは、各SEVラベルへの重み付与 + 条件による加重の仕組みによるSeverity Indexの設計と、それを活用した統計的異常検出の実装を共有します。
さらに、月次変化率によるトレンド判定、再発率の検出ロジックなど、複数の定量メトリクスをPythonで事前計算し、LLMのプロンプトに注入するアーキテクチャを解説します。
「LLMに計算させない」設計判断の背景と、事前計算メトリクスがレポート品質をどう向上させたかを実コードベースで示します。
メルカリ
メルペイSRE
メルカリでCentral SRE、Embedded SREおよびFinOpsを経て、2025年10月よりメルペイSREとしてFinTech領域に従事。
インシデント対応の相棒としてのAI AgentであるIBISのメイン開発者。Agent開発に加えて自然言語処理、LLMOps基盤の設計から構築、運用まで行なっている。
直近半年はインシデント対応・管理の全体的なAIネイティブ化を推進するプロジェクトに参画し、AI/LLMを使った分析ツールも開発。
SRE x AI に可能性を感じ、新しいSREの形を日々模索。