エントリー済み

LLMの出力に"信頼"を設計する:インシデント定量分析 × Agentic Codingの実践

中級者 - Intermediate SRE

LLMを業務システムに組み込む際、最大の障壁は出力の信頼性です。メルカリでは、インシデント対応AI Agent「IBIS」と、長期間に蓄積されたインシデントデータを一括で定量分析する専用AIツールを開発・運用しています。本セッションでは「LLMの出力をどう信頼可能にするか」を2つの切り口で紹介します。第一に、LLMがいいかげんな計算や分析をする問題への対策。合計100%にならない割合を出す、指定期間外のデータを勝手に扱う等、実運用で直面した失敗と、そこから確立した「LLMに任せること・任せないことの線引き」の設計、および生成レポートの品質を自動評価し不合格なら再生成する仕組みにより、定量分析結果の信頼性をどう確保したかを紹介します。第二に、Agentic CodingでAIツール自体を開発する中で設計した予防的ガードレール。LLMの出力品質に課題を感じるSRE・プラットフォームエンジニアに、再現可能な設計パターンを持ち帰っていただきます。

Speaker

oguma

メルカリ

メルペイSRE

メルカリでCentral SRE、Embedded SREおよびFinOpsを経て、2025年10月よりメルペイSREとしてFinTech領域に従事。
インシデント対応の相棒としてのAI AgentであるIBISのメイン開発者。Agent開発に加えて自然言語処理、LLMOps基盤の設計から構築、運用まで行なっている。
直近半年はインシデント対応・管理の全体的なAIネイティブ化を推進するプロジェクトに参画し、AI/LLMを使った分析ツールも開発。
SRE x AI に可能性を感じ、新しいSREの形を日々模索。