間違いだらけのポストモーテム - ホントに役立つレビューはこうだ!

Track D 2024/11/28 14:20-15:00

初級者   Operation / Monitoring / Logging   アーカイブ視聴可   スポンサーセッション

みなさんはシステム障害発生後に、きちんとレビューをしていますか? SREのプラクティスではポストモーテムと呼ぶこともありますね。

ポストモーテムを行うことは、将来のインシデント防止に向けてとてもとても大事です。 インシデント対応そのものよりも大事とすら言えます。ですが、それほど大事なものなにも関わらず、「正しく」レビューが出来ているケースはそれほど多くありません。

本セッションでは、インシデントを組織の成長機会に繋げていきたいという人に向けて、インシデントという体験から学び組織を強化するベストプラクティスについてお話しします。BlamelessからBlame-awareに、ポストモーテムからポストインデントレビューに。これまであまり語られてこなかった、インシデント後のレビュー方法についてヒントとなる話をします。

Kazuto Kusama
PagerDuty株式会社
Product Evangelist

通信事業者でプラットフォームエンジニアを務めたのを皮切りに、いくつかの外資系企業でプロフェッショナルサービスやプリセールスエンジニアとしてクラウドネイティブやプラットフォーム製品に携わるなど、10年以上さまざまな形でプラットフォームに関与している。2023年11月より現職。一般社団法人クラウドネイティブイノベーターズ協会 代表理事。Platform Engineering Meetupオーガナイザー