みなさんはシステム障害発生後に、きちんとレビューをしていますか? SREのプラクティスではポストモーテムと呼ぶこともありますね。
ポストモーテムを行うことは、将来のインシデント防止に向けてとてもとても大事です。 インシデント対応そのものよりも大事とすら言えます。ですが、それほど大事なものなにも関わらず、「正しく」レビューが出来ているケースはそれほど多くありません。
本セッションでは、インシデントを組織の成長機会に繋げていきたいという人に向けて、インシデントという体験から学び組織を強化するベストプラクティスについてお話しします。BlamelessからBlame-awareに、ポストモーテムからポストインデントレビューに。これまであまり語られてこなかった、インシデント後のレビュー方法についてヒントとなる話をします。