しきい値監視からの卒業! Prometheus による機械学習を用いた異常検知アラートの実装

システムの安定運用において、メトリクスの収集とアラートの設定は欠かせません。今までのプラクティスでは、人間が予め定めた一定の条件において、しきい値を超える、あるいは下回る場合にアラートを発泡するしきい値監視が一般的でした。しかし近年、監視ツールを提供するベンダーでは、機械学習による時系列データ予測モデルを用いた異常検知アラートが提供されています。同様の手法を、OSS である Prometheus のメトリクスを用いて実装します。

Takuya Takahashi

登壇者プロフィール

Takuya Takahashi

GMO ペパボ株式会社

プリンシパルエンジニア

takutaka1220

takutakahashi


GMO ペパボ株式会社にてインフラエンジニアをしています。可用性を担保するアーキテクチャの設計、運用や、クラウドネイティブを実現するツールを作り運用することが得意です。Kubernetes が好きです。