しきい値監視からの卒業! Prometheus による機械学習を用いた異常検知アラートの実装

Track F 2022/11/22 13:40-14:00

中級者   Operation / Monitoring / Logging   アーカイブ視聴可  

システムの安定運用において、メトリクスの収集とアラートの設定は欠かせません。今までのプラクティスでは、人間が予め定めた一定の条件において、しきい値を超える、あるいは下回る場合にアラートを発泡するしきい値監視が一般的でした。しかし近年、監視ツールを提供するベンダーでは、機械学習による時系列データ予測モデルを用いた異常検知アラートが提供されています。同様の手法を、OSS である Prometheus のメトリクスを用いて実装します。

Takuya Takahashi
GMO ペパボ株式会社
プリンシパルエンジニア

GMO ペパボ株式会社にてインフラエンジニアをしています。可用性を担保するアーキテクチャの設計、運用や、クラウドネイティブを実現するツールを作り運用することが得意です。Kubernetes が好きです。