OpenTelemetry計装における、最初のトラブルシューティング

Proposal: (エントリー済み)

初級者   Operation / Monitoring / Logging

クラウドネイティブなプロダクション環境では、多数のマイクロサービスが多数のコンテナの上で、絶え間なく変化を続けながら動作することになる。その中から各種テレメトリーデータを集めて可視化し、複雑な状況の把握を助けるのが「オブザーバビリティ」と呼ばれている分野のプラクティスやツール群である…ということは、すでにご存知であろうことと思います。

オブザーバビリティを始めるための最初の一歩としてテレメトリーデータを収集するためのAPI, SDK, プロトコル, 各種ツール群を提供しているのが「OpenTelemetry」です。様々な箇所にエージェントをセットアップして、データパイプラインを構築して、バックエンドに送り、可視化する。OpenTelemetryは「簡単に始められる」というコンセプトはありつつも、実際にセットアップしようとすると、常にうまく動くとは限りません。

本セッションでは、OpenTelemetryの計装を始めたときによくあるトラブルの例から、それをどう解決していけばいいかについて、OpenTelemetryのアーキテクチャーとともに紹介していきます。トレースやメトリクスなど各種テレメトリーデータの活用を始めるスタート地点に立つにはどうしたらいいかについて議論していきます。

Kazunori Otani
Splunk Services Japan合同会社
Senior Solutions Architect, Observability

Splunk Observabilityの導入支援の仕事をしています。それまでは業務システム業界でSEとして7年の経験を積んだ後、広告配信サービスを構築・運用をリーダー/CTOとして8年ほど経験しつつ、オブザーバビリティ製品のカスタマーサクセスも担当しつつ、スクラッチからのアプリケーション開発、DevOpsの推進、開発組織の改善などなどやってました。「オブザーバビリティ・エンジニアリング」共訳。趣味はバックカントリースキー。