本セッションでは、100を超える Kubernetes クラスタを運用する大規模マルチテナント環境において、 OpenTelemetry Collectorへの移行と活用を進める中で得られた知見を共有します。従来は Prometheus + VictoriaMetrics や Promtail + Loki を用いてテレメトリを集約していましたが、各エージェントが直接集約基盤にデータを送信する構成では、バッファリングやフィルタリングなどの柔軟な制御をするにはユーザークラスタに手を加える必要があるという課題がありました。そこでマネージドな中間レイヤーに OpenTelemetry Collector による Telemetry Pipeline を構築し、ソフトウェアでの制御を可能にするとともに、自プロダクトの集約基盤以外(例:Datadog)との連携容易性も実現しました。
本セッションでは、以下のトピックを中心に解説します。
・OpenTelemetry Operator の活用方法
・各 OSS における OTLP 対応状況
・Collector の集約単位設計(Cluster / Tenant / Data)
・Prometheus RemoteWrite 2.0・OpenMetrics 2.0 などの新しいプロトコル仕様
・Prometheus v3・Loki v3・Grafana Alloy などの最新動向
2016年サイバーエージェントに入社。マネージドKubernetesサービスの開発やOpenStackを使ったプライベートクラウド構築、CloudNative技術を用いたアーキテクトとして従事。著書に『Kubernetes完全ガイド』『Kubernetesの知識地図』『みんなのDocker/Kubernetes』、技術顧問としての経験や基調講演の登壇経験などもあり。KubeCon + CloudNativeCon Japan 2025 Co-Chair、CloudNative Days Tokyo Co-chair、CNCF Japan ChapterのBoard member、Kubernetes Meetup TokyoのOrganizerなどにも従事。