100クラスター規模のマルチテナント環境を支える OpenTelemetry Collector 実践と移行~ログ・メトリクス仕様の最前線~

Proposal: (エントリー済み)

中級者   Operation / Monitoring / Logging

本セッションでは、100を超える Kubernetes クラスタを運用する大規模マルチテナント環境において、 OpenTelemetry Collectorへの移行と活用を進める中で得られた知見を共有します。従来は Prometheus + VictoriaMetrics や Promtail + Loki を用いてテレメトリを集約していましたが、各エージェントが直接集約基盤にデータを送信する構成では、バッファリングやフィルタリングなどの柔軟な制御をするにはユーザークラスタに手を加える必要があるという課題がありました。そこでマネージドな中間レイヤーに OpenTelemetry Collector による Telemetry Pipeline を構築し、ソフトウェアでの制御を可能にするとともに、自プロダクトの集約基盤以外(例:Datadog)との連携容易性も実現しました。

本セッションでは、以下のトピックを中心に解説します。
・OpenTelemetry Operator の活用方法
・各 OSS における OTLP 対応状況
・Collector の集約単位設計(Cluster / Tenant / Data)
・Prometheus RemoteWrite 2.0・OpenMetrics 2.0 などの新しいプロトコル仕様
・Prometheus v3・Loki v3・Grafana Alloy などの最新動向

Masaya Aoyama
株式会社サイバーエージェント
Senior Software Engineer / KaaS Product Owner

2016年サイバーエージェントに入社。マネージドKubernetesサービスの開発やOpenStackを使ったプライベートクラウド構築、CloudNative技術を用いたアーキテクトとして従事。著書に『Kubernetes完全ガイド』『Kubernetesの知識地図』『みんなのDocker/Kubernetes』、技術顧問としての経験や基調講演の登壇経験などもあり。KubeCon + CloudNativeCon Japan 2025 Co-Chair、CloudNative Days Tokyo Co-chair、CNCF Japan ChapterのBoard member、Kubernetes Meetup TokyoのOrganizerなどにも従事。

Kota Kimura
株式会社サイバーエージェント
Software Engineer

2023年サイバーエージェントに中途入社。マネージド Kubernetes サービスの開発やマネージド L4/L7 LoadBalancer サービスの開発に従事。OSS の活動は、Gateway API Provider の Envoy Gateway の reviewer として活動中。三度の飯よりサウナが好き。