100 クラスター規模のマルチテナント環境を支える OpenTelemetry Collector 実践と移行 ~ログ・メトリクス仕様の最前線~

Proposal: (不採択)

中級者   Operation / Monitoring / Logging

本セッションでは、100 を超える Kubernetes クラスタを運用する大規模マルチテナント環境において、 OpenTelemetry Collector への移行と活用を進める中で得られた知見を共有します。
従来は Prometheus + VictoriaMetrics や Promtail + Loki を用いてテレメトリを集約していましたが、各エージェントが直接集約基盤にデータを送信する構成では、バッファリングやフィルタリングなどの柔軟な制御をするにはユーザークラスタに手を加える必要があるという課題がありました。
そこでマネージドな中間レイヤーに OpenTelemetry Collector による Telemetry Pipeline を構築し、ソフトウェアでの制御を可能にするとともに、自プロダクトの集約基盤以外(例:Datadog)との連携容易性も実現しました。

本セッションでは、以下のトピックを中心に解説します。
・OpenTelemetry Operator の活用方法
・各 OSS における OTLP(OpenTelemetry Protocol) 対応状況
・Collector の集約単位設計(Cluster / Tenant / Data)
・Prometheus RemoteWrite 2.0・OpenMetrics 2.0 などの新しいプロトコル仕様
・Prometheus v3・Loki v3・Grafana Alloy などの最新動向

Masaya Aoyama
株式会社サイバーエージェント
Senior Software Engineer / KaaS Product Owner

2016年サイバーエージェントに新卒入社。OpenStackを使ったプライベートクラウドやマネージドKubernetesサービスを実装。国内カンファレンスでのKeynoteの登壇など多数。著書に『Kubernetes完全ガイド』『Kubernetesの知識地図』『みんなのDocker/Kubernetes』。現在はCloudNative領域のOSSへの貢献をはじめ、KubeCon + CloudNativeCon Japan 2025 Co-Chair、CloudNative Days Tokyo Co-chair、CNCF Japan ChapterのOrganizer、Kubernetes Meetup TokyoのOrganizerなどコミュニティ活動にも従事。

Kota Kimura
株式会社サイバーエージェント
Software Engineer

2023年5月に、株式会社サイバーエージェントに中途入社。社内向けのインフラサービスを開発・提供する組織 (CIU) にて、主に KaaS の AKE 開発・運用を行っている。
Kubernetes とサウナが三度目の飯より好き。