エントリー済み

大規模Kubernetes基盤(40k+ nodes)における年間400件のサポートとの向き合い方

中級者 - Intermediate Cloud Native Platform Engineering SRE

LINEヤフーでは、社内開発者向けにKubernetes as a Service(KaaS)を提供しています。現在1,300以上のクラスタ、約40,000ノードを管理する国内最大級の規模となり、年間約400件のサポート問い合わせに対応しています。規模だけでなく、利用形態や技術レベルの幅広さから、問い合わせのバリエーションも国内有数の複雑さを持っています。

利用チームは、Webサービスやバッチ処理の実行基盤として利用するチームから、社内プラットフォームを構築するチームまで多岐にわたり、初心者から高度な利用者まで習熟度も様々です。そのため、問い合わせも障害対応、設計の相談、性能改善など多岐にわたります。

プラットフォームが利用者とともに成長し続けるためには、迅速かつ継続的に改善されるサポート体制が不可欠です。本セッションでは、よくある問い合わせの具体例を紹介しつつ、サポートケースの優先順位付けの考え方、活用している指標、振り返りを通じた改善の進め方、さらに問い合わせ件数を減らすためのドキュメント整備や機能改善の取り組みについて、実践知を共有します。

Speaker

Shota Yoshimura

LINEヤフー株式会社

ソフトウェアエンジニア

SIerでインフラエンジニアとしてシステム開発に従事後、通信事業者の研究開発部門でHadoopやKafkaを活用したデータ分析基盤を開発。現在はLINEヤフーにて、国内最大規模のプライベートKubernetes as a Serviceの開発・運用を担当。Cloud Native Developers JPなどCNCF関連コミュニティの運営・登壇も行い、Observability Conference 2022、CloudNative Days Tokyo 2019などで登壇。