10万 RPS 超の広告配信基盤の VPC リニューアル 〜新卒エンジニアが挑戦した EKS 環境のゼロダウンタイム移行〜

Proposal: (不採択)

中級者   Application / Development

本セッションでは、10万を超える RPS を捌く広告配信サーバが稼働している EKS の VPC を、従来の VPC から新しい VPC へ移行する中で得られた知見を共有します。
AJA SSP Division では広告配信サーバを運用していますが、サーバへのリクエスト数は部署立ち上げ時と比較して飛躍的に増加しました。これにより、広告配信サーバと配信ログの集計ジョブで使用されるノード数が増え、消費されるIPアドレス数も増加し、既存の VPC では IP アドレスが不足する状況となりました。そのため、より多くの IP アドレスを確保した新たな VPC を作成し、広告配信サーバと配信ログの集計基盤である Apache Spark が稼働するEKSを新 VPC へ移行する必要があり、これを完遂しました。
本セッションでは、VPC のゼロダウンタイムリニューアル時に得た知見をもとに、以下のトピックを中心に解説します。
・VPC の CIDR ブロックと VPC ピアリングについて
・Route53 の荷重ルーティングを利用したゼロダウンタイムの実現
・広告配信サーバならではの配信ログの取り扱いについて

Keisuke Ishigami
株式会社サイバーエージェント
Backend Engineer

42 Tokyo での学習を経て、楽天、ヤフー、MIXI でインターンを経験。
2024年4月にバックエンドエンジニアとして CyberAgent に新卒入社。広告ブロダクトの提供、開発を行う AJA にて広告配信サーバの開発、運用を行っている。