Kubernetesのマルチリージョン化ってどうやるの!?教えて楽天のエンジニアさん!

Track A 2022/11/21 15:20-16:00

中級者   Architecture Design   アーカイブ視聴可  

現在私たちが運用しているサービスは最大でもマルチデータセンターレベルの冗長化となっており、リージョン障害が発生した場合復旧に2時間もの時間を要しておりました。また、Kubernetesのupgrade作業も実際にリクエストが来ている状態でnodeの入れ替えを行なっており、リスキーな作業となっていました。
そこで私たちは下記を目的にKubernetesクラスタのマルチリージョン化を行いました。
・リージョン障害時30分以内に復旧できること
・Kubernetesのupgradeをリクエストが来ない状態で安全に行えること

本公演では、Kubernetesクラスタのマルチリージョン化を行なった経験を元に下記内容をお話します。
・Kubernetesのマルチリージョン構成をどのように実現したか
・Kubernetesクラスタをどのタイミングでどのように切り替えるべきか
・Kubernetesをマルチリージョン化したことによって、開発者、運用者にどのようなメリットがもたらされたか

Takumi Sato
楽天グループ株式会社
Software Engineer

2020年新卒で楽天グループ株式会社に入社。楽天グループ内のサービスが横断的に利用するアプリケーションの開発運用や、Operation ZEROのミッションの元、既存システムの改善と自動化に貢献。直近ではKubernetesの専門知識を活かして、Operator Patternを利用した運用の自動化や、Kubernetes Clusterのマルチリージョン化、そしてVaultをKubernetesのマルチクラスタ環境に構築するプロジェクトなどで活躍。