現在私たちが運用しているサービスは最大でもマルチデータセンターレベルの冗長化となっており、リージョン障害が発生した場合復旧に2時間もの時間を要しておりました。また、Kubernetesのupgrade作業も実際にリクエストが来ている状態でnodeの入れ替えを行なっており、リスキーな作業となっていました。
そこで私たちは下記を目的にKubernetesクラスタのマルチリージョン化を行いました。
・リージョン障害時30分以内に復旧できること
・Kubernetesのupgradeをリクエストが来ない状態で安全に行えること
本公演では、Kubernetesクラスタのマルチリージョン化を行なった経験を元に下記内容をお話します。
・Kubernetesのマルチリージョン構成をどのように実現したか
・Kubernetesクラスタをどのタイミングでどのように切り替えるべきか
・Kubernetesをマルチリージョン化したことによって、開発者、運用者にどのようなメリットがもたらされたか