エントリー済み

大規模 MySQL 環境の運用自動化と安定化:Kubernetes Operator を用いた実践

中級者 - Intermediate Cloud Native

MySQL クラスタは本質的に複雑な分散システムであり、クラスタ数の増加に伴って障害対応、変更作業、データ整合性の確認といった運用負荷は急速に増加します。特に 1000 クラスタ規模の大規模環境では、フェイルオーバーやレプリケーション整合性の維持、バックアップ/リストア、変更管理を手動で維持することは困難で、安定性、再現性、スピードのいずれもがボトルネックになります。

私たちは Kubernetes 移行を機に、MySQL 運用を Operator に委ねて自動化を進め、障害時の挙動を想定・検証可能な形へと改善してきました。その中心となるのが、Kubernetes 上で MySQL を運用するために開発した MOCO です。MOCO の機能と Deployment・CronJob など標準 API に支えられた実行基盤により、配置・復旧・更新を安定させ、運用への自動化と検証プロセスの組み込みを実現しています。

本セッションでは、大規模 RDBMS 運用を Operator に委ねる際に必要となる設計・検証・運用プロセスについて、実運用に基づく知見を紹介します。

Speaker

Soju Yamashita

サイボウズ株式会社

クラウド基盤エンジニア

2022 年にサイボウズ株式会社にクラウド基盤エンジニアとして入社。
主に Kubernetes、オブザーバビリティ、データベース周りの業務に従事。