弊社が採用するAurora MySQLでのスキーマ分離によるテナント分離モデルは、「メタデータアクセス待機時間の増大」により限界を迎える構造的課題があります。本講演では、この潜在的リスクを定量化し、アーキテクチャの寿命を特定するために実施した負荷試験のプロセスを解説します。
単に数値を測るだけが負荷試験ではありません。我々は本番ワークロードを徹底分析し、支配的な数種のクエリがアクセスの9割を占めることを特定。このデータに基づき、qubeをラップした自作ツールで現実的な負荷再現を行いました。その結果、漠然とした懸念を「2年後にデッドラインに達する」という、経営判断に資する技術的根拠へと昇華させました。
しかし、負荷試験の真髄は測定値ではなく、その「解釈」にあります。「メモリ不足は証明できても、充足は評価できない」等の制約をどう捉えるべきか。100%の再現が不可能な試験特性を理解し、意味のある結論を導き出すための「負荷試験の哲学」をお伝えします。性能測定や調査を通じ、不確実なデータを解釈し意思決定に繋げたい全てのエンジニアへ、事実から論理的に結論を導くための思考プロセスを共有します。
MNTSQ 株式会社
SRE / Tech Lead
MNTSQ株式会社 SRE Tech Lead。2023年に入社し、大規模なサービスのリアーキテクトに伴うインフラ・運用の再設計やデータ移行を主導。現在はテックリードとして、事業計画に紐づく技術的なリスクの評価や内部改善をリードしている。
データと経済合理性に基づき淡々と負債を摘み取る、誠実でドライなエンジニアリングが売り。