マイクロサービスのような分散アーキテクチャにおいて、複雑に絡み合ったサービスのデバッグや信頼性を担保することは大きな課題の1つです。マイクロサービスを高い信頼性で運用するためにはサービス全体が観測でき、また小さく壊し素早く復旧するための仕組みが求められます。
本セッションでは、マイクロサービスの信頼性を支えるためのオブザーバビリティと信頼性を向上させるためのサービスメッシュについて、SRE の各種プラクティスを交えながら実践的な導入方法についてご紹介します。
山口 能迪
グーグル合同会社シニア デベロッパー リレーションズ エンジニア。クラウド製品の普及と技術支援を担当し、特にオブザーバビリティ、SRE、DevOps といった領域を担当。担当領域の製品開発にも携わる。OpenTelemetry や Go のコミュニティの支援も活発に行っている。「Go 言語による並行処理」「オブザーバビリティ・エンジニアリング」「SLO サービスレベル目標」翻訳、「SRE の探求」監訳。
内間 和季
金融機関でのシステム開発 / 運用を経験後、外資 IT ベンダーにて仮想基盤や Kubernetes のアーキテクチャ設計に関する技術コンサルティングサービスを提供。Google Cloud では GKE や Cloud Run 等コンテナベースのアプリケーションプラットフォームに関する技術支援を行っている。