対象:DevOpsがなかなか進まないという課題を持っている開発者
社内の開発チームの中でSREの概念を理解し実践できるエンジニアを成長支援した事例を紹介します。
当時、開発チームの外にSREチームが置かれていて開発チームのインフラ運用などをサポートしている状態でした。
開発チームではレガシーシステムのリプレイスプロジェクトが走っていて
リプレイス環境ではIaC化とある程度のクラウドアーキテクチャのベストプラクティス化が進んでいたため、SREチームはなにか困ったときにサポートするという形ですんでいました。
一方長期のプロジェクトのためレガシーシステムの運用は続いており、そちらでは技術的負債が多くIaC化が不十分で監視体制などまだまだ改善していきたいところが残っていました。
こちらのシステムの運用には開発チーム外のSREチームが作業に入るなど肝心の運用改善にまで手が届いていない状態でした。
SREチームが運用チームの役割を担ってしまう課題として
個々のサービスのドメイン知識まで把握しきれていないので踏み込んだ運用課題の改善に繋げにくかった
複数のサービスの運用サポートを掛け持つことになっていたので、なにか問題が発生したときに即応できなかったり優先度的に後回しになるケースがあった
というのがありました。
そこで開発チームのメンバーにSREの概念を理解して実践に移せるエンジニアを成長支援することにしました。
いわゆる開発チームの中にSREを埋め込んでいくEmbedded SREを増やして運用作業や改善を開発チーム内で行える状態を目指しました。
ここでは具体的にEmbedded SREの成長をどう支援したのかと
Embedded SREが増えたことによるDevOpsへの効果を紹介したいと思います。