SREとして働いているので、障害やサービスの変な挙動(エラーが増えたり、レイテンシーが増えたり)の原因調査をすることが多い。というか、自分からいっぱい首を突っ込んでいる。
正直自分にとってはコーディングよりもこっちが楽しかったりする。だからSWEではなくSREをやっていると言っても過言ではないと思う。
「レイテンシーがスパイクしました」から始まり、どこのDCか、どのホストか、依存サービスに異常はないかなど一通り定型的な調査をしてから、徐々にスコープを限定していく過程が面白い。
DataDogのメトリクスはもうお友達。というかは、いろんな友達(各種メトリクス、ダッシュボード)が集まる溜まり場といったところか。その溜まり場で、「これが怪しいと思うんだけど知らないかな?」といろんな友達に日夜聞いてまわっている。
どこか謎解きゲームのような感じにも似ているこの営みを生業にしているしがないSREである。