インフラメトリクス(CPU使用率とか)の監視いらん話は納得できるんだけど、そこに至るまでにステップがあるから、それはちゃんと書いておきたい。
インフラメトリクス(CPU使用率とか)が取得されて、ダッシュボードで可視化されている
リソース消費率などのサチュレーションを管理するフローがある(例えば、定期的なダッシュボード確認会やキャパシティのハードクォータの緩和申請)
業務時間中にOnCall担当者が確認する自動起票のレポートシステムがあり、サチュレーションの警告はそこに起票される
深夜休日問わず、ユーザー影響が出てる場合に鳴るページャーがある(ここにはサチュレーションのアラートはいらない)
2と3をちゃんとやってからね。