はじめに
こんにちは!
今回は、GoogleCloudにおいて、「VMインスタンスが停止したときに自動で通知を受けたい」という運用者向けに簡易的な設定の手順をご紹介します!VMインスタンスへの監視エージェントインストール無しで簡単に実装することができます。
前提条件
- 監視対象の VM インスタンスが存在していること
- アラートを作成するための適切な権限があること
※例:Monitoring管理者/編集者 - 通知チャネルに通知先として使用する連絡先(メール・SMS・Slackなど)が設定されていること
※未設定の場合はこちらを参照
概要
今回のアラートの仕組みについて簡単に紹介すると、
Monitoring のインスタンスの起動経過秒数を示すメトリクスとして「compute.instance.uptime 」があります。
これをターゲットとしてアラームを作成することで、一定時間データが届かなくなったら「インスタンス停止」と見なしてアラートを上げる仕組みが作れます。
構築手順
ステップA アラートポリシーを作成
- コンソール画面から「アラート」を開いて、「Create Policy」を選択する

- 設定値を入力して作成する(必須事項は赤枠)
新しい条件
Select Metric: VM Instance>Instance>Uptime
フィルタ: 任意(画像では特定のインスタンスを指定)
ローリングウィンドウ: 1分
ローリングウィンドウ関数: sum
トリガーの設定
Condition Type : Metric absence
Alert Trigger : いずれかの時系列で検知
トリガーの不在期間 : 任意(画像では最短の3分を指定、不要な検知を避けるため30分程度をおすすめ)
アラートの詳細
通知チャネルを使用: オン
通知チャネル: 任意の通知先
通知の件名: 任意の件名
Notify incident clusure: 任意
incident autoclose duration: 任意
重要度: 任意レベル
アラートポリシー名: 任意の名前

ステップB 動作確認
VMインスタンスを停止させてアラート通知が届くことを確認します。
通知先のアラートが届いていれば、無事設定完了です!
作成直後のポリシー詳細
インスタンス停止後にアラートが上がる様子
アラートが届いた様子

注意点とトラブルシューティング
- 自動再起動等で通知が増える可能性があります
- 停止以外の原因でもインスタンスからのデータ欠如があればアラートが発生します
※トリガーの不在期間設定を長めに設定することである程度対策可能
まとめ
今回紹介した監視設定の他に、追加でエージェントをインストールすることによって構築可能になる監視設定も複数あるので、ご興味が湧いた方はこちらを参照してみてください。
以上、「Google Cloud MonitoringでVM停止監視アラートを5分で作る方法」のご紹介でした!


