はじめに
従来のアラートとInstanaのスマートアラートの比較について解説します。
Instanaは、システムトラブルを未然に防止できるアプリケーションパフォーマンス監視(APM)ツールです。
スマートアラートを使うことによるメリットは、以下の通りです。
- システムの仕様を把握していない状況でも解析可能
- Webシステムのサービス品質の異常を検出
- 複雑な設定が不要で手軽に使える
スマートアラートを使った監視を行いたい方の参考になれば幸いです。
アラートの目的
アラートを様々な箇所に設定すること自体は悪いことではありません。
しかし、アラートの本来の目的は、問題に気付き、その問題に対して何らかのアクションを行うことです。
あまり意味のないアラートを多数受信して、本来の業務が滞ってしまっては本末転倒です。多すぎるアラートは、大きく2つの問題を引き起こします。
-
大量のアラートによる業務負荷の増加:低リスクのアラートの数が高リスクのアラートを大幅に超えている場合、アラート通知を受けることそのものが業務負荷になる
-
アラートの誤認や見逃し:無視したアラートの数が有効なアラートを超えている場合、対応すべき高リスクのアラートを見失っている可能性がある
従来のアラート
従来のアラート設定方法では、各種のメトリクスに対して閾値を設けて条件ごとに設定する必要がありました。従来のアラートだと以下のような問題が生じます。
- アラートの確認に時間がかかる
- 運用監視に関する知見が必要
- 適切な閾値の設定が難しい
従来のアプローチは、小規模なシステムでは有効かもしれません。
しかし、複雑な環境になると、考えられる全てのシナリオを探すために何百、何千もの正確な状態チェックを作成、維持することが必要になります。
スマートアラート
従来のアラートと比べて、InstanaのスマートアラートはAIや機械学習を活用しているため不要な通知を減らします。
スマートアラートでは、以下の事象を障害検出の対象とすることが可能です。
- 応答速度の低下(低速)
- JavaScriptのエラー(JSエラー)
- HTTPのエラー(HTTPステータスコード)
- アクセス数の超過・過少(スループット)
※()内はInstanaにおける表記となります。
Instanaでスマートアラートを見るには、左メニューから[Applications]を選択します。
3つの項目が表示されますが、[Smart Alerts]を選択すると詳細が確認できます。
スマートアラートをセットアップするときは、静的閾値(Static)と適応閾値(Adaptive)のどちらかを選択できます。
1. 適応閾値
Instanaによって監視される新しいデータによって継続的に進化し、調整されます。つまり、閾値が人手を介することなく、基礎となるメトリックに対する周期的な変化を継続的に考慮します。
2. 静的閾値
スマートアラートが作成された後に変更されることはありません。基礎となるメトリックが大幅に変更されると、閾値として機能しない可能性があります。
すぐに監視を行いたい場合は、適応閾値を選択します。
慣れてきたら静的閾値の設定を変更して、監視を行ってみましょう。
詳細な設定については、下記の記事も参考になります。
InstanaのSmart Alert(スマート・アラート)で楽ちん監視開始
まとめ
従来のアラートとInstanaのスマートアラートの違いについて解説しました。
表にまとめると、以下のようになります。
Instanaのスマートアラートを体験してみてください。
参考文献
著者
Airitech株式会社 小畑 啓
編者
日本アイ・ビー・エム株式会社 野中 佑太