Amazon CloudWatch、機械学習により異常値(アノマリー)を自動検出できる新機能

2019年10月25日

ITシステムの運用監視において、通常とは異なる状態、例えば急にトラフィックが跳ね上がる、動作速度が遅くなる、プロセッサの使用率が上がる、ネットワークのレイテンシが大きくなる、などを検知し、警告を発することはもっとも基本的かつ重要な機能です。

しかし、通常の状態にはある程度の幅があります。一体どの程度の範囲を超えたら異常であると判断するのか、閾値の設定は容易ではありません。

閾値を低くすれば、ひんぱんに異常と判断されて警報がいつのまにか軽視されてしまう心配があります。逆に閾値を高くすれば、小さな異常が見過ごされてしまう恐れがあるため、適切な設定には試行錯誤が必要です。

しかも昼と夜、平日と休日では適切な閾値は異なるでしょうし、キャンペーン期間やテレビコマーシャルの投入など特定の期間も閾値は変化するなど、閾値の設定は動的に行う必要もあります。

こうした難しい異常値の検出を機械学習により自動的に行う「Anomaly Detection」(異常検知)機能を、AWSの監視サービスであるCloudWatchが搭載したことが発表されました

下記は「New – Amazon CloudWatch Anomaly Detection」から、CloudWatch Anomaly Detectionの説明を一部引用します。

CloudWatch Anomaly Detection has its roots in over 12,000 internal models. It will help you to avoid manual configuration and experimentation, and can be used in conjunction with any standard or custom CloudWatch metric that has a discernible trend or pattern.

CloudWatch Anomaly Detectionは、1万2000を超える内部モデルを起源に持ち、手作業による設定と試験を不要とし、識別可能な傾向やパターンを持つCloudWatchの標準もしくはカスタムなあらゆるメトリクスを扱えます。

CloudWatch Anomaly Detectionは、管理画面からアイコン(下図の波型アイコン)をクリックするだけで指定されたメトリクスの履歴データを読み込み、機械学習を基に正常値の範囲を自動的に設定します(画像も上記記事より引用)。

fig

機械学習の結果グレイの範囲が正常値の範囲として設定され、この範囲から外れた値が自動的に異常値と判断されるわけです。

fig

機械学習の対象から取り除きたい履歴の期間も設定でき、機械学習のモデルもカスタマイズ可能。

CloudWatch Anomaly Detection機能は全リージョンで利用可能になっているとのことです。

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本