IIJ、マルチクラウドの運用統合と自動化を実現する「IIJ統合運用管理サービス」提供開始。同社のノウハウで障害原因の特定や対処をナビゲート
インターネットイニシアティブ(IIJ)は、オンプレミスや同社のクラウドサービス「IIJ GIO」に加え、Microsoft Azure(以下Azure)やAmazon Web Services(以下AWS)、Office 365などマルチクラウドの運用管理を統合し、運用の自動化を実現する新サービス「IIJ統合運用管理サービス」を4月1日から提供することを発表しました。
当初はオンプレミス、IIJ GIO、Azureに対応。AWSは2017年度中に対応する見通し。
IIJ統合運用管理サービスはそれ自身もクラウドサービスとして提供されるのが特長の1つ。オンプレミスやIaaS型クラウドに対する運用監視にフォーカスし、クラウドごとの構成やリソース情報の一元化、アカウントやサポートの一元化、監視アラートやイベント情報の一元化などを実現。
障害発生時のアラートを基に原因特定のためのシステム情報を自動収集、対処も
最大の特徴は、同社がこれまで蓄積してきた運用管理の自動化の仕組みがIIJ統合運用管理サービスに組み込まれている点です。
単純にオンプレミスやクラウドからの運用情報を一元化するだけでは、大量のアラートや障害情報が運用管理者に届くだけです。
そこでIIJ統合運用管理サービスでは、例えばメンテナンス作業に関連して発生した不要なアラートや対応の必要がないアラートなど「要否判定」に基づくフィルタリング機能、そして例えば同一サーバから瞬間的に同事象のアラートが大量発生した場合のアラートを5分ごとに束ねたり、データベース障害など同一事象を原因として発生する大量のアラートを省略するなど、アラートの「重複排除」機能によって、必要なアラートのみを効率的に管理者に届けます。
アラートから電話をかける、もしくはメールを送信する、チケットを起票するといった自動処理も実行。
さらに障害が発生した場合、アラートを基に原因特定に必要なシステム情報を自動収集し、同社が蓄積してきた運用ナレッジから有益な対処法をナビゲートすることで障害の早期復旧を支援します。
閾値に達しなくとも傾向分析などで事前対処
さらに今後の機能追加として、運用監視では、アラートの閾値に達しなくとも傾向分析によって障害を予測。障害発生よりも前に対策を可能等する機能。
また、通常とは違う変動(アノマリ)の検知や、閾値判定や予測では察知できない隠れた障害(サイレント障害)の検出も実現していくとのこと。
4月のリリース以降は、前述のアノマリ検知やサイレント障害検出などのほか、AWSやOffice 365などへの対応、自動レポート機能など、新機能を順次追加していくとのことです。
また、IIJ統合運用管理サービスのOEM版として、SIerなどが自社サービスとしてこれを利用する機能も実装済みとのこと。
この場合、例えば複数のユーザーの障害情報をまとめて知ることができるようになり、例えば特定のクラウドの特定のリージョンで発生しやすい障害のような、ユーザーでは判定しにくいような事象について、幅広い情報収集によって判断できるようになっていくだろうとしています。
あわせて読みたい
Google、マネージドサービスでPostgreSQLを提供する「Cloud SQL for PostgreSQL」ベータ提供を発表
≪前の記事
Dockerコンテナがフェイルオーバーしたとき、ストレージも自動的に切り替えてくれる。オープンソースの「REX-Ray」をDell EMCが無償公開中[PR]