障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開

2022年6月16日

クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました

Grafana OnCallは、昨年(2021年)11月に買収を発表したAmirが開発したソフトウェアで、発表と同時にGrafana Cloudのクラウドサービスとしても提供が開始されました。

今回それがオープンソースとして公開されたことになります。

各種監視ツールと連係、スケジュール設定による担当者への連絡など自動化

Grafana OnCallは、システム監視ツールから受け取ったアラートが、あらかじめ設定されたレベルを超えた場合に、自動的に運用担当者にSMSやチャットツールなどで連絡を行う、オンコールマネジメントと呼ばれる分野のソフトウェアです。

連携できるシステム監視ツールはGrafanaやPrometheusはもちろん、 Datadog、New Relic、AWS SNS、AlertManager、Zabbixなど多岐にわたり、連絡用のツールもSMSやSlackをはじめとする各種チャットツールなどに対応しています。

どのような場合にオンコールを発するかの条件は、IF文形式で設定することができます。

fig

オンコールの連絡先は、あらかじめ設定されたその日その時間の担当者にスケジュールを基に行われるようになっています。

fig

また、アラートの自動グルーピング機能によって、障害が継続しているあいだずっとアラートが鳴り続ける、いわゆるアラートストームを防止する機能も備えています。

これらの機能によって、別々の監視ツールからそれぞれ発せられるアラートを統合的に管理できるようになり、またあらかじめ決められたオンコール担当者に連絡を振り分ける作業も自動化されるなど、監視業務の自動化と効率化を進めることができるようになるとされています。

Tags: 運用・監視 Prometheus

このエントリーをはてなブックマークに追加
ツイート
follow us in feedly





タグクラウド

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本