Microsoft Azure、わざと障害を発生させてサービスの耐障害性を鍛える「Azure Chaos Studio」発表

2021年11月10日

マイクロソフトは、Microsoft Azure上で人為的に障害や性能低下などを発生させることで、アプリケーションの耐障害性を確認し改善できる、いわゆるカオスエンジニアリングを実現する新サービス「Azure Chaos Studio」をプレビュー版として発表しました

fig

カオスエンジニアリングはもともと、動画配信サービスのNetflixがAWS上で稼働する同社のサービスの耐障害性を高めるために作り出した方法論です。2012年には人為的に障害をシミュレーションするツール「Chaos Monkey」をオープンソースで公開しています。

参考:サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開

このChaos Monkeyの名称などから、こうした障害のシミュレーションを用いる手法を「カオスエンジニアリング」と呼ぶようになりました。

障害が起きても支障のない業務時間内に、あらかじめ計画しておいた障害の種類をクラウドに挿入することで、万が一本当にクラウドに障害が発生したとしてもサービスを止めずに運用を継続できるか、性能低下はないか、などを訓練として確認できるわけです。

今年、2021年3月には、このカオスエンジニアリングの機能をAWSが正式なサービスとして提供開始しています。

参考:AWS、わざとクラウド障害を起こす新サービス「AWS Fault Injection Simulator」提供開始。カオスエンジニアリングをマネージドサービスで

カオスエンジニアリングはクラウドにおけるサービス品質を高めるための手法として定着したといえるでしょう。

今回マイクロソフトが発表した「Azure Chaos Studio」も同様に、Microsoft Azureの純正サービスとして、カオスエンジニアリングのための機能を備えるというものです。

クラウドの障害をシミュレートするAzure Chaos Studio

Azure Chaos Studioは、障害の種類や範囲内、時間など制御しつつMicrosoft Azureでシミュレートできる機能を提供します。

障害の種類にはCPU負荷や物理メモリ、仮想メモリの負荷、ディスクI/Oの負荷、プロセスの強制終了、DNSエラー、ネットワークの遅延や切断、データベースのフェイルオーバーなどさまざまなものが用意され、今後もさらに拡大していくとのことです。

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本