NetflixのChaos Monkeyがバージョンアップ。マルチクラウドに対応し、AWS、Google CloudのインスタンスやDockerコンテナが落とせるように

2016年10月24日

わざと稼働中のサーバを落とすことで、システムの耐障害性を日常的に検証し続けるためのツール「Chaos Monkey」がバージョンアップして「Chaos Monkey 2.0」になったと、開発元のNetflixによってがブログ「Netflix Chaos Monkey Upgraded」で報告しています。

The Netflix Tech Blog: Netflix Chaos Monkey Upgraded

Chaos Monkey 2.0では、同社がオープンソースで公開している継続的デリバリのためのツール、「Spinnaker」と連係できるようになりました。

連係によってChaos MonkeyはSpinnakerからシステムのデプロイ状況を把握できるようになり、そのデプロイ状況に基づいてSpinnaker経由でインスタンスを落とすようになります。

SpinnakerはAmazonクラウド、Google Cloud、そしてDokcerオーケストレーションツールのKubernetesに対応しているため、Chaos MonkeyもAmazonクラウドやGoogle Cloudのインスタンス、Kubernetes上のコンテナを落とすことができるようになっています。

またChaos Moekyの操作もSpinnaker経由で行えるようになったため、以下のように分かりやすいユーザーインターフェイスで設定できるようになっています。

fig

またChaos Monkey 2.0では外部のトラッキングサービスとの連携も可能になったため、Chaos Monkeyがインタンスを落とす状況について正確にトラックできるようにもなりました。下記のグラフはNetflix社内で使われているイベントトラッキングシステムのChronosと、テレメトリプラットフォームのAtlasによるレポート画面です。

fig

これまでのバージョンのChaos Monkeyは、インスタンスを落とすだけでなくCPUの負荷を高めたり、ストレージをオフラインにするなどの障害状況も引き起こすことができましたが、Chaos Monkey 2.0ではインスタンスを落とすだけになっています。そのため、インスタンスを落とす以外の障害状況を利用したい場合はバージョンアップしないようにと注意喚起されています。

Tags: AWS 運用・監視 IaaS

このエントリーをはてなブックマークに追加
ツイート
follow us in feedly





タグクラウド

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本