Twitterがこのところ不調だった原因は「内部ネットワークの過負荷」と説明

2010年6月15日

先週末からTwitterがしばしば不調となり、何度もクジラの絵が表示される現象に見舞われていました。その主な原因はTwitterの内部ネットワークの構成ミスによる過負荷だったと、Twitterのエンジニアブログに「A Perfect Storm.....of Whales」というエントリで説明されています。

The Twitter Engineering Blog

内部ネットワークが高負荷に

一体何が起きたのか? 手短にまとめると3つのミスがあったと説明されています。

In brief, we made three mistakes:
* We put two critical, fast-growing, high-bandwith components on the same segment of our internal network.
* Our internal network wasn't appropriately being monitored.
* Our internal network was temporarily misconfigured.

手短にいえば、3つの間違いがあった。
* 2つのクリティカルな、急速に増長する、広帯域のコンポーネントを内部ネットワークの同じセグメントに置いてしまった。
* 内部ネットワークは適切にモニターされていなかった。
* 内部ネットワークは一時的に設定を間違えていた。

これによって内部ネットワークに過負荷が発生したとのことです。そして、こうしたミスを次のように修正中だと説明。

What we're doing to fix it
* We've doubled the capacity of our internal network.
* We're improving the monitoring of our internal network.
* We're rebalancing the traffic on our internal network to redistribute the load.

私たちが修正中のこととは
* 内部ネットワークの容量を2倍にした。
* 内部ネットワークのモニタリングを改善している。
* 内部ネットワークの負荷を再配分するためのリバランスをしている。

ブログでは、同社の技術部門は2009年をかけて、急増する負荷に対応するようにシステムを再設計してきたが、まだまだ改善の余地があることが分かったとのこと。また、Twitterの稼働状況を知らせるために「Twitter Status」も設置したと紹介されています。

関連記事

PublickeyではTwitterの内部アーキテクチャについての記事をこれまでも紹介してきました。

大規模なトラフィックを処理するためのFacebookの内部アーキテクチャの解説もあります。

Tags: 運用・監視 Twitter

このエントリーをはてなブックマークに追加
ツイート
follow us in feedly





タグクラウド

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本