グーグルが構築した大規模システムの現実、そしてデザインパターン(2)~BigTable編

2010年8月25日

グーグルが「Evolution and Future Directions of Large-Scale Storage and Computation Systems at Google」(グーグルにおける、大規模ストレージとコンピュテーションの進化と将来の方向性)という講演を、6月に行われたACM(米国計算機学会)主催のクラウドコンピューティングのシンポジウム「ACM Symposium on Cloud Computing 2010」で行っています。

講演の内容を4つの記事(MapReduce編、BigTable編、教訓編デザインパターン編)で紹介しています。この記事はMapReduce編の続き、BigTable編です。

分散処理に対応するBigTable

次はBigTableの説明に移ろう。BigTableは、大規模分散の半構造化データストアシステムだ。

グーグルでは多くの構造的なデータを保存している。ページランクの計算のためのURLやWebのデータ、ユーザーごとのデータ、位置情報等々。しかもこれが大規模に存在している。これを数千台のマシンで分散処理でき、故障にも対応できるようなストレージが必要だった。

fig

BigTableの基本的なデータモデルは、ロー、カラム、それにタイムスタンプによるバージョニング。

fig

BigTableを分散処理に対応させるメカニズムが、Tabletと、TabletのSplittingだ。Tabletには多くのローが保存されており、Tabletにデータを格納していくとTabletが大きくなっていく。そしてある程度大きくなったらTabletを分割し、分散させていく。

fig

BigTableはグーグルの主要なデータストアであり、多くの実際のサービスで使われている。

fig

BigTableに付随する実行コード

さて、BigTableについての新しい情報も紹介しよう。

以前は、グーグル内のそれぞれのグループが独自にBigTableを利用し、それぞれがBigTableを管理していた。現在ではBigTable専用チームで管理するようにしている。

また、性能分離を向上させている。グーグルマップ、ブックスキャニングチームなどが大量のMapReduceをはじめても影響がないようになった。耐障害性も向上させている。

fig

レプリケーションも進歩しており、データは3つの異なるデータセンターにレプリケーションされるようになった。レプリケーション間での一貫性はEventual Consistency(結果整合性)を採用している。

ユーザー向けのほとんどのデータはレプリケーションされるようになっている。

fig

BigTable Coprocessorsと呼ぶ、Tabletごとに付随するコードを実行できるようにした。このコードはTabletの分割などにも追随していく。RPCによる操作とは異なり、「これこれの行をとりだしたい」という抽象化した要求をTabletに対して投げ、複数のサーバで並列に実行できる。

fig

マルチデータセンターの上に作られるSpanner

現在取り組んでいるのが「Spanner」だ。グーグルがこれまで(Spanner以前に)作ってきたのは、個別のデータセンター用のものだった。サービスデベロッパはそれらを組み合わせてクラスタレベルでのアプリケーションを作ってきた。

Spannerでは、マルチデータセンターの上にストレージやコンピューテーションを作ろうとしている。さらに、プログラマは強いコンシステンシも容易に使えるようになる。

fig

Spannerのゴールは、10万台から1000万台程度のサーバで構成され、1つのネームスペースを持つものだ。内部はゾーンという単位で管理しようとしている。

fig

次回は、グーグルが大規模システム構築で学んだこと。教訓編です。


このエントリーをはてなブックマークに追加 Bookmark this on Delicious     fig Follow Me  fig RSS

タグ : Google , クラウド , データセンター

次の記事
グーグルが構築した大規模システムの現実、そしてデザインパターン(3)~教訓編
前の記事
グーグルが構築した大規模システムの現実、そしてデザインパターン(1)~MapReduce編

Loading...

Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。新しいオンラインメディアの可能性を追求しています。
詳しいプロフィール


Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
RSSリーダーで : Feed





アクセスランキング - 過去7日間

  1. 特許庁の基幹システムはなぜ失敗したのか。元内…
  2. マイクロソフトの責任者が語る「われわれはどの…
  3. 特許庁の基幹システム失敗の背景にある、日本に…
  4. みんなはどんなテスト技法を使っているの? J…
  5. ソフトウェアテストの30年前と30年後(前編…
  6. マイクロソフトでは「開発プロセスのすべてにテ…
  7. ソフトウェアテストの30年前と30年後(後編…
  8. セールスフォース社長がつぶやいたエコポイント…
  9. 「絶対落ちないシステムを作れ」という要件に、…
  10. 客が本気にならないといいシステムができない。…
  11. HTTP 2.0はグーグルのSPDYがベース…
  12. ソフトウェアテストの近未来を話そう(前編)~…
  13. ソフトウェアテストの近未来を話そう(後編)~…
  14. グーグルはあれほど多くのソフトウェアのテスト…
  15. 電子書籍フォーマットの本命、「EPUB」をい…

最新記事 10本

バックナンバー



アルファブロガー・アワード2010受賞 Publickeyはアルファブロガー・アワード 2010を受賞しました! いつもご愛読ありがとうございます。









blog comments powered by Disqus