グーグル、分散処理のためにデザインされた言語「Sawzall」をオープンソースで公開

2010年11月4日

グーグルは、同社内でパラレルデータ処理に利用している言語「Sawzall」を、「Szl」というプロジェクト名のオープンソースとして公開しました。

szl - Project Hosting on Google Code

書籍「Googleを支える技術」によると、Sawzallは分散処理のためにデザインされたDSL(Domain Specific Language)で、特定の用途に限っては非常に容易に処理を記述できるようになっているインタープリタ型のプログラミング言語。GFS(Google File System)とMapReduceを基盤とし、MapReduceをより簡単に実行できるものと説明されています。

なぜSawzallはオープンソースとして公開されたのか?

グーグルは2003年8月に、論文「Interpreting the Data: Parallel Analysis with Sawzall」を発表し、これによってSawzallという言語がグーグルによって開発され、社内で利用されていることが広く知られることになりました。

この論文によるとSawzallは、エラーがあっても「エラーがあった」というフラグを立てるだけで処理はそのまま継続してしまうという「エラー忘却型コンピューティング」という新たな概念を実装した言語だと説明されています(参考:そのソフト,売る?売らない? - 記者のつぶやき:ITpro)。

こうした論文は公表されたもののSawzallの言語実装そのものはこれまで社外に提供されることはなく、また、Sawzallの基盤となるGFSやMapReduceについても、過去にグーグルから論文は公開されていますが、実装が公開されたことはありませんでした。

今回なぜ、言語のSawzallをオープンソースとして公開したのか、現時点でグーグル関係のブログによる解説などは行われておらず、いまのところその理由は不明ですが、また1つ、MapReduce関連の技術を進歩させるオープンソースソフトウェアが登場したといえそうです。

Yahoo!からはリアルタイムMapReduceのS4が公開されたと前回の記事「リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開」でお伝えしたばかりですし、10月のHadoop WorldではNTTデータがClouderaと提携したことを、記事「Hadoop WorldでClouderaと提携したNTTデータが目指すもの。Hadoop World: NYC 2010」でお伝えしていますし、このところMapReduce関連のニュースが相次いでいますね。

Tags: プログラミング言語 Google MapReduce

このエントリーをはてなブックマークに追加
ツイート
follow us in feedly




タグクラウド

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本