Hadoopがバージョン1.0へ。2.0、3.0の議論も進む

2012年1月5日

大規模分散処理フレームワークのHadoopの最新安定版「Hadoop 1.0.0」が、昨年12月27日に公開されました。これは、これまで安定版として開発されていた「Hadoop 0.20」ブランチの最新バージョンを1.0.0としたものです。

Hadoopは、前身となるNutchが2002年にDoug Cutting氏によって開発され、(このビデオの10分頃のCutting氏の発言によると)2008年にNutchからHadoopプロジェクトが分離。約4年を経てバージョン1.0へと到達したことになります。

Hadoop 1.0.0 Release Notes

今回バージョン1.0.0となった旧0.20ブランチのほかに、Hadoopには0.22、0.23など複数のブランチで開発が進んでおり、Hadoopに対する新しい機能、例えば従来のMapReduceを完全に書き換えたMapReduce 2などはこれら新しいブランチに対して実装が行われています。

つまり、今回のHadoop 1.0は、最新機能版ではなく、最新安定版がバージョン1.0と名乗っても問題がないほど安定したことをバージョン番号に込めたものだといえるでしょう。

Hadoop 2.0、3.0も登場へ

こうしたHadoop 1.0が登場した経緯とバージョン番号の扱いについて、shiumachi氏のブログ科学と非科学の迷宮にポストされたエントリ「[雑記]hadoopのバージョン表記について」で詳しく解説されています。

このエントリの図がとても分かりやすいので、引用させていただきます。

fig

このエントリおよびそこから参照されているHadoopのメーリングリストの議論によると、今後Hadoop 0.22がHadoop 2.0へ、Hadoop 0.23がHadoop 3.0になるのはどうか、という提案が多くの賛同を得ています。最終的な結論はまだ出ていないようですが、これらのバージョン番号を持つHadoopも今後コミュニティ内の手続きを経て登場することになりそうです。

(追記 2012/1/10:Cloudera社がバージョン番号に関する同社関連情報の日本語訳を公開しています)

このエントリーをはてなブックマークに追加
follow us in feedly


関連タグ Java / 機械学習・AI / Hadoop / MapReduce / オープンソース



タグクラウド(β版)

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本