Clouderaが「SQL-on-Hadoop」のImpala 1.0正式版リリース

2013年5月1日

Hadoopのディストリビューションベンダとして知られるClouderaは今日、Hadoopのクラスタに対してSQLでの問い合わせを実現するオープンソースソフトウェア「Cloudera Impala」のバージョン1.0を公開しました。製品版は「Cloudera Enterprise RTQ」として販売されます。

Release - Cloudera Ships Impala 1.0: Industry's First Production-Ready SQL-on-Hadoop Solution

Clouderaは、Hadoopで構築された大規模な分散データベースに対してSQLで高速に問い合わせが可能になることにより、企業でのデータウェアハウス用途などHadoopでの新たな市場を開拓できるとしています。

MapReduceを使わず独自の分散クエリエンジン

Impalaはバッチ処理をベースにしたMapReduceは使わず、独自の分散クエリエンジンによってHDFSあるいはHBaseに保存されているデータに対して直接クエリを実行する仕組みになっています。

Hadoop上でSQLによる問い合わせを実現するソフトウェアとしてはHiveがよく知られていますが、HiveはMapReduceのバッチ処理として実行されるため問い合わせごとに時間がかかっていました。それに対してImpalaはMapReduceのバッチ処理を経由しないため、高速でインタラクティブな動作を実現しているとClouderaは説明しています。

Impalaで使用できる問い合わせ言語はSQL 92のサブセットでHiveQLに似ており、Select、ジョイン、サブクエリなどをサポート。Hive ODBCドライバもサポートするため、アプリケーションからODBCドライバ経由で利用することもできます。

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本