Hadoopを表計算のように使える「InfoSphere BigInsights」、IBMが発表

2010年5月24日

IBMがHadoopをベースにしたデータ分析ソフトウェア「InfoSphere BigInsights」を、先週ローマで開催された同社のイベント「IBM Information On Demand Europe 2010」で発表しました

InfoSphere BigInsightsは、Apache Hadoopをベースにした分析エンジンの「BigInsights Core」と、その上で大規模データをWebブラウザを利用してスプレッドシートのようなユーザーインターフェイスで分析を行える「BigSheets」の2つから構成されます。

BigSheetsで表計算のようにデータ分析

BigInsights CoreのベースとなっているHadoopは、数百万件など大規模なデータを大量のサーバで分散処理するためのオープンソースのソフトウェアです。Yahoo!やFacebook、日本ではCookpadなどでの利用例が知られており、Amazonクラウドでは「Amazon Elastic MapReduce」というサービスとして提供中で、米Clouderaからは商用のディストリビューションも提供されています。

Infosphere BigInsightsはIBMが提供する商用のHadoopディストリビューションのようなものといってもいいでしょう(発表によるとサービスとしても提供されるようです)。

この製品の最大の特徴はBigSheetsにあります。BigSheetsは、表計算のようなユーザーインターフェイスを利用してBigInsights Coreに命令を与え、プログラミング不要で大量のデータを分析する機能です。デモンストレーションのビデオから、その機能を紹介しましょう。

BigSheetsのダッシュボード。分析可能な情報の一覧が表示されています。

fig

2002年から2009年のあいだに特許庁から公開された特許文書をすべて取得し、138万本のドキュメントが保存されています。取得した生データはXML文書で、ここから文書番号や提出日付などの必要な情報を抽出、表形式で参照。さらにIBM関連の特許文書だけに絞り込み。

fig

引用回数をタグクラウドで表示。

fig

引用回数を基にしたランキング表示

fig

企業がクラウドを採用するきっかけとなるか

Webのビジネス利用が広まると共に、そこから数テラバイト、数ペタバイトの大規模データが、システムのログ、大量のドキュメント、ユーザーの行動データなどとして一般の企業の情報システムからも生成されるようになってきました。

いわゆる「Big Data」と呼ばれるこうした大量のデータを分析し、ビジネスへとフィードバックすることがニーズとして浮かび上がってきたとき、それを分析するためのソフトウェアとして急速に注目されているのがHadoopです。

Hadoopは先月、MapReduceの特許を保有していたグーグルから正式に特許の利用許可を得て、知的所有権の懸念が解消したばかり。IBMがHadoopをデータ分析のためのビジネスアプリケーションとして商品化したことで、今後大規模分析を行うためのインフラとしての位置づけを高めていくことになりそうです。

そしてそれが、企業がクラウドを採用するきっかけとなるキラーアプリケーションになっていくかもしれません。

関連記事


このエントリーをはてなブックマークに追加 Bookmark this on Delicious     fig Follow Me  fig RSS

タグ : Hadoop , IBM , MapReduce

次の記事
グーグルによるMapReduceサービス「BigQuery」が登場。SQLライクな命令で大規模データ操作
前の記事
マイクロソフトはこんな理由でセールスフォース・ドットコムを訴えている

Loading...

Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。新しいオンラインメディアの可能性を追求しています。
詳しいプロフィール


Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
RSSリーダーで : Feed





アクセスランキング - 過去7日間

  1. 特許庁の基幹システム失敗の背景にある、日本に…
  2. 国内の開発者が使っている言語、1位C、2位V…
  3. 特許庁の基幹システムはなぜ失敗したのか。元内…
  4. 英国政府、新ポータルGov.ukをクラウド、…
  5. なぜ米ヒューレット・パッカードは、一挙に16…
  6. OpenFlowベンチャーのNicira N…
  7. ライアン・ダール氏、Node.jsの開発リー…
  8. フラッシュストレージが最大500TB! 米N…
  9. EMC、満を持してPCIe接続フラッシュスト…
  10. 2012年1月の人気記事「グーグルのバグ予測…
  11. マイクロソフトの責任者が語る「われわれはどの…
  12. 「絶対落ちないシステムを作れ」という要件に、…
  13. ソフトウェアテストの30年前と30年後(前編…
  14. ソフトウェアテストの近未来を話そう(前編)~…
  15. ソフトウェアテストの近未来を話そう(後編)~…

最新記事 10本

バックナンバー



アルファブロガー・アワード2010受賞 Publickeyはアルファブロガー・アワード 2010を受賞しました! いつもご愛読ありがとうございます。









blog comments powered by Disqus