Amazon S3のデータを直接検索できる「MongoDB Atlas Data Lake」正式リリース。データベースへの転送不要、MongoDBのクエリ言語を直接実行

2020年6月11日

MongoDBは、Amazon S3に保存されているデータをそのままデータベースへ転送することなく、直接MongoDBのクエリ言語で検索可能にするクラウドサービス「MongoDB Atlas Data Lake」の正式リリースを発表しました

発表は同社がオンラインで開催したイベント「MongoDB.Live 2020」で行われました。

fig

通常、データベースで検索や分析の対象となるデータはデータベース内に保存されているデータであるため、ファイルサーバやオブジェクトストレージなどに保存されているJSONデータやCSVファイルなどは、何らかの方法でデータベースへインポートする必要があります。

MongoDB Atlas Data Lakeはこのインポートを不要にし、Amazon S3のバケット内に保存されているJSON、BSON、CSV、TSV、Avro、Parquetなどのフォーマットのファイルに対して、そのまま直接MongoDBの問い合わせ言語(MongoDB Query Language:MQL)で検索を行い、結果を得られるというクラウドサービスです。

fig MongoDB Atlas Data Lakeが発表された2019年のMongoDB World 2019のプレゼン資料から

設定は簡単で、Amazon S3のバケット名やAmazon IAMなどの情報をMongoDB Atlas Data Lakeに設定し、生成されるいくつかの構成ファイルを対象となるAmazon S3内に保存するだけです。

対象となるデータフォーマットは前述の通りで、このフォーマットのまま圧縮されていても対応します。

これにより、オブジェクトストレージからデータの複製や転送をすることなく、そのままデータレイクとして利用することが可能になります。

MongoDB.Live 2020

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本