[速報]Google、動画になにが映っているかを自動的に判断する「Video Intelligence API」発表。Google Cloud Next'17

2017年3月9日

Googleは米サンフランシスコでイベント「Google Cloud Next'17」を開催。1日目の基調講演で、動画を分析して、いつ、なにが映っているかを判断する「Video Intelligence API」を発表しました

動画になにが映っているかをコンピュータが自動的に判断する

Googleのチーフサイエンティスト Fei-Fei Li博士によると、動画をコンピュータに理解させることはこれまで何年ものあいだ大きな課題で、実際、画像研究者にとって動画はデジタルな世界のダークマター(暗黒物質)だとされてきた、と。

そうしたなかで、Googleは機械学習による新しいAPI「Video Intelligence API」を発表しました。

fig

Video Intelligence APIのライブデモでは、家の部屋、街角、犬、車庫などさまざまなシーンが収められた1本の動画をVideo Intelligence APIで分析。動画のどのシーンに何が映っているのかが示されました。

この画面では、動画の下に並ぶ青地のバーに「DOG」「BIRTHDAY CAKE」「CAR」など、動画に映っているエンティティの名称が並び、その横の赤い印は、動画のなかのどの部分にそのエンティティが映っているかを示しています。

fig

赤い部分をクリックすると、動画の該当部分が再生され、そのエンティティが映っているかどうかが確認できます。

次は、複数の動画を分析する例。大量の動画を保存している企業があると想定します。

fig

ここで検索窓に「baseball」と入力すると、野球のシーンが含まれている動画だけがリストアップされます。リストアップされるだけでなく、どの部分に野球のシーンがあるかも示してくれます。

fig

3本目に示された動画のように、全体のほんの一部にだけ野球のシーンがある動画もリストアップされます。いままで動画を何時間も見て人間が判断してきたことが、このAPIでわずか数秒でできるようになるのです。

Video Intelligence APIは今日から利用可能とのこと。

あわせて読みたい

機械学習・AI Google




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本