[速報]「Amazon AI」として、画像認識/テキスト音声変換/音声認識と自然言語理解の3つを発表。AWS re:Invent 2016

2016年12月1日

Amazon Web Servicesは、ラスベガスで開幕した同社のイベント「AWS re:Invent 2016」で、「Amazon AI」傘下のサービスとして、画像認識、テキスト音声変換、音声認識と自然言語理解の3つを発表しました。

fig

「Amazon Rekognition」はイメージをAPIかSDK経由で渡すと、その画像に何が写っているのかを検出するサービス。

fig

例えばある画像を渡すと、女性が写っていること、自動車のハンドルを握っていること、写っている人の感情、メガネをかけているかどうか、といったさまざまなことを検出します。これを応用すると、大量の写真の中から、自動車を運転している女性の写真を選び出す、といったアプリケーションの開発が可能です。

fig

「Amazon Pollyは、テキストを音声に変換するサービス。

fig

テキストを渡すと、本物の人間のようにMP3のストリームとしてすぐさま音声を生成します。47の男女の音声バリエーションがあり、日本語を含む26の言語に対応。

fig

「Amazon Lex」は、音声認識と自然言語理解の機能を提供するサービス(Lexという名前は、Amazon Alexaの中身がこれで構築されているため)。

fig

音声やテキストによる対話的なアプリケーションの構築が可能になります。

fig

参考

AWS re:Invent 2016(Keynote #1 by Andy Jassy)

AWS re:Invent 2016(Keynote #2 by Werner Vogels)

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本