Google、TensorFlowベースの強化学習フレームワーク「Dopamine」(ドーパミン)、オープンソースで公開。脳の報酬系をインスパイヤ

2018年8月31日


機械学習のアルゴリズムのひとつである「強化学習」は、コンピュータが行動を選択した結果なんらかの報酬を得るとき、選択を繰り返していくなかでできるだけ多くの報酬を得るように学習していく、というものです。

この強化学習は、プロ囲碁棋士を破った初めてのコンピュータプログラムとなった「アルファ碁」で用いられたことで一気に注目されるようになりました。

Google Brainチームは、TensorFlowをベースにした強化学習のための新しいフレームワーク「Dopamine」(ドーパミン)をオープンソースで公開しました。

Dopamine

Dopamineは、下記のように脳の報酬系からインスパイヤを得たと説明されています。そしてドーパミンは人間にとっての報酬系である快感に関わる脳内物質のひとつとしてよく知られていますので、それにちなんでフレームワークの名前として採用されたようです。

Inspired by one of the main components in reward-motivated behaviour in the brain and reflecting the strong historical connection between neuroscience and reinforcement learning research, this platform aims to enable the kind of speculative research that can drive radical discoveries.

脳の報酬系の振る舞いの主要な要素にインスパイヤされ、また神経科学と教科学習の研究の歴史的な強い結びつきを反映して、このプラットフォームは大いなる発見を主導するような画期的な研究の実現を目指しています。

Dopamineが作られた背景には、これまでの強化学習フレームワークには柔軟性や安定性を両立させるようなフレームワークがなく、そのためにさまざまな強化学習をなんども繰り返して研究することが難しかったからだと説明されています。

そのため、Dopamineは簡単に試すことができ、柔軟に開発でき、コンパクトで高信頼、再現可能な以下の4つの特長を備えています。

また、新しいアイデアに対してベンチマークを取りやすいように、あらかじめベンチマーク用のデータも用意されています。

このエントリーをはてなブックマークに追加
follow us in feedly


≫次の記事
マイクロソフト、GoogleアカウントでWindowsやOffice 365へのシングルサインオンを可能に。Azure Active Directoryの新機能をプレビュー公開

≪前の記事
2017年の国内サーバOS市場、Windows Serverが52%、Linuxが24.8%。クラウドによりLinuxが高成長を維持。IDC Japan


カテゴリ



Blogger in Chief

photo of jniino Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed



新着記事 10本


PR - Books


fig

fig

fig