AWSとFacebookが機械学習「PyTorch」で協力。「TorchServe」と「TorchElastic」をオープンソースでリリース

2020年4月23日

機械学習ライブラリ「PyTorch」の開発チームは、PyTorch 1.5のリリースと同時に、AWSとFacebookが協力して開発した新たなライブラリ「TorchServe」と「TorchElastic」を発表しましたAWSによる発表)。

PyTorchはFacebookのAIリサーチラボが開発した、Python言語によるオープンソースの機械学習ライブラリです。世の中にある機械学習ライブラリのなかでも、もっとも人気があるものの1つといえます。

TorchServeとTorchElasticは、PyTorchをクラウドやKubernetesで活用するためのソフトウェアです。

TorchServe:PyTorchのモデルを迅速に本番環境で実行

TorchServeは、PyTorchのモデルをカスタムコードなどを書かなくともそのまますぐに本番環境で実行できるというもの。

一般的な用途であるオブジェクトの検出やテキストの分類用のデフォルトハンドラーに加え、マルチモデルサービング、A/Bテストのためのモデルバージョニング、メトリクスによるモニタリング、アプリケーションと統合するためのRESTfulエンドポイントなども備えています。

AWS上ではEC2やAmazon SageMakerなどで実行可能と説明されています。

TorchElastic:スケーラブルでフォールトトレラントな実行

TorchElasticは、PyTorchのトレーニングを分散環境においてフォールトトレラントかつスケーラブルに実行できるようにするソフトウェア。

これまでの分散トレーニングは、フォールトトレラントではなく、またノードの追加などスケールの変更に対してはリスタートが必要であり、TorchElasticはこうした課題に対応するものだと説明されています。

TorchElasticはKubernetesに対応しており、Amazon EKSのようなKubernetes環境で分散トレーニングが実行できるようになります。

TorchServeおよびTorchElasticともにまだ実験的実装の段階であり、今後さらに開発が進められていくことになります。

このエントリーをはてなブックマークに追加
follow us in feedly




カテゴリ

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed


最新記事10本