Meta、コード生成や解釈に特化した大規模言語モデル「Code Llama」公開

2023年8月28日

Metaは、コードもしくは自然言語によるプロンプトから、コードの生成およびコードに関する自然言語の説明を生成できる大規模言語モデル「Code Llama」を公開しました

fig

Code Llamaは、先月(2023年7月)にMetaが発表した大規模言語モデル「Llama 2」をベースに、コードに特化したデータセットでさらに訓練したバージョンだと説明されています。

対応するプログラミング言語はPython、C++、Java、PHP、JavaScript、Typescript、C#、Bashなどを始めとする主要な言語。

GPUで処理できるサイズやPython特化のモデルも

Code Llamaは3つのサイズ、7B、13B、34Bが提供されています。

7Bモデルは1つのGPUで処理できる一方で、34Bモデルは最善の結果を返し、より良いコーディング支援を可能にする能力があります。

一方、7Bおよび13Bモデルは高速に動作するため、リアルタイムコード補完のような低レイテンシを必要とするタスクに適しているなど、それぞれに適した用途が存在します。

さらに、Pythonの能力に特化してファインチューニングした「Code Llama - Python」および人間が自然言語で入力したプロンプトから何を期待しているのかをよりよく理解できるようにファインチューニングした「Code Llama - Instruct」も提供されます。

特有のライセンス条件に注意

Code LlamaはLlama本体と同じく研究目的や商業用途で利用可能なLlama 2 Community Licenseで提供されます。

ただし月間アクティブユーザーが7億人以上のサービスで利用する場合にはMetaから別途ライセンスを取得する必要があるなど、このライセンス特有の制限項目などがあるため、念のためライセンスを確認した上で利用されることをおすすめします。

Tags: 機械学習・AI Facebook

このエントリーをはてなブックマークに追加
ツイート
follow us in feedly





タグクラウド

クラウド / AWS / Azure / Google Cloud
コンテナ / Docker / Kubernetes
クラウドネイティブ / サーバレス
クラウド障害 / 運用・監視

プログラミング言語 / 開発ツール
JavaScript / Java / .NET / WebAssembly
HTML/CSS / Web標準

アジャイル開発 / スクラム / DevOps / CI/CD
ソフトウェアテスト・品質
ローコード/ノーコード開発

データベース / RDB / NoSQL / 機械学習・AI
Oracle Database / MySQL / PostgreSQL
Office / 業務アプリケーション

ネットワーク / HTTP / QUIC / セキュリティ
OS / Windows / Linux / VMware
ハードウェア / サーバ / ストレージ

業界動向 / 働き方 / 給与・年収
編集後記 / 殿堂入り / おもしろ

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本