GeminiにPDFやWord、Excel、テキストファイルなどの検索機能を組み込める「File Search in Gemini API」提供開始、フルマネージドなRAGシステムを提供

2025年11月10日

Google Cloudは、同社の生成AIサービスであるGeminiに、PDFやWord、Excel、テキストファイルなどのさまざまなファイル形式を読み込ませて検索可能にするフルマネージドなRAGシステム「File Search in Gemini API」の提供開始を発表しました

fig

Geminiのような生成AIを企業内で活用するとき、Geminiに社内のドキュメントなどを読み込ませることで社内固有の質問に関してもGeminiが回答できるようになります。

このときによく使われるのがRAG(Retrieval-Augmented Generation)と呼ばれる手法です。

しかしRAGのためのシステムを構築するには、RAG構築のためのサービスやベクトルデータベースなどを用意し、必要に応じて前処理やプログラミングなどを行い、Geminiなどの生成AIと組み合わせるなどの作業が求められます。

File Search in Gemini API

今回発表された「File Search in Gemini API」は、外部サービスなどを組み合わせることなくAPIを操作するだけでGeminiに対応したRAGを構築できるというものです。

具体的にはAPIを通じてまず検索対象となるファイルを保存する「ファイル検索ストア」を作成し、そこにファイルをアップロードします。

そのファイル検索ストアにファイルをアップロードすると、自動的にチャンク化され、ファイル検索エンベディングに変換されて、インデックスが作成されます。

アップロードしたファイル自体は48時間後に削除されます。

そしてファイル検索ツールファイル検索ストアを指定することにより、Geminiが指定されたファイル検索ストアでセマンティック検索を実行し、情報を見つけられるようになります。

検索結果にはアップロードしたドキュメントのどの部分が回答の生成に使用されたかが示される引用情報が含まれることがあります。これによりファクトチェックが可能になります。

現時点でサポートされているGeminiのモデルは「gemini-2.5-pro」と「gemini-2.5-flash」の2つ。

対応する主なファイルフォーマットはPDF、Word、Excel、ECMAScript/JavaScript、JSON、Latex、HTML、Markdown、RTF、プレーンテキストなどです。

あわせて読みたい

Google Cloud クラウド 機械学習・AI 開発ツール




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本