GeminiにPDFやWord、Excel、テキストファイルなどの検索機能を組み込める「File Search in Gemini API」提供開始、フルマネージドなRAGシステムを提供
Google Cloudは、同社の生成AIサービスであるGeminiに、PDFやWord、Excel、テキストファイルなどのさまざまなファイル形式を読み込ませて検索可能にするフルマネージドなRAGシステム「File Search in Gemini API」の提供開始を発表しました。

Geminiのような生成AIを企業内で活用するとき、Geminiに社内のドキュメントなどを読み込ませることで社内固有の質問に関してもGeminiが回答できるようになります。
このときによく使われるのがRAG(Retrieval-Augmented Generation)と呼ばれる手法です。
しかしRAGのためのシステムを構築するには、RAG構築のためのサービスやベクトルデータベースなどを用意し、必要に応じて前処理やプログラミングなどを行い、Geminiなどの生成AIと組み合わせるなどの作業が求められます。
File Search in Gemini API
今回発表された「File Search in Gemini API」は、外部サービスなどを組み合わせることなくAPIを操作するだけでGeminiに対応したRAGを構築できるというものです。
具体的にはAPIを通じてまず検索対象となるファイルを保存する「ファイル検索ストア」を作成し、そこにファイルをアップロードします。
そのファイル検索ストアにファイルをアップロードすると、自動的にチャンク化され、ファイル検索エンベディングに変換されて、インデックスが作成されます。
アップロードしたファイル自体は48時間後に削除されます。
そしてファイル検索ツールファイル検索ストアを指定することにより、Geminiが指定されたファイル検索ストアでセマンティック検索を実行し、情報を見つけられるようになります。
検索結果にはアップロードしたドキュメントのどの部分が回答の生成に使用されたかが示される引用情報が含まれることがあります。これによりファクトチェックが可能になります。
現時点でサポートされているGeminiのモデルは「gemini-2.5-pro」と「gemini-2.5-flash」の2つ。
対応する主なファイルフォーマットはPDF、Word、Excel、ECMAScript/JavaScript、JSON、Latex、HTML、Markdown、RTF、プレーンテキストなどです。
