サイバーエージェントがAIアプリ「Dify」のベクトルDBとしてTiDBを選択。AIアプリの全社導入に耐えうる基盤を構築[PR]
生成AIを活用した業務の効率化が多くの企業にとって課題となりつつある中で、サイバーエージェントはITエンジニアではない従業員でも業務に役立つAIアプリケーションを作れる「Dify」と呼ばれるノーコードツールと、Difyで利用されるベクトル検索の基盤としてTiDBを採用し、企業全体で月間3000時間もの業務削減を実現したことを明らかにしました。
同社はなぜ社内の生成AI活用にDifyを選択したのか、そしてDifyの基盤として利用したベクトルデータベースも含むシステム構築をどのように行ったのかが、2025年9月20日と21日に都内で開催されたイベント「ServerlessDays Tokyo 2025」のセッション「3000時間/月の業務削減を実現する Dify x TiDB Cloud StarterによるAI基盤の裏側」で語られています。
その発表のポイントを紹介していきましょう。
生成AIの取り組みを会社の競争力へつなげていく
セッションに登壇したのは、サイバーエージェント AIオペレーション室の西悠之氏。

西氏が所属するAIオペレーション室は、全社横断的に生成AIの取り組みを加速させ、それを会社の競争力へつなげていくことをミッションとしています。
その取り組みとして成果を上げているのが「Dify」の導入です。DifyとはAIアプリケーションをノーコードで開発できるフレームワークであり、非ITエンジニアの従業員でも手軽に自身の業務に役立つAIアプリケーションが作れるサービスです。
DifyはSlackやExcel、Notionなどの外部ツールと連携可能で、PDFやMarkdownといった情報を取り込んでRAG(Retrieval Augmented Generation)を用いた検索が可能なため、業務などで蓄積した知識を活かした回答をAIから引き出すことができる機能などを備えています。

Difyの活用例として、例えばAmebaブログを運営するAMEBA LIFEでは、コメントの監視やSEOなどのこれまで人手に依存してきた業務を自動化できるようになったとのことです。
そしてこの例を始めDifyを社内で2000名弱の従業員が利用し、月間で3000時間の業務削減を実現しているとし、AIアプリケーションの活用が業務の効率化に結びついていることが示されました。
DifyのベクトルDBに求められる要件は
Difyのシステムを構築する上で想定されるユーザー数は、全社展開するために数千名から最大1万名以上の規模になり、アプリケーションを一人当たり10個ほど作成するとすると数万から数十万のアプリが作成される可能性があります。
すると数千から数万のアプリが同時に使われることが想定され、データ量として部署によっては数万以上のNotionの記事やドキュメントの情報を扱うことが想定されます。
つまり、全社展開を考えた際にベクトルDBに求められる性能要件としては、データ量の急激な増加(数千〜数万ファイルの追加/日)とRAG検索精度と速度を両立することにあります。
こうした想定を基に、DifyのバックエンドとなるベクトルDBの要件として主に以下の3つが定義されました。
セキュリティ
社内情報を扱うために、認証やアクセス制御、暗号化などのセキュリティ機能を備え、データが国内に保存され、データベースとの通信が閉域網でできること
大量データ対応
RAG活用では応答速度が直接ユーザー体験に影響するため、分散ストレージやシャーディング、インデックスなどを活用して検索速度が維持できること。データが増加しても低レイテンシを保てるようにしたい
コスト・運用効率
安定した性能を維持しつつ、コストパフォーマンスが高いこと。運用監視が容易で、少人数でも回せること
特に性能とコストパフォーマンスが高いことは重要だと西氏は強調しました。
ベクトルDBとしてTiDBを選択
Dify対応のベクトルDBは多数ありますが、そうした中から高負荷でも止まらず、なおかつ使っていないときには無駄なコストが発生しない、そうしたサーバレスなデータベースとして、スケール、コスト、検索機能、運用管理、そしてコストパフォーマンスなどの面で優れているという評価を得た「TiDB」(タイデービー)が選択されました。

TiDBはMySQL互換のデータベースであり、分散データベース機能による高いスケーラビリティと共に、オプションのTiFlashによる高速なアナリティクス処理、そしてベクトル検索機能などを備えています。
今回選択されたのは、開発元であるPingCAP社がTiDBをAWS上でサーバレスなフルマネージドデータベースとして提供する「TiDB Cloud Starter」でした。
60GB程度の容量で月額数千円程度に
西氏はTiDB Cloud Starterを実際に導入した運用実績について、60GB程度のデータ容量に対して料金が数千円程度で、非常にコストパフォーマンスが高いと評価しています。
特に、他のサーバレスデータベースでは使用していないときでも最低料金が発生するサービスがあることに触れ、TiDB Cloud Starterでは本当に使っていない時には料金が発生しない完全従量課金である点は推奨できるとしました。
またパフォーマンスでは、クエリ応答時間として特に大きな遅延もなく、ピーク時でも許容範囲以内の数値に。スロークエリの発生も少なく安定しています。
運用性もバージョンアップや構成変更による計画停止がなく、少人数のチームでも安定運用が実現できているとしました。

西氏はまとめとして、TiDB Cloud Starterはとにかくコストパフォーマンスが高いことを実感し、安定性と費用対効果の両立が可能となり、全社利用に耐えうる基盤を作ることができたとしました。
≫TiDB Cloud Starter | MySQL互換の分散型データベース | PingCAP株式会社
(本記事はPingCAP Japan提供のタイアップ記事です)
