IBM TechXchange watsonx Japan User Group

下記をはじめとしたIBM Watson製品に関する技術情報の発信・共有、ご質問、意見交換、イベント案内、技術者同士の交流を目的としています。Watson Speech to Text /Text to Speech ・Watson Assistant ・Watson Discovery ・Watson NLU/NLP ・watsonx


#IBMWatsonDiscovery
#IBMWatsonTexttoSpeech
#IBMWatsonNaturalLanguageUnderstanding
#IBMWatsonSpeechtoText
#IBMwatsonx
#Japan
#IBMWatsonAssistant
#IBMWatsonNaturalLanguageProcessing
#AsiaPacific
#watsonx.ai
#watsonx
#japan
 View Only

RAG構築を自動で最適化するAutoAI

By Anju Muraoka posted Thu March 20, 2025 11:03 PM

  

はじめに

情報の爆発的な増加に伴い、膨大なデータの中から必要な情報を迅速かつ的確に検索・活用することが求められています。こうした課題を解決する技術として注目されているのが、Retrieval-Augmented Generation(RAG)です。RAGは、従来の検索システムと生成AIを組み合わせることで、単なる情報取得を超えた高度な回答生成を可能にし、企業のナレッジ管理や業務効率の向上に大きな可能性をもたらします。

AutoAIを活用したRAGの自動化について簡潔にご紹介します。

AutoAIとは

AutoAIは、AutoML(自動機械学習)の概念をさらに拡張し、AIモデルの構築からデプロイ、運用までのエンドツーエンドのフローを自動化する技術です。AutoMLは主に機械学習モデルの構築やハイパーパラメーターの最適化などのプロセスを自動化しますが、AutoAIはその範囲をAIライフサイクル全体に広げ、より包括的な自動化を実現します。

AutoMLと同様に、AutoAIは予測機械学習モデルの構築においてインテリジェントな自動化を適用します。これには以下のステップが含まれます。

  • トレーニング用データの準備

  • データに最適なモデルの種類の選択(分類モデルや回帰モデルなど)

  • 問題解決に適したデータ列(フィーチャー)の選択

  • 複数のモデル候補の生成と、精度や正確度に基づくランク付け

  • 最適なハイパーパラメーターのテストと調整

  • 最も性能の高いモデルの本番環境への適用

  • モデルが学習した内容をもとにした予測の提供

参考資料:IBM AutoAI

AutoAIによるRAGの自動化

AutoAIのRAG対応の一般利用は2025年1月23日に可能となりました。

参考資料:RAG実験における AutoAI の一般利用可能

AutoAI RAGの実行画面

AutoAI RAGはIBM watsonx上とJupyter Notebookなどの総合開発環境(IDE)の2つの方法で実行することが可能です。出力結果は、入力した文書と質問解答例に最も適切であると判断されたパターンが表示され、推奨されるパターン数はユーザー側で指定することが可能です。特に、IBM watsonx上では容易に検索と生成の設定(最初に開いた時に表示されるデフォルト設定)・インデックス作成設定・追加情報の設定などの細かい設定をすることが可能です。

今回サンプルとして使用した文書に対してのwatsonx上の出力結果を以下に添付します。

回答の忠実さ・回答の正確さ・コンテキストの正確さの3項目からのランク基準を選択可能で、下の画面は回答の正確さを選択した際の推奨モデルはmixtral-8x7b-instruct-v01であり、推奨される詳細設定も表示されています。(図1)

また、パターン比較のタブを押すと、どのモデルがどの基準(回答の忠実さ・回答の正確さ・コンテキストの正確さ)でどれくらいの優位性があるのかを視覚的に確認することができます。(図2)

↑ (図1)

↑ (図2)

Jupyter Notebook でもAutoAI RAGの実行結果を表示することは可能です。

AutoAIがRAG開発にもたらす価値

  • RAGの設定を自動化
    → モデル選択やデータの分割、検索設定を自動で行い、最適なRAG構成を短時間で見つけます。

  • 正確な回答を保証する評価機能
    → RAGのパフォーマンスを測る指標やテストツールを活用し、質の高い回答を提供します。

  • ハイパーパラメーターの最適化
    → さまざまな設定を自動で調整し、最も良い結果を出せるRAGの構成を見つけます。

  • RAGパイプライン全体の自動化
    → 生成AIと情報検索を組み合わせたRAGのワークフローをスムーズに構築・運用可能にします。

AutoAIを用いたRAGの最適化・導入について

  • RAG開発の時間短縮
    → RAGシステムの開発期間を数カ月から数日に短縮し、データ品質を維持しながら効率的に構築できるようにします。

  • パイプラインのテストと評価
    → さまざまなRAGの構成を試し、正確性や信頼性を基準にランク付けして、最も優れた設定を特定・改善します。

  • スムーズな導入
    → データセットを整理するための「インデックス作成パイプライン」と、RAGの推論を行う「RAG推論パイプライン」の2つを用意し、本番環境への統合を簡単にします。

  • 直感的に使える実験環境
    → 開発者は、直感的なワークフローの中で、実験をすばやく定義し、データセットをアップロードし、パイプラインのパフォーマンスをテストできます。

AutoAI × RAG 活用ユースケース

RAGシステムを導入をご検討の方全てにお勧めできる技術です。

具体的に以下のユースケースが考えられます。

1. 社内ナレッジ検索の高度化
社内ドキュメントやFAQから最適な回答を即座に提示。新人教育や情報共有の効率化を実現します。

2. カスタマーサポートの自動化
顧客からの問い合わせに対し、RAGがリアルタイムで適切な回答を生成。対応時間を短縮し、サポート品質を向上させます。

3. 法務・コンプライアンスチェック
契約書や法規データベースをもとに、RAGが適用法令やリスクを自動で抽出・整理。法務業務を効率化し、リスク管理を強化します。

4. 研究・技術文献の要約と検索
膨大な技術論文や特許データを分析し、RAGが最適な情報を要約・提供。研究開発のスピードを加速します。

5. 医療・診断支援システム
医師が過去の診療データや論文を検索する際に、RAGが症例に基づいた最適な診断情報を提示。医療の質と効率を向上させます。

6. 金融市場分析とレポート生成
市場データやニュースを統合し、RAGが投資判断に役立つインサイトを自動生成。金融機関のリサーチ業務を強化します。

7. マーケティング・広告戦略の最適化
顧客の行動データや過去のキャンペーン情報を分析し、RAGがターゲットに最適な広告コピーや戦略を提案。広告のROIを最大化します。

※上記で提示したユースケースはあくまで参考例であり、実際に検証済みの事例ではございません。ご了承のほどよろしくお願いいたします。

AutoAI RAGの利用可能プランについて

AutoAI RAGはすべてのプランでご利用いただけますが、AutoAIは1時間あたり20CUHを消費するため、Liteプランでは1時間の利用で制限の20CUHに達してしまいます。そのため、継続的にご利用いただくには、EssentialプランまたはStandardプランを選択いただくのが現実的です。これらのプランでは、より多くのCUHが割り当てられているため、安定した運用や検証が可能です。

詳細情報、それぞれのプランの料金については以下をご覧ください。

参考資料:watsonx.aiランタイムプラン詳細資産タイプ別CUH消費率プラン料金

まとめ

AutoAIを活用することで、RAGの構築、評価、最適化を自動化し、短期間で最適な設定を見つけることができます。これにより、RAGシステムの開発期間を大幅に短縮し、高品質な回答を提供する環境を整えられます。

もしこの記事を通してAutoAI RAGについて興味を持っていただけましたら、試用版もご利用いただけますので、ぜひご体験ください。

また、3月26日(水) 16:00~17:00 @オンライン でIBM watsonx.aiの最新情報をお届けするオンラインセミナーが開催されます。このセミナー内でもAutoAI RAGについてより詳しくご紹介する予定ですので、ぜひご参加ください。

オンラインセミナーについて:https://community.ibm.com/community/user/watsonx/events/event-description?CalendarEventKey=c5d3ef5d-69b5-48ee-bc2a-01958579625e&CommunityKey=eb449c0f-27c1-4223-bbd7-01874dfe4714&Home=%2fcommunity%2fuser%2fai-datascience%2fcommunities%2fglobalgrouphome

オンラインセミナー参加登録はこちらから→https://events.teams.microsoft.com/event/cee5ab03-1752-4924-8a61-121f67570412@fcf67057-50c9-4ad4-98f3-ffca64add9e9

0 comments
13 views

Permalink