速報!清華大学などが UltraRAG 2.0 をオープンソース化!性能が12%向上

検索拡張生成システム(RAG)は、初期の「検索+生成」の単純な結合から、適応的な知識構成や多段階推論を統合した複雑な知識システムへと進化しています(例:DeepResearch、Search-o1)。しかし、複雑さの増加は、開発者にとって高いエンジニアリング実装コストをもたらしています。

この課題に対応するため、清華大学THUNLPラボ、東北大学NEUIRラボ、OpenBMB、およびAI9Starsは UltraRAG 2.0 を共同で発表しました。これは、最小限のコードで多段階推論システムを迅速に実装することを可能にします。

01 RAG 2.0 の発展経緯

画像

02 RAG 2.0 の応用シナリオ

  • 医療分野では、RAG 2.0は患者の診療記録、画像データ、自己申告情報を迅速かつ包括的に分析し、個別化された治療提案を提供できます。これにより、医師の作業負担を軽減し、診断の正確性と患者満足度を向上させます。

  • 法律分野では、法令、判例、専門家の意見を統合することで、弁護士が関連する法的根拠を迅速に見つけるのを支援します。さらに、質の高い法的文書を生成し、人為的なミスを減らし、法務サービスの品質を向上させることができます。

  • 金融分野では、潜在的なリスクポイントを迅速に特定し、リスク評価レポートを作成し、対応するリスク管理の提案を提供できます。これにより、銀行のリスク管理レベルが向上し、顧客の信頼度が高まります。

03 RAG 2.0 の現在の課題

複雑な推論タスクにおける限定的な性能

マルチホップ推論や複雑な論理タスクにおいて、RAGによる生成結果の正確性には改善の余地があります。たとえば、複数の文書からの情報を統合する必要がある問題を処理する場合、情報統合が不十分になりがちです。

検索品質とノイズの問題

ベクトルデータベースへの依存は、関連文書を正確に検索できないことによる再現率や的中率の低下を引き起こす可能性があります。文書内の古くなった情報や不正確な情報がモデルを誤誘導し、生成内容に偏りを生じさせ、信頼性を低下させる可能性があります。

セキュリティとプライバシーの問題

RAGは外部知識ベースへのアクセスを必要とするため、機密データが関わる場合に、データのセキュリティとプライバシーをどのように確保するかが重要な課題です。

04 RAG 2.0 の先端論文推薦

1. From Local to Global: A GraphRAG Approach to Query-Focused Summarization

画像

【要点】本論文は、プライベートなテキストコーパスを対象とした質問応答のためのグラフベースのRAG手法を提案します。これは、実体知識グラフを構築し、コミュニティ要約を生成することで、ユーザーの質問に回答し、ユーザーの質問の広さとインデックス化された情報量に対応して拡張できます。

【手法】本論文では、LLMを用いてグラフベースのテキストインデックスを構築します。これは2つの段階を経て行われます。まず、ソースファイルから実体知識グラフが派生され、次に、密接に関連するすべての実体グループに対してコミュニティ要約が事前に生成されます。質問が提示された際、各コミュニティ要約が部分的な応答を生成するために使用され、その後、すべての部分的な応答が最終的な応答としてユーザーに提供されます。

【実験】100万トークン範囲のデータセットにおけるある種のグローバルな意味を持つタスクにおいて、このGraph RAG手法が、ナイーブなRAGベースラインと比較して、生成された回答の包括性と多様性の両方で大幅な改善を示すことを示しています。

2. Deep and Faithful Large Language Model Reasoning with Knowledge-guided Retrieval Augmented Generation

画像

【要点】本論文は、Think-on-Graph 2.0を提案します。これは、知識グラフと連携し、それをナビゲーションツールとして利用することで、情報収集と統合のためのRAGパラダイムを深化・洗練させた改良型の検索拡張生成フレームワークです。これにより、大規模言語モデルの応答の正確性と信頼性が向上し、ハイブリッド構造化知識システムがLLMの推論を大幅に推進する可能性を示しています。

【手法】Think-on-Graph 2.0フレームワークは、知識グラフによってガイドされる検索を通じて質問を調整し、グラフをナビゲーションとして利用することで、情報検索の深さと範囲を強化し、論理的な一貫性と意味的な類似性を確保します。

【実験】著者らは4つの公開データセットで広範な実験を実施し、その結果、Think-on-Graph 2.0手法がベースライン手法に対して優位性を持っていることが示されました。

メインタグ:検索拡張生成

サブタグ:RAGオープンソースAI研究大規模言語モデル (LLM)


前の記事:GoogleがCUA戦場に参入、Gemini 2.5 Computer Useを発表:AIがブラウザを直接操作可能に

次の記事:再帰的推論HRMモデルがさらなる進化!TRMの2層ネットワーク(7Mモデル)がLLMを凌駕!

短いURLをシェア