論文(ReaGAN: Node-as-Agent-Reasoning Graph Agentic Network)では、ReaGANが紹介されています。これはグラフ学習フレームワークであり、グラフ内の各ノードを、凍結された大規模言語モデルを介して計画、推論、および行動の能力を備えた自律エージェントとして再定義します。
イノベーション
ReaGANは、従来の静的な階層的メッセージ伝達メカニズムを放棄し、ノードレベルの自律性を実現しています。各ノードは、ローカルな近隣から情報を集約するか、意味的に類似しているが遠く離れたノードを検索するか、あるいはまったく行動しないかを独立して決定できます。
利点
このノードをエージェントと見なす抽象化は、グラフ学習における2つの主要な課題を解決します。(1) ノードの情報価値の多様性の処理、および (2) ローカルな構造情報とグローバルな意味情報の組み合わせです。
コアモジュール
各ノードは、記憶、計画、行動、およびツール使用(RAG)の4つのコアモジュールを含む多段階ループで動作します。
ノードは、その記憶から自然言語プロンプトを構築し、凍結された大規模言語モデル(例:Qwen2-14B)に次の行動を問い合わせ、これらの行動を実行し、それに応じて記憶を更新します。
記憶 –> プロンプト
ReaGANは、ノードの記憶を介してプロンプトを構築します。これは、元のテキスト特徴、集約されたローカル/グローバルな要約、および選択された注釈付きの近隣例を組み合わせることで、大規模言語モデルが豊富な多尺度かつパーソナライズされたコンテキストに基づいて行動を計画したり予測を行ったりできるようにします。
実験結果
ReaGANは、ファインチューニングを一切必要とせずに、ノード分類タスクで優れた性能を発揮します。
CoraやChameleonなどのデータセットにおいて、凍結された大規模言語モデルのみを使用しているにもかかわらず、その性能は従来のグラフニューラルネットワークと同等かそれ以上であり、構造化プロンプトと検索ベースの推論の強力な威力を十分に示しています。
アブレーションスタディ
エージェントの計画メカニズムとグローバルな意味検索の両方が非常に重要です。
いずれかのコンポーネント(例:固定された行動計画を強制するかRAGを無効にする)を削除すると、特にCiteseerのようなスパースグラフで精度が著しく低下します。