論文(ReaGAN: Node-as-Agent-Reasoning Graph Agentic Network)介紹了 ReaGAN,這是一個圖學習框架,將圖中的每個節點重新定義為具備規劃、推理和行動能力的自主智能體,透過凍結的大型語言模型來實現這些功能。
創新之處
ReaGAN 摒棄了傳統的靜態逐層訊息傳遞機制,實現了節點級別的自主性。每個節點能夠獨立決定是否從本地鄰居聚合資訊、檢索語義相似但距離較遠的節點,或者完全不採取行動。
優勢
這種節點-智能代理人抽象解決了圖學習中的兩個關鍵挑戰:(1) 處理節點資訊價值的差異性,以及 (2) 結合局部結構與全域語義資訊。
核心模組
每個節點在多步循環中運行,包含四個核心模組:記憶、規劃、行動和工具使用(RAG)。
節點從其記憶中建構自然語言提示,向凍結的大型語言模型(如 Qwen2-14B)查詢下一步行動,執行這些行動,並相應地更新其記憶。
記憶 –> 提示
ReaGAN 透過節點記憶建構提示:結合原始文本特徵、聚合的局部/全域摘要,以及選定的標註鄰居範例,使大型語言模型能夠基於豐富的多尺度個性化上下文來規劃行動或做出預測。
實驗結果
ReaGAN 在節點分類任務上表現出色,且無需任何微調。
在 Cora 和 Chameleon 等資料集上,儘管僅使用凍結的大型語言模型,其性能與傳統圖神經網路相當甚至更優,充分展現了結構化提示和基於檢索推理的強大威力。
消融實驗
智能代理人規劃機制和全域語義檢索兩者都至關重要。
移除其中任一組件(如強制固定行動計畫或禁用 RAG)都會導致準確度顯著下降,特別是在 Citeseer 等稀疏圖上表現更為明顯。