news 2026/1/29 6:45:01

震惊!大模型多智能体检索新突破,Agent-as-a-Graph让系统效率提升18.6%!小白程序员也能上手的神仙架构!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
震惊!大模型多智能体检索新突破,Agent-as-a-Graph让系统效率提升18.6%!小白程序员也能上手的神仙架构!
https://arxiv.org/pdf/2511.18194agent-as-a-Graph: Knowledge Graph-Based Tool and Agent Retrieval for LLM Multi-Agent Systems

当前大语言模型多智能体系统面临的一个核心痛点:如何在成千上万个工具和智能体中,精准找到最适合当前任务的那一个?

  • Agent-Only检索(智能体导向)智能体描述往往无法覆盖其工具库的全部能力。
  • Tool-Only检索(工具导向)把每个工具当作独立个体。这忽略了工具间的协同效应

Figure 1: 传统方法与Agent-as-Graph对比

传统方法要么只能看到"智能体层面",要么只能看到"工具层面",无法在统一空间中进行权衡。

💡 二、把智能体和工具都变成图谱节点

核心思想:Agent-as-a-Graph

研究团队的天才之处在于:不再把智能体和工具看作两个独立层级,而是将它们作为平等节点放入知识图谱

整个系统被建模为一个**二分图 G = (Agents, Tools, Edges)**:

  • 智能体节点(𝒜):包含智能体名称和描述
  • 工具节点(𝒯):包含工具名称和描述
  • 所有权边(E):明确连接每个工具到其父智能体

这种方法一举三得:

  1. 细粒度匹配:工具节点保留了具体功能描述
  2. 上下文保留:通过图遍历总能回到父智能体
  3. 统一检索:在同一个向量空间中对齐两种节点

三步检索流程(Algorithm 1)

Algorithm 1: Agent-as-a-Graph检索算法

第一步:向量初筛对查询q,从工具库𝒞ₜ和智能体库𝒞ₐ中分别检索Top-N候选(N ≫ K),得到两个初始列表。

第二步:类型加权RRF融合这是论文的神来之笔!传统RRF对所有结果一视同仁,但论文提出按节点类型加权的RRF(wRRF)

α(工具节点)α(智能体节点)

其中α_𝒜和α_𝒯是两个可解释旋钮,允许你手动调优智能体覆盖度与工具精度的平衡!这种方式既保留了RRF的鲁棒性,又引入了对异构节点的灵活控制。

第三步:图遍历聚合从融合后的列表中逐个取出节点,如果是工具则通过owner(e)函数找到其父智能体,最终聚合出Top-K个可执行智能体。

📊 三、效果显著且架构通用

基准测试结果(Table 1)

Table 1: LiveMCPBench基准对比

使用OpenAI text-embedding-ada-002模型的结果显示:

  • Recall@5达到0.83,比之前的SOTA(MCPZero)提升18.6%
  • nDCG@5达到0.46,显著高于其他基线
  • 超过39%的检索结果来自智能体节点,34%通过工具边追溯获得,证明两类节点都不可或缺

跨模型泛化能力(Table 2)

Table 2: 不同嵌入模型的性能对比

最令人振奋的是,这个方案不挑Embedding模型!在8种完全不同的嵌入架构上测试(从谷歌Vertex AI、亚马逊Titan到OpenAI和开源的All-MiniLM-L6-v2):

  • 平均Recall@5:0.85 vs 0.70(提升19.4%)
  • 标准差仅0.02,性能波动极小
  • 甚至在小模型All-MiniLM-L6-v2上也提升了19.4%

这说明改进来自图谱结构本身,而非特定向量表示,对生产部署极其友好!

类型权重调优(Figure 2 & Table 3)

Table 3: 加权RRF配置对比

Figure 2: 不同类型权重配置的性能曲线

通过网格搜索发现:

  • 最优比例:α_𝒜:α_𝒯 = 1.5:1(智能体权重稍高)
  • 极端偏向会损害性能(3:1智能体偏重导致Recall降至0.76)
  • 相比标准加权RRF,类型特定权重设计额外提升2.41%

这种可解释、可手动调优的特性,让运维人员能根据领域特点灵活调整,无需重新训练模型。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/26 6:57:18

SSM学生谈话管理系统2j3ws(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面

系统程序文件列表系统项目功能:学生,谈话内容,解决方案,教师SSM学生谈话管理系统开题报告一、课题研究背景与意义(一)研究背景在高校教育管理工作中,教师与学生的谈话是掌握学生思想动态、解决学生学习生活难题、强化师生沟通的重…

作者头像 李华
网站建设 2026/1/25 17:36:12

ACL 2025 新方法 MoC,重新定义文本分块与评估

来自中国人民大学、上海IAAR研究院的团队在ACL 2025上提出的MoC(Mixtures of Text Chunking Learners)框架,不仅创新性地解决了分块质量评估难题,更实现了计算效率与分块精度的最优平衡,为RAG系统性能提升提供了全新思…

作者头像 李华
网站建设 2026/1/25 17:39:25

力扣热题100 11. 盛最多水的容器

前提提要:看懂题目很重要,看懂题目之后就很简单了,用简单的写法先写一遍,超时了然后换思路,如果不会赶紧看题解。题目出的跟数学题一样,忍不住爆粗口… 给定一个长度为 n 的整数数组 height 。有 n 条垂线,…

作者头像 李华
网站建设 2026/1/26 17:50:55

Windows版本的Dify平台搭建

Windows版本基于Docker的Dify平台搭建 1:名词解释 1.1:Hyper-V Hyper-V 是微软提供的 **Type-1(裸机型)虚拟化技术**,可在一台物理计算机上同时运行多个相互隔离的虚拟机。每个虚拟机拥有独立的操作系统和虚拟硬件资源,通过虚拟…

作者头像 李华
网站建设 2026/1/25 3:50:31

企业微信API开发:外部群主动推送场景

​ QiWe开放平台 开发者名片 API驱动企微自动化,让开发更高效 核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景 官方站点:https://www.qiweapi.com 团队定位:专注企微API生…

作者头像 李华
网站建设 2026/1/27 15:58:28

图像增强与去雾:常用算法集合及Matlab实现

图像增强,图像去雾,常用算法集合,Matlab实现。 包括:直方图算法,Retinex系列算法(SSR,MSR,MSRCR),暗通道先验算法。 代码都已调试好,可直接输入图…

作者头像 李华