[LG]《Budget-AwareTool-UseEnablesEffec

爱生活爱珂珂 2025-11-25 10:54:28

[LG]《Budget-Aware Tool-Use Enables Effective Agent Scaling》T Liu, Z Wang, J Miao, I Hsu... [Google Cloud AI Research & Google DeepMind & UC Santa Barbara] (2025) 如何让具备外部工具调用能力的智能体,在受限预算下高效扩展?这篇论文《Budget-Aware Tool-Use Enables Effective Agent Scaling》给出了系统化答案。传统方法简单放宽工具调用次数限制,却常常陷入性能瓶颈,原因在于智能体缺乏“预算意识”,无法合理分配和利用有限资源。本文首次将测试时预算约束纳入分析框架,提出了统一的成本度量,综合计入模型推理token和工具调用的经济成本,为评估性能和成本的权衡提供了公平基准。核心创新包括:1. Budget Tracker:一个轻量级的插入模块,在推理流程中持续向智能体反馈当前预算状态,使其能够动态调整决策策略,避免盲目消耗资源。2. BATS(Budget-Aware Test-time Scaling):在Budget Tracker基础上,设计了一个预算感知的规划与自验证框架。它根据剩余预算灵活调整探索深度和路径选择,支持智能体在有限资源下“深挖有价值线索”或“果断转向备选方案”,极大提升工具调用效率和整体表现。3. 实验覆盖多模型、多数据集,验证BATS在多种预算水平下均显著优于传统ReAct等基线,在保持或降低成本的同时,性能有明显跃升,重塑成本-性能的帕累托前沿。研究启示:- 规模扩展不仅是“给你更多资源”,而是“教你如何智慧地花费每一分资源”。- 显式预算提示是跨任务、跨模型通用的简单而有效手段,能防止智能体过早停顿或无效尝试。- 结构化规划与策略性验证是突破性能天花板的关键,尤其在复杂多步、开放域的工具增强场景中。这项工作为未来构建高效、经济、可控的智能体系统奠定了理论和实践基础。它提醒我们:智能体的智慧,体现在对有限资源的精准感知和灵活调度上。详情请见原文:arxiv.org/abs/2511.17006

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注