ToolGate: Token-Efficient Pre-Call Control for Tool-Augmented Vision-Language Agents
- 1.비전-언어 에이전트 도구 효율화
- 2.불필요한 도구 호출 비용 절감
- 3.사전 호출 제어 문제 연구
왜 중요한가?
비전-언어 에이전트의 효율성과 비용 절감을 통해 실제 적용 가능성을 높여 AI 시스템의 실용성을 향상시킵니다.
본문 미리보기
arXiv:2606.03054v1 Announce Type: new Abstract: Tool-augmented vision-language agents can acquire external perceptual evidence through OCR, detection, segmentation, and other tools, but executing every proposed tool call is costly and sometimes unnecessary. We study the pre-call control problem: after a ReAct-style VLM agent proposes a perceptual tool call, should the call be executed, or skipped before its output enters the context? Across five benchmarks, we find that the baseline agent exhib
전체 내용이 궁금하다면?
원문을 직접 읽어보세요