LLM 에이전트가 웹 검색·딥 리서치 같은 장기 태스크 수행 시 누적 컨텍스트로 인한 성능 저하를 막기 위해, 동결된 에이전트의 컨텍스트를 외부 LLM이 강화학습으로 관리하는 AdaCoM(Adaptive Context Management) 프레임워크를 제안했다. 외부 모듈 구조로 클로즈드소스 에이전트에도 적용 가능하며, 웹 검색·딥 리서치 벤치마크에서 태스크 제약과 진행 정보를 보존하면서 오래된 내용을 제거해 성능을 대폭 향상시켰다. 학습된 전략은 '충실도-신뢰도 트레이드오프'를 드러내는데, 고성능 에이전트는 고충실도 컨텍스트 유지가 유리하고 저성능 에이전트는 공격적인 압축이 필요하다. 유사한 능력 수준의 에이전트 간 전이 학습이 가장 효과적이어서, 재사용 가능한 컨텍스트 매니저 개발의 실용적 경로를 제시한다.
- •AdaCoM은 에이전트 파라미터를 변경하지 않고 외부 LLM이 컨텍스트를 관리하므로 GPT 등 클로즈드소스 에이전트에도 적용 가능하다.
- •웹 검색·딥 리서치 벤치마크에서 태스크 제약과 진행 정보를 보존하면서 불필요한 컨텍스트를 제거해 성능을 크게 향상시켰다.
- •고성능 에이전트는 컨텍스트 충실도 유지가, 저성능 에이전트는 공격적 압축이 유리하다는 '충실도-신뢰도 트레이드오프'를 실증했다.
- •유사 능력 수준 에이전트 간 전이 학습이 가장 효과적으로 작동해 재사용 가능한 컨텍스트 매니저의 실용적 개발 경로를 제시한다.
Learning Agent-Compatible Context Management for Long-Horizon Tasks
- 1.동결된 LLM 에이전트의 장기 컨텍스트를 외부 LLM이 RL로 적응 관리하는 AdaCoM 프레임워크 제안
- 2.웹 검색·딥 리서치 벤치마크에서 태스크 제약 보존 및 불필요 콘텐츠 제거로 성능 실질적 향상
- 3.능력 계층별 Fidelity-Reliability Trade-off 발견: 고성능 에이전트는 충실도, 저성능은 공격적 압축이 유효
왜 중요한가?
클로즈드 소스 에이전트 포함 모든 동결 LLM에 적용 가능한 외부 컨텍스트 관리 접근법으로, 장기 태스크에서 발생하는 컨텍스트 성능 저하를 별도 재훈련 없이 완화한다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2605.30785v1 Announce Type: new Abstract: LLM agents increasingly face long-horizon tasks such as web search and deep research in real-world applications, where accumulated context can cause long-context degradation and reasoning failures. Prior work mitigates this through context management with agent-side context control or fixed strategies such as summarization, which require training the agent itself for adaptation - making it impractical for closed-source agents and ignoring that dif
전체 내용이 궁금하다면?
원문을 직접 읽어보세요