LLM 에이전트의 계획-실행 불일치를 해결하기 위해 궤적을 환경 상호작용을 통해 반복 정제하는 자기지도 프레임워크 PIVOT을 제안합니다. PLAN, INSPECT, EVOLVE, VERIFY 4단계와 단조 수용 과정으로 비감소 솔루션 품질을 보장합니다. DeepPlanning과 GAIA에서 인간 피드백 포함 시 제약 만족도 최대 94% 상대적 향상을 달성하며 경쟁 방법 대비 3~5배 적은 토큰을 사용합니다.
- •PIVOT은 궤적을 최적화 가능한 객체로 다루어 환경 상호작용을 통해 반복 정제하는 자기지도 프레임워크입니다.
- •PLAN→INSPECT→EVOLVE→VERIFY 4단계로 계획-실행 불일치를 체계적으로 해소합니다.
- •단조 수용 과정으로 비감소 솔루션 품질을 보장합니다.
- •인간 피드백 포함 시 제약 만족도 최대 94% 향상, 경쟁 방법 대비 3~5배 적은 토큰을 사용합니다.
PIVOT: Bridging Planning and Execution in LLM Agents via Trajectory Refinement
본문 미리보기
arXiv:2605.11225v1 Announce Type: new Abstract: Large language model (LLM)-based agents frequently generate seemingly coherent plans that fail upon execution due to infeasible actions, constraint violations, and compounding errors over extended horizons. PIVOT (Plan-Inspect-eVOlve Trajectories) addresses this plan-execution misalignment through a self-supervised framework that treats trajectories as optimizable objects iteratively refined via environment interaction. The framework comprises fou
전체 내용이 궁금하다면?
원문을 직접 읽어보세요