다중 에이전트 토론은 LLM 신뢰성을 높이지만 고정된 토폴로지가 위치 편향, 비신뢰 에이전트 증폭, 역할 배정 민감성을 일으킨다. 이를 해결하기 위해 연속 토론 라운드마다 통신 역할과 희소 토폴로지를 동적으로 재구성하는 추론 시점 프로토콜 PEAR를 제안한다. 진화하는 에이전트 상태에 따라 역할 배정을 바꿔 특정 에이전트가 특권적 위치를 영구 점유하지 못하게 하고 영향력을 고르게 분산한다. PEAR는 에이전트 재라벨링에도 정확도를 보존하는 순열 등변 희소 라우터로 특성화되며, 네 추론 벤치마크와 여섯 LLM 백본에서 최강 토론 베이스라인 대비 평균 정확도를 유의하게 끌어올렸다.
- •토론 라운드마다 역할과 희소 토폴로지를 동적 재구성하는 추론 시점 프로토콜 PEAR를 제안한다.
- •역할 배정을 바꿔 위치 편향을 없애고 영향력을 고르게 분산한다.
- •에이전트 재라벨링에도 정확도를 보존하는 순열 등변 희소 라우터로 이론적으로 특성화했다.
- •네 벤치마크·여섯 LLM 백본에서 최강 토론 베이스라인 대비 평균 정확도를 유의하게 향상시켰다.
PEAR: Permutation-Equivariant Adaptive Routing Multi-Agent Debate
본문 미리보기
arXiv:2606.20621v1 Announce Type: new Abstract: Multi-agent debate improves the reliability of large language models (LLMs) through iterative peer critiques. However, fixed topologies often introduce persistent positional biases, amplify unreliable agents, and cause high sensitivity to role assignments. We introduce \textit{Permutation-Equivariant Adaptive Routing Multi-Agent Debate (PEAR)}, an inference-time protocol that dynamically reconfigures communication roles and sparse topologies acros
전체 내용이 궁금하다면?
원문을 직접 읽어보세요