다중 에이전트 LLM 숙의(여러 라운드에 걸쳐 답을 교환·수정)가 추론과 정확도를 높이는 원리를 설명하기 위해, 각 에이전트가 이웃과 무관하게 자기 의견을 끌어당기는 숨은 내부 신념인 '앵커'를 가진 폐루프 동역학 시스템으로 모델링했다. DeGroot·Friedkin–Johnsen 같은 고전적 여론 동역학이 포착하는 군중 효과 외에 개별 내부 신념을 함께 반영한 것이 핵심이다. 이 앵커는 숙의 과정만으로 복원 가능하며, 고전적 합의 규칙이 금지하는 현상—정답에 대한 확신이 초기 신념들이 이루는 볼록껍질(convex hull)을 벗어나 어떤 에이전트의 출발점보다도 높아지는 것—을 설명한다. 세 개 오픈웨이트 모델 계열에서 앵커 영향력은 비슷하나 위치가 다르며, 앵커가 초기 의견에서 멀 때만 숙의가 껍질을 벗어나 완전한 폐루프 모델이 필요했다.
- •다중 에이전트 숙의를 숨은 내부 신념 '앵커'를 가진 폐루프 동역학 시스템으로 모델링
- •고전 여론 동역학(DeGroot·FJ)이 못 담는 개별 내부 신념을 반영
- •앵커는 숙의만으로 복원 가능하며, 확신이 초기 신념의 볼록껍질을 벗어나는 현상을 설명
- •복원한 앵커가 held-out 실행을 예측하는지로 모델 적합성을 검증하는 간단한 테스트 제시
- •오픈웨이트 3개 계열에서 앵커 영향력은 비슷하나 위치가 다르며, 멀 때만 폐루프 모델 필요
Hidden Anchors in Multi-Agent LLM Deliberation
본문 미리보기
arXiv:2606.19494v1 Announce Type: new Abstract: Multi-agent LLM deliberation, where agents exchange and revise answers over several rounds, is increasingly used to improve reasoning and accuracy, yet how and why it works is rarely modelled. Such deliberation mirrors how humans reach decisions. As social animals we are pulled both by the group, the herd effect that classical opinion-dynamics models such as DeGroot and Friedkin--Johnsen capture, and by our own internal belief, which they do not.
전체 내용이 궁금하다면?
원문을 직접 읽어보세요