When Helping Hurts and How to Fix It: Multi-Agent Debate for Data Cleaning
- 1.다중 에이전트 데이터 정화
- 2.토론 방식 긍정/부정 효과
- 3.생성/분류 작업 영향 분석
왜 중요한가?
다중 에이전트 토론 방식이 데이터 정화 작업에서 항상 유익한 것은 아니라는 점을 밝혀내어, AI 협업 시스템 설계 시 성능 저하를 방지하고 최적의 효과를 얻기 위한 중요한 지침을 제공합니다.
본문 미리보기
arXiv:2606.02866v1 Announce Type: new Abstract: When does multi-agent debate help data cleaning, and when does it hurt? Across three benchmarks, four model families, and over 6,000 task-condition pairs, we find debate's effect reverses sign: it degrades generation across all four models (-1.6 to -15.5pp) through critique-induced confusion (CIC), hallucinated Critic feedback that the Generator accepts uncritically, yet improves error detection (+27.4pp F1, d=1.0). We derive a debate benefit cond
전체 내용이 궁금하다면?
원문을 직접 읽어보세요