적대적 멀티에이전트 게임에서 LLM 기반 코드 진화가 정체되는 문제를 해결하기 위해 FAMOU 프레임워크가 세 가지 메커니즘(평가자 공진화, 계층적 심층 평가, 약점 압력)을 제안했다. MCTF 2026 3v3 해상 깃발뺏기 과제에서 두 종류의 백본 LLM 모두에서 기존 베이스라인(OpenEvolve·ShinkaEvolve 계열)을 앞서, 최고 종합 점수 0.526과 미지의 상대에 대한 61.7% 승률을 기록했다. 진화 과정에서 시드 전략에 없던 선읽기 탐색·적응형 요격 같은 전술 구조가 자생적으로 생성됐고, AAMAS 2026 MCTF 대회 하드웨어 라운드로빈 1위·시뮬레이션 3위로 실제 이식성까지 입증했다. 코드 수준 진화가 적대적 환경에서도 비자명한 알고리즘 혁신을 만들 수 있음을 보여준다.
- •평가자 공진화·계층적 심층 평가·약점 압력 세 메커니즘으로 고정 평가자의 신뢰도 저하와 진화 정체를 해소
- •MCTF 2026 3v3 과제에서 종합 점수 0.526, 미지 상대 승률 61.7%로 두 백본 LLM 모두에서 베이스라인 능가
- •시드 전략에 없던 선읽기 탐색·적응형 요격 전술이 LLM 변이로 새로 출현
- •AAMAS 2026 MCTF 대회 하드웨어 라운드로빈 1위·시뮬레이션 3위로 실세계 전이성 검증
- •코드 수준 진화가 적대적 멀티에이전트 설정에서도 비자명한 알고리즘 혁신을 산출함을 입증
Beyond Static Evaluation: Co-Evolutionary Mechanisms for LLM-Driven Strategy Evolution in Adversarial Games
- 1.FAMOU, 적대적 게임용 평가자 공진화·계층적 심층평가·약점 압력 3개 메커니즘 제안
- 2.MCTF 2026 3v3 해상 CTF서 최고 종합점수 0.526·미지 상대 승률 61.7% 달성
- 3.LLM 변이가 시드에 없던 lookahead 탐색·적응형 요격 전술을 새로 생성
- 4.AAMAS 2026 MCTF 하드웨어 라운드로빈 1위·시뮬레이션 3위 입상
왜 중요한가?
전략이 향상될수록 고정 평가자가 무력화돼 진화가 정체되던 LLM 코드진화의 근본 한계를 평가자 공진화로 극복해, 적대적 멀티에이전트 환경에서도 비자명한 알고리즘 혁신이 가능함을 실제 대회 입상으로 검증했다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.10389v1 Announce Type: new Abstract: Recent advances in LLM-driven code evolution have enabled automated discovery by iteratively generating and improving programs. However, applying these methods to adversarial multi-agent games introduces a fundamental challenge: the evaluation landscape shifts as strategies improve, causing fixed evaluators to become unreliable and evolution to stagnate. We propose three mechanisms to address this challenge: evaluator co-evolution, which incorpora
전체 내용이 궁금하다면?
원문을 직접 읽어보세요