R2D-RL: A RoboCup 2D Soccer Environment for Multi-Agent Reinforcement Learning
- 1.R2D-RL: RoboCup 2D 축구 시뮬레이션을 파이썬 MARL 인터페이스와 연결한 강화학습 환경
- 2.RCSS2D와 HELIOS 클라이언트를 공유 메모리·사이클 동기화로 연결
- 3.이산·하이브리드 행동공간, 행동 마스크, EPV 기반 보상 설계, 병렬 실행 지원
- 4.전방 골 시나리오와 11대11 풀필드 벤치마크 및 기준 결과 제공
왜 중요한가?
부분 관측·협력과 적대·희소 보상·장기 전술을 결합한 로봇 축구를, 경쟁용 서버-클라이언트 구조 탓에 현대 파이썬 MARL 워크플로에 쓰기 어렵던 문제를 풀어 표준 연구 환경으로 제공한다.
본문 미리보기
arXiv:2606.18786v1 Announce Type: new Abstract: Robot soccer is a challenging testbed for multi-agent reinforcement learning because it combines partial observability, cooperative and adversarial interaction, sparse rewards, and long-horizon tactical behavior. RoboCup 2D Soccer Simulation (RCSS2D) provides a mature robot-soccer platform, but its competition-oriented server-client architecture is difficult to use directly with modern Python-based MARL workflows. We introduce R2D-RL, a reinforcem
전체 내용이 궁금하다면?
원문을 직접 읽어보세요