OPINE-World: Programmatic World Modeling with Ontology-error-Prioritized Interactive Exploration
- 1.상호작용에서 객체 중심 프로그램형 월드모델을 온라인 학습하는 OPINE-World 제안
- 2.행동 에이전트와 코드 합성 에이전트가 가설-검증 루프로 협력
- 3.'온톨로지 오류'라는 베이지안 척도로 탐색을 유도해 객체 유형 적합성 개선
- 4.ARC-AGI-3에서 게임별 학습 없이 25개 중 20개 해결, 행동효율 78.4 달성
왜 중요한가?
심층망 월드모델은 데이터 의존적이고 전이가 약한 반면, 프로그램 합성 모델은 픽셀 환경의 객체 구조를 유연히 가정하지 못했는데, OPINE-World는 온톨로지 오류로 탐색을 조종해 사전 학습 없이 ARC-AGI-3 대부분을 풀어냈다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2607.01531v1 Announce Type: new Abstract: Learning how an environment behaves from interaction is central to building agents that adapt to unfamiliar tasks. World models learned with deep networks are flexible but data-hungry and transfer poorly beyond their training distribution. Program-synthesized world models, written as source code by LLMs and refined through counterexample-guided inductive synthesis (CEGIS), are instead data-efficient and reusable, yet they have been demonstrated ma
전체 내용이 궁금하다면?
원문을 직접 읽어보세요