'쓰라린 교훈(Bitter Lesson)'에 따라 인간의 사전지식을 체계적으로 제거하고 에이전트보다 훨씬 복잡한 '큰 세계'와의 상호작용에서 지능이 자연히 창발하도록 하는 것이 일반 적응 에이전트로 가는 가장 효과적인 길이라고 주장한다. 저자는 모바일 GUI를 그러한 세계의 실용적 대리물로 제시하고, 자율 강화학습을 위한 오픈소스 인프라 Darwin Mobile Agent를 도입한다. 병렬 클라우드폰 인스턴스에서 비동기 에이전트-환경 루프를 돌려 실세계 모바일 상호작용의 데이터 수집 병목을 해소한다. 또한 과제 커리큘럼, 결과 검증, 메모리 관리라는 세 축에서 인간 사전지식을 제거하는 개념적 로드맵을 제시하고, GUI 도메인 정책 최적화라는 첫 단계에 필요한 안정성·확장성을 검증했다.
- •모바일 GUI를 복잡한 '큰 세계'의 대리물로 삼는 자율 강화학습 오픈소스 인프라 Darwin Mobile Agent를 제안한다.
- •병렬 클라우드폰 인스턴스의 비동기 에이전트-환경 루프로 데이터 수집 병목을 해소한다.
- •과제 커리큘럼·결과 검증·메모리 관리에서 인간 사전지식을 제거하는 로드맵을 제시한다.
- •GUI 도메인 정책 최적화라는 로드맵 첫 단계의 안정성·확장성을 검증했다.
Darwin Mobile Agent: A Roadmap for Self-Evolution
본문 미리보기
arXiv:2606.20622v1 Announce Type: new Abstract: The goal of artificial intelligence is to create agents capable of general, adaptive behaviour in open-ended environments. Guided by the "Bitter Lesson", we argue that the most effective path toward this goal is to systematically remove human priors and allow intelligence to naturally emerge through interaction with a "Big World" that is orders of magnitude more complex than the agent itself. We propose the mobile Graphical User Interface (GUI) as
전체 내용이 궁금하다면?
원문을 직접 읽어보세요