What Must Generalist Agents Remember?
- 1.범용 에이전트가 여러 환경에서 근사 최적으로 행동하려면 무엇을 기억해야 하는가를 형식화
- 2.관측 병목을 공유하면서 최적 행동이 충돌하면 메모리 분포가 달라져야 함을 증명
- 3.분리 정리: 충분히 성공적인 에이전트는 현재 관측만으로는 불충분하고 메모리가 필수
- 4.메모리가 관련 목표 가치를 추정할 정보를 담으면 국소 전이 동역학 재구성 가능
왜 중요한가?
범용 에이전트가 현재 상태 관측만으로는 도메인을 구분할 수 없고, 메모리가 도메인 식별·전이모델 재구성·계획의 기반임을 이론적으로 규명해 일반화 에이전트 설계의 원칙을 제시한다.
본문 미리보기
arXiv:2606.18746v1 Announce Type: new Abstract: This paper develops a formal account of what generalist agents must store in memory in order to act near-optimally across multiple environments and goals. It shows that when two domains share an observational bottleneck but require incompatible optimal actions, any uniformly near-optimal policy must induce distinct memory distributions at that bottleneck. The result yields a separation theorem: sufficiently successful agents cannot rely only on cu
전체 내용이 궁금하다면?
원문을 직접 읽어보세요