인간 협력 진화를 통해 다양한 이미지를 생성했던 Picbreeder를 최신 비전-언어 모델(VLM)로 대체 복제해 AI의 개방형 창의적 탐색 능력을 평가했다. VLM의 출력은 인간 기준선과 명확한 질적 차이를 보였으며, 계통발생 복잡도·시각적·의미적 현저성·참신성 지표로 이를 정량화했다. 탐색 노이즈, 에이전트 간 행동 다양성, 과거 행동 기억을 통한 서사 모멘텀이 결과에 미치는 영향을 체계적으로 분석했다. 이 연구는 AI 시스템이 아직 인간 수준의 비유도 개방형 발견 능력을 갖추지 못함을 시사한다.
- •Picbreeder를 VLM으로 복제한 결과, 인간 대비 명확한 질적 차이를 계통발생 복잡도·시각·의미 참신성 지표로 정량화.
- •탐색 노이즈, 에이전트 간 행동 다양성, 서사 모멘팀(과거 행동 기억)이 VLM 개방형 탐색 결과에 미치는 영향을 체계적으로 분석.
- •AI 시스템이 아직 인간 수준의 비유도 개방형 창의적 발견 능력을 충분히 갖추지 못함을 실증.
In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models
- 1.Picbreeder(인간 협업 이미지 진화 탐색)를 프론티어 VLM으로 복제, 인간 기준 대비 명확한 질적 차이 관찰
- 2.계통 복잡성·시각적·의미적 참신성 메트릭으로 VLM 출력과 인간 기준 차이 정량화
- 3.탐색 노이즈·에이전트 행동 다양성·기억 기반 내러티브 모멘텀 추가로 차이 원인 분석 시도
왜 중요한가?
프론티어 VLM이 인간 수준의 열린 탐색(open-ended search)을 아직 재현하지 못함을 구체적 메트릭으로 실증, AGI·창의적 AI 연구의 현 한계와 향후 과제를 명확히 제시한다.
본문 미리보기
arXiv:2605.23908v1 Announce Type: new Abstract: We are in the midst of large-scale industrial and academic efforts to automate the processes of scientific, technological and creative production through AI-driven assistants. Historically, a fundamental property of these processes in their human form has been their open-endedness: their capacity for generating a seemingly endless supply of novel and meaningful new forms. Do artificial agents have any capacity for such fruitful unguided discovery?
전체 내용이 궁금하다면?
원문을 직접 읽어보세요