PersonaDrive는 폐루프 주행 시뮬레이터의 비-ego 차량이 천편일률적으로 움직이는 한계를 해결하기 위해, 스타일 지시를 받은 인간 주행 시연을 검색해 비전-언어-행동(VLA) 주행 에이전트를 조건화하는 파이프라인이다. 참가자가 CARLA 경로를 공격적·중립·보수적 지시로 운전한 데이터를 활용하며, (i) 스타일별 트리플릿 마이닝, (ii) 동결된 시각 특징과 제어 인코더를 융합하는 경량 검색 헤드 학습, (iii) 검색된 맥락을 인컨텍스트 시연으로 쓰는 단일 VLA 백본 미세조정의 3단계로 구성된다. 추론 시 질의 대상 데이터베이스만 바꾸면 재학습 없이 스타일을 전환할 수 있다. Bench2Drive에서 스타일 없이도 SimLingo보다 4.6%, HiP-AD보다 2.5% 주행 점수가 높았고, 보수→공격 지시 전환 시 평균 속도·가속도가 각각 18%·25% 상승했다.
- •스타일 지시를 받은 인간 주행 시연을 검색해 VLA 주행 에이전트를 조건화하는 PersonaDrive
- •공격적·중립·보수적 지시로 운전한 드라이버-인-루프 데이터 활용
- •트리플릿 마이닝·경량 검색 헤드·VLA 미세조정 3단계 파이프라인
- •검색 대상 DB만 교체하면 재학습 없이 스타일 전환 가능
- •Bench2Drive에서 SimLingo 대비 4.6%·HiP-AD 대비 2.5% 주행 점수 개선
PersonaDrive: Human-Style Retrieval-Augmented VLA Agents for Closed-Loop Driving Simulation
- 1.스타일 지시 인간 주행 시연을 검색해 VLA 주행 에이전트를 조건화하는 PersonaDrive
- 2.공격적·중립·보수 스타일로 CARLA 주행한 인간 데이터로 트리플릿 마이닝
- 3.스타일별 DB 교체만으로 재학습 없이 주행 스타일 전환 가능
- 4.Bench2Drive에서 SimLingo 대비 주행 점수 4.6% 향상
왜 중요한가?
폐루프 주행 시뮬레이터의 획일적 교통 에이전트 문제를 실제 인간의 스타일별 시연 기반으로 재학습 없이 다양화해, 더 현실적이고 인간다운 비-에고 차량으로 시뮬레이션 환경을 개선한다.
🏷️ 언급 프로젝트
자율주행 기술 개발에 박차를 가하고 있는 국내 자동차 산업에서, 실제와 같은 폐쇄 루프 주행 시뮬레이션 환경 구축은 핵심 과제입니다. 'PersonaDrive'는 사람과 유사한 주행 스타일을 가진 AI 에이전트를 통해 더욱 다양하고 현실적인 교통 흐름을 생성하며, 국내 자율주행차의 안전성 검증 및 개발 효율성 향상에 크게 기여할 것입니다.
본문 미리보기
arXiv:2606.12616v1 Announce Type: new Abstract: Closed-loop driving simulators typically populate their environments with non-ego traffic agents that behave largely the same way, produced either by rule-based traffic managers or by learned models trained toward a single behavioral mode. Recent work introduces style variation through post-hoc labels on observational data or LLM-inferred reward weights, but these signals act as proxies for what a style should reward rather than demonstrations of
전체 내용이 궁금하다면?
원문을 직접 읽어보세요