A Three-Phase Foundation Model for Tax-Aware Personalized Portfolio Management
- 1.티커 종속·단일 목표·정적 사용자 모델 한계를 해결하는 3단계 강화학습 포트폴리오 관리 시스템 제안
- 2.1단계: 자기지도학습 교차자산 인코더에 T5 기반 시계열 파운데이션모델 Chronos를 게이팅 융합
- 3.2단계: MoE 포트폴리오 actor-critic를 6개 투자목표별 전문가 헤드와 PPO로 목표 조건부 학습
- 4.3단계: 76파라미터 LoRA로 실제 거래내역에서 투자 성향을 추론해 개인화
왜 중요한가?
기존 금융 RL이 공유하던 티커 고정·단일 목표·정적 사용자 모델 세 한계를 동시에 겨냥한다. 시계열 파운데이션 모델을 포트폴리오 관리 RL에 처음 적용하고, 설문 대신 실제 거래 행동에서 목표를 추론해 세금 인지형 개인화를 구현한 점이 새롭다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.30997v1 Announce Type: new Abstract: We present a three-phase deep reinforcement learning system for personalized portfolio management that addresses three limitations shared by all prior financial RL work: 1) ticker lock-in, 2) monolithic objectives , and 3) static user models. Phase 1 pretrains a ticker-identity-free cross asset encoder via self-supervised learning on a multi-asset corpus, augmented by a frozen parallel branch using Chronos, a T5-based time series foundation model,
전체 내용이 궁금하다면?
원문을 직접 읽어보세요