OpenFinGym: A Verifiable Multi-Task Gym Environment for Evaluating Quant Agents
- 1.예측·전략·리스크·트레이딩을 단일 인터페이스로 평가하는 OpenFinGym 환경 공개
- 2.예측·시장생성·실시간 거래·사기탐지를 통합 실행·검증 인터페이스로 다룸
- 3.정량금융 논문을 실행 가능한 과제 패키지로 변환하는 자동 구축 파이프라인 제공
- 4.컨테이너 런타임·호스트측 검증기로 학습-테스트 누출 방지, SFT·RL 후학습 통합
왜 중요한가?
기존 정량금융 에이전트 평가가 단일 과제에 흩어져 역량을 과대평가하던 문제를, 다단계·실시장 상호작용을 포괄하는 통합 벤치마크로 보완해 금융 에이전트 개발의 표준 평가 기반을 제시한다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.26350v1 Announce Type: new Abstract: Although large language model agents are increasingly applied to quantitative-finance workflows, their evaluation remains fragmented across isolated tasks, while the financial relevance of benchmark tasks is often overlooked. Yet financial workflows are inherently multi-stage, spanning interdependent tasks such as forecasting, strategy construction, risk management, and trading. Existing platforms typically focus on a single task, and can therefor
전체 내용이 궁금하다면?
원문을 직접 읽어보세요