재무·표 기반 질의응답이 유창한 추론을 넘어 정확한 사실·수식·단위·부호에 근거해야 하며, 단일 오독이 그럴듯하지만 틀린 답을 낳는 문제를 다룬다. MOCA-Agent는 자유 형식 다중 에이전트 토론을 주장(claim) 수준 검증으로 대체하는 '주장 시장' 코드 에이전트다. 각 질문을 유형화된 원자 주장으로 분해하고, 전문 트레이더 에이전트가 주장을 매수·매도하면 이를 신뢰도 가중 채택·기각으로 청산한 뒤, 시장이 지지한 증거로 실행 가능한 파이썬 프로그램을 합성한다. 코드 인지 검증기가 실행·구조 일관성·재무 추론 오류를 점검하고 최대 1회 수리한다. 고정된 Qwen3.6-27B 백본으로 FinQA 78.3%, FinanceMath 76.0%, MultiHiertt 71.2%, ESGenius 86.9%, FinChart-Bench 평균 85.6%를 기록했다.
- •자유 형식 토론을 주장 수준 검증으로 대체하는 '주장 시장' 코드 에이전트 MOCA-Agent 제안
- •질문을 유형화된 원자 주장으로 분해, 트레이더 에이전트의 매수·매도를 신뢰도 가중으로 청산해 파이썬 프로그램 합성
- •코드 인지 검증기가 실행·구조 일관성·재무 오류를 점검하고 최대 1회 수리
- •Qwen3.6-27B로 FinQA 78.3%·FinanceMath 76.0%·MultiHiertt 71.2%·ESGenius 86.9%·FinChart-Bench 85.6% 달성
MoCA-Agent: A Market-of-Claims Code Agent for Financial and Numerical Reasoning
- 1.금융·표 QA를 원자적 주장 단위로 검증하는 코드 에이전트 MOCA-Agent 제안
- 2.질문을 타입화된 원자 주장으로 분해, 트레이더 에이전트의 매수·매도 주문을 신뢰도 가중 수용/거부로 청산
- 3.시장 지지 증거로 실행 가능한 파이썬 프로그램 합성 후 코드 인지 검증기로 오류 점검(최대 1회 수리)
- 4.Qwen3.6-27B로 FinQA 78.3%·FinanceMath 76.0%·ESGenius 86.9% 등 10개 벤치마크서 강세
왜 중요한가?
셀 하나만 잘못 읽어도 그럴듯하지만 틀린 답이 나오는 고위험 금융 수치추론에서, 전체 답이 아닌 원자적 주장 단위로 증거를 집계해 강건성을 높였다. 자유형 다중에이전트 토론을 주장 수준 검증으로 대체한 설계는 금융 QA 제품의 신뢰성에 직접적 함의를 준다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.11537v1 Announce Type: new Abstract: Financial and tabular question answering requires more than fluent reasoning: answers must be grounded in the exact facts, formulas, units, signs, and scales that support them. A single misread cell or incorrect operation can silently produce a plausible but wrong result. We introduce \textsc{MOCA-Agent}, a market-of-claims code agent that replaces free-form multi-agent debate with claim-level verification. The system decomposes each question into
전체 내용이 궁금하다면?
원문을 직접 읽어보세요