LLM 추론의 신뢰성을 높이기 위해 Sequential Bayesian Belief Tracking(SBBT)을 제안한다. SBBT는 접두사(prefix) 기반의 관찰 가능한 신호만으로 최종 정답 도달 확률을 온라인으로 추정하며, MATH-500·GSM8K·AIME 2025·RIMO-N 벤치마크에서 단순 스코어 기반 SBBT가 Brier 점수를 개선하고, 구조 인식 관찰을 결합하면 강한 기준선 대비 AUROC를 최대 +0.110 향상시킴을 보였다. 스코어 신호는 보정(calibration)에, 구조 인식 신호는 순위(ranking) 향상에 각각 기여하는 증거 체계를 발견해 LLM 추론 신뢰성 평가의 방향성을 제시한다.
- •SBBT는 최종 답 없이 추론 접두사만으로 성공 확률을 순차적으로 갱신하는 베이즈 프레임워크다.
- •MATH-500·GSM8K·AIME 2025·RIMO-N 4개 벤치마크에서 다양한 관찰 신호를 평가했다.
- •구조 인식 관찰은 강한 prefix-safe 기준선 대비 AUROC +0.110을 달성했다.
- •스코어 신호는 주로 확률 보정에, 구조 신호는 순위 분리에 기여한다는 '증거 체계'를 규명했다.
Prefix-Safe Bayesian Belief Tracking for LLM Reasoning Reliability:Separating Calibration from Ranking
- 1.SBBT(순차적 베이지안 신뢰 추적)로 LLM 추론의 최종 답 전 신뢰도를 온라인으로 추정하는 방법 제안
- 2.MATH-500·GSM8K·AIME 2025·RIMO-N에서 검증, 구조 인식 관측치가 강력 베이스라인 대비 +0.110 AUROC 달성
- 3.스칼라 점수는 Brier 캘리브레이션 개선, 구조 인식 신호는 AUROC(랭킹) 개선에 각각 독립 기여
- 4.텍스트 마커·자기검증 신호는 동일 접두어 분류기 감사에서도 유효성 유지
왜 중요한가?
LLM이 긴 추론 체인을 생성할 때 최종 답을 보기 전에 신뢰도를 추정하는 문제를 캘리브레이션(Brier)과 랭킹(AUROC)으로 분리해 다룬 점이 핵심이다. 수학 풀이·코드 생성 등 고위험 응용에서 조기 종료·에스컬레이션 기준 수립에 실질적 기반을 제공한다.
본문 미리보기
arXiv:2605.27712v1 Announce Type: new Abstract: Long reasoning traces need reliability estimates before final answers are known. We study prefix-conditioned eventual-success estimation, $P(y=1 \mid o_{1:t})$, using prefix-safe observations. Sequential Bayesian Belief Tracking (SBBT) calibrates observation likelihoods and recursively updates a two-state belief, providing a common tracker for scalar scores, text and self-verification markers, hidden clusters, token-pooling probes, and latent-traj
전체 내용이 궁금하다면?
원문을 직접 읽어보세요