Consilium Protocol은 BFT에서 파생된 멀티 모델 AI 심의 아키텍처로, 모델 간 불일치를 오류가 아닌 인식론적 신호로 취급한다. 1,478회 심의 세션(10개 도메인, 32개 주제)에서 인지 페르소나가 기반 모델보다 인식론적 행동을 결정함을 확인했으며, 0.0002 USD 무료 엣지 모델이 10.69 USD 프론티어 모델과 동등한 분석 품질을 보였다. RLHF 정렬 훈련이 도메인별 맹점을 만들어 AI 안전 주제에서 +11.6% 비대칭 편향이 발견됐으며, 전체 실험 비용 217 USD로 MIT 라이선스 공개된다.
- •인지 페르소나와 가 기반 모델보다 인식론적 행동을 결정한다: 0.0002 USD 무료 모델이 10.69 USD 프론티어 모델과 동등한 분석을 제공한다.
- •RLHF 정렬 훈련이 도메인별 맹점을 만든다: 논쟁적 정책 주제에서 정착된 과학보다 적대적 도전이 12.3%p 적고, AI 안전 주제에서 11.6% 비대칭 편향이 발견됩다.
- •In-Sample/Out-of-Sample 검증 프레임워크로 239개 주장 100% 증거 검색과 167개 맹점 발견을 달성하며 훈련 데이터 합의와 경험적 근거 결론을 구별한다.
- •무작위 모델×페르소나 배정에서 실행 재현성은 평균 ±2.2% 표준편차로 안정적이며 전체 실험 비용은 217 USD다.
Emergent Collaborative Deliberation in Multi-Model AI Systems: A BFT-Derived Protocol for Epistemic Synthesis
본문 미리보기
arXiv:2606.00005v1 Announce Type: new Abstract: We present the Consilium Protocol, a Byzantine Fault Tolerance-derived architecture for structured multi-model AI deliberation that treats inter-model disagreement as epistemic signal rather than error. The protocol assigns engineered cognitive personas to language models -- separating what a model is from how it reasons -- and introduces an In-Sample/Out-of-Sample validation framework adapted from quantitative finance to distinguish training-data
전체 내용이 궁금하다면?
원문을 직접 읽어보세요