Narration-of-Thought: Inference-Time Scaffolding for Defeasible Ethical Reasoning in Large Language Models
- 1.도덕 딜레마 추론의 두 실패(이해관계자 붕괴·불확실성 억제)을 교정하는 NoT 프롬프트 제안
- 2.주인공·이해관계자·2단계 결과·불확실성·결정 5단계로 사고연쇄를 구조화, 학습 불필요
- 3.100개 시나리오서 이해관계자 붕괴 31%→1% 미만, 불확실성 억제 72%→1~24%로 감소
- 4.5라운드 토론 확장 시 6% 교착을 95~100% 완전 합의로 전환
왜 중요한가?
추가 학습 없이 시스템 프롬프트만으로 LLM의 윤리적 추론을 감사 가능하게 외부화해, 신뢰성 있는 에이전트 배치를 위한 저비용 정렬·검증 기법으로 활용될 수 있음을 보였다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.26366v1 Announce Type: new Abstract: Standard chain-of-thought on moral dilemmas exhibits two failure modes: stakeholder collapse (the trace names at most one party with a stake in the outcome) and uncertainty suppression (no explicit unknowns or hedges before committing to an action). We introduce narration-of-thought (NoT), a system prompt that structures chain-of-thought into five sections: protagonist, stakeholders, two-step consequences, uncertainty, then commitment. NoT adds no
전체 내용이 궁금하다면?
원문을 직접 읽어보세요