Theory of Mind Utility(ToM-U)는 타인의 믿음 추론을 '누가 누구에게 무엇을, 어떤 순서로, 얼마나 신뢰성 있게 말했는가'를 추적하는 인식적 상태 추론 문제로 보고, 이를 계산 수준에서 형식화한 이론이다. 알고리즘·신경 구현에 얽매이지 않고 '멘탈라이징이 무엇을 계산하며 왜 그러는가'를 규정한다. 핵심은 에이전트·상태 노드·인식적 관계를 나타내는 방향성 타입 그래프인 국소 인식 월드 모델(LEWM)을 구성하고, 관찰된 행동에 비춰 후보 LEWM들을 충분한 확신에 이를 때까지 평가하는 것이다. 다섯 개 형식 정의가 LEWM 구조, 순서화된 정보 접근 이력, 재귀적 멘탈라이징의 유계 확장, 세 가지 추론 절차, 실패 흔적을 담는 잔차 함수를 규정한다. 믿음 상태를 전제하는 베이지안 ToM이나 형식 장치가 없는 시뮬레이션 이론과 달리, 구조적 속성에서 반증 가능한 멘탈라이징 실패 예측을 도출한다.
- •타인 믿음 추론을 인식적 상태 추론 문제로 계산 수준에서 형식화한 ToM-U
- •에이전트·상태·인식적 관계를 나타내는 방향성 타입 그래프 LEWM 구성
- •관찰된 행동에 비추어 후보 LEWM을 충분한 확신 도달 시까지 평가
- •5개 형식 정의로 구조·정보접근 이력·재귀 멘탈라이징·추론 절차·잔차 함수 규정
- •베이지안 ToM·시뮬레이션 이론과 달리 반증 가능한 멘탈라이징 실패 예측 도출
The Theory of Mind Utility: Formal Specification of a Mentalizing Mechanism
- 1.마음 이론을 계산 수준에서 형식화한 ToM-U 프레임워크 제안
- 2.지역 인식 세계 모델(LEWM) 그래프로 타인의 인식 상태를 추론
- 3.5개 형식 정의와 재귀적 멘탈라이징 억제 메커니즘 명세
- 4.베이지안 ToM과 달리 신념 상태를 전제하지 않고 도출
왜 중요한가?
마음 이론을 검증 가능한 형식 모델로 규정해, 멘탈라이징 실패에 대한 방향성 있는 반증 가능 예측을 제시하고 목표 추론 등 상위 사회 인지 과정의 상류 메커니즘 토대를 제공한다.
🏷️ 언급 프로젝트
타인의 신념을 추론하는 '마음 이론(Theory of Mind)'을 AI 시스템에 formal하게 적용하는 연구는 인간과 상호작용하는 AI 개발에 중요한 진전을 의미합니다. 국내에서 고도화된 대화형 AI, 사회적 로봇 등 인간의 의도를 깊이 이해하고 공감하는 AI 개발을 목표로 하는 연구자들에게 이 메커니즘은 핵심적인 기반 기술이 될 것입니다.
본문 미리보기
arXiv:2606.12721v1 Announce Type: new Abstract: Inferring others' beliefs requires more than reading surface signals; it requires tracking who told them what, in what order, and how credibly. The Theory of Mind Utility (ToM-U) formalizes this epistemic state inference problem at the computational level of analysis, specifying what mentalizing computes and why without commitment to algorithmic or neural implementation. ToM-U achieves this by constructing Local Epistemic World Models (LEWMs) -- d
전체 내용이 궁금하다면?
원문을 직접 읽어보세요