AI Engram은 신경망이 생물학적 기억 단위에 대응하는 식별 가능한 기억 흔적을 보존하는지를 탐구하며, 특이성·재활성화·충분성·필요성이라는 신경과학적 기준을 제약 역문제로 형식화하는 기하학적 프레임워크를 제안한다. 전역적으로 얽힌 파라미터에서 개별 기억 흔적을 분리하는 닫힌 형식(closed-form) 추정량을 유도하며, 이 해가 파라미터 다양체 위의 자연 기울기(natural gradient) 업데이트에 대응함을 보인다. 이를 통해 반복 최적화 없이 선형 산술만으로 기억 부분집합을 합성하거나 삭제하는 외과적 조작이 가능하다. MLP부터 LLM까지의 실험으로 인과적 타당성과 확장성을 입증해, 생물학적 기억 이론과 인공 표현 학습을 잇는다.
- •신경과학적 기억 기준(특이성·재활성화·충분성·필요성)을 제약 역문제로 형식화한 기하학적 프레임워크
- •얇힌 파라미터에서 개별 기억 흔적을 분리하는 닫힌 형식 추정량 유도
- •도출된 해가 파라미터 다양체상의 자연 기울기 업데이트에 대응함을 규명
- •반복 최적화 없이 선형 산술로 기억을 합성·삭제하는 외과적 조작 가능
- •MLP~LLM 실험으로 인과적 타당성과 확장성 입증
AI Engram: In Search of Memory Traces in Artificial Intelligence
본문 미리보기
arXiv:2606.14997v1 Announce Type: new Abstract: Memory formation is fundamental to intelligence, yet whether deep neural networks preserve identifiable memory traces analogous to biological memory units remains an open question. This work introduces a geometric framework to identify such "AI engrams" by formalizing the neuroscientific criteria of specificity, reactivation, sufficiency, and necessity into a constrained inverse problem. We derive a closed-form estimator that isolates individual m
전체 내용이 궁금하다면?
원문을 직접 읽어보세요