이 논문은 LLM '에이전트'의 자율성과 행위성(agency)의 경계를 개념적으로 재정의한다. 데카르트의 독립적 사고에 기반한 행위성 개념과 SF 속 자율 존재 묘사를 끌어와, 에이전트 아키텍처를 목표·정체성·의사결정·자기조절·학습의 다섯 차원으로 분석한다. 핵심 주장은 이 구조들이 외부 스캐폴딩으로 조립되는 'agentic' 시스템과 능력이 시스템 내부에서 내재적으로 발현되는 'agentive' 시스템을 구분해야 한다는 것이다. 이를 바탕으로 계층적 목표 분해, 정체성 진화, 별도 학습된 세계 모델 기반 시뮬레이션 추론, 학습된 자기조절, 자기주도 학습을 결합한 범용 에이전트 모델 GIC(Goal-Identity-Configurator) 아키텍처를 제안하며, 더 큰 자율성을 가지면서도 인간 감독 하에 두기 위한 감사가능성·통제가능성·안전성을 논한다.
- •에이전트 아키텍처를 목표·정체성·의사결정·자기조절·학습 5차원으로 분석
- •외부 스캐폴딩 기반 'agentic'과 내재적 능력의 'agentive' 시스템을 구분
- •진정한 행위성은 구조가 시스템 내부에 내재화되어야 가능하다고 주장
- •GIC(Goal-Identity-Configurator) 범용 에이전트 아키텍처 제안
- •자율성 확대 속에서도 감사가능성·통제가능성·안전성 확보 방안 논의
Critique of Agent Model
본문 미리보기
arXiv:2606.23991v1 Announce Type: new Abstract: What is an agent? What constitutes agency? With the rise of Large Language Model (LLM) systems marketed as ``coding agents'', ``AI co-scientists'', and other ``agentic" tools that promise to drive up productivity, and at the same time, ``existential" concerns such as AI escaping human control with destructive power under a speculative ``machine agency" against humans, it has become essential to clarify where automation ends and agency begins, both
전체 내용이 궁금하다면?
원문을 직접 읽어보세요