Agent-Native Immune System: Architecture, Taxonomy, and Engineering
- 1.자율 에이전트용 내재형 방어구조 ANIS 제안, 추론 루프 내부에 면역 체계 내장
- 2.6단계 면역 타워(L0~L5)와 물리·논리 격리 계층 Barrier Immunity(L1) 설계
- 3.Agent Virus/Vaccine 분류로 비파라메트릭 방어와 파라메트릭 백신을 구분
- 4.정렬은 학습기의 정적 가치, 면역(ANIS)은 런타임 동적 집행으로 역할 구분
왜 중요한가?
메모리 오염·툴체인 조작 같은 런타임 하이재킹은 정렬된 에이전트도 막지 못하는데, ANIS는 방어를 에이전트의 인지 루프 안으로 내재화해 기존 외곽 보안의 사각지대를 겨냥한다는 점에서 에이전트 보안의 새로운 프레임을 제시한다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.28270v1 Announce Type: new Abstract: The transition from static chat bots to autonomous agents--equipped with persistent memory, tool-use protocols, and multi-agent collaboration--has fundamentally expanded the AI threat landscape. Current defense mechanisms, such as perimeter security and training-time alignment, remain external to the agent's active reasoning loop. Consequently, they fall short: a fully aligned agent remains highly vulnerable to runtime hijacking via memory poisoni
전체 내용이 궁금하다면?
원문을 직접 읽어보세요