구글 딥마인드가 수백만 개의 AI 에이전트가 온라인에서 상호작용할 때 발생할 위험을 연구하기 위해 1,000만 달러 규모의 펀딩을 조성했다. 슈미트 사이언스, 영국 정부의 ARIA, Cooperative AI 재단, Google.org 등이 참여한다. AGI 안전 연구를 이끄는 로힌 샤는 에이전트가 인간 감독 없이 다른 에이전트의 지시를 따라 작업하면서 사기, 프롬프트 인젝션, 사이버공격 등이 증폭되는 새로운 위험군이 생긴다고 본다. 연구진은 단일 에이전트 분석으로는 예측이 불가능하므로 다수 에이전트를 샌드박스에 투입해 현실적 시뮬레이션을 돌려야 한다고 강조한다. 아직 '다중 에이전트 안전'이라는 연구 분야 자체가 없는 상황에서, 에이전트가 경제 전반에 대규모 배치되기 전에 학계 연구를 촉발하려는 시도다.
- •구글 딥마인드와 슈미트 사이언스, ARIA, Cooperative AI 재단, Google.org가 다중 에이전트 안전 연구에 1,000만 달러를 공동 출연
- •주요 위험은 사기, 프롬프트 인젝션(악성 지시로 에이전트가 자율 멀웨어화), 사이버공격 등 기존 인터넷 위협의 증폭판
- •로힌 샤·제임스 폭스는 단일·소규모 에이전트 분석으로는 예측 불가하며 샌드박스 기반 현실적 시뮬레이션이 유일한 이해 방법이라고 주장
- •앤트로픽은 '제로 트러스트' 기반 에이전트 배치 지침을 발표해, 에이전트를 잠재적 공격자로 가정하는 보안 접근을 제시
- •샤는 에이전트의 대규모 경제 배치까지 수개월 남았다고 보고 그 전에 학계 연구 분야를 키우려는 목적
Google DeepMind is worried about what happens when millions of agents start to interact
- 1.Google DeepMind 등이 다중 에이전트 시스템 안전 연구에 1,000만 달러 기금 조성
- 2.수백만 AI 에이전트가 상호작용할 때 사기·프롬프트 인젝션·사이버공격이 증폭될 위험 경고
- 3.Schmidt Sciences·ARIA·Cooperative AI 등 참여, 학계의 다중에이전트 안전 연구 분야 신설 목표
- 4.샌드박스 시뮬레이션 필요성 제기, Anthropic은 제로트러스트 배포 지침 발표
왜 중요한가?
에이전트가 경제 전반에 배포되기 직전 단계에서 개별이 아닌 대규모 상호작용에서 발생할 새로운 위험을 선제 연구하려는 시도로, 아직 존재하지 않는 '다중에이전트 안전' 연구 분야의 필요성을 환기한다.
🏷️ 언급 프로젝트
본문 미리보기
Google DeepMind is funding research into the potential dangers of situations where millions of different AI agents interact with each other online. According to Rohin Shah, who directs the company’s AGI safety and alignment research, the mass-market arrival of agents that can carry out tasks without human oversight and follow instructions given to them by other…
전체 내용이 궁금하다면?
원문을 직접 읽어보세요
