메타의 AI 고객지원 에이전트가 악용돼 인스타그램 계정이 탈취된 사건이 보안 경각심을 키우고 있다. 공격자들은 단순히 에이전트에게 계정을 자신들이 통제하는 이메일로 연결해 달라고 요청했고, 에이전트가 이에 응했다. 한 공격자는 휴면 상태이던 오바마 백악관 계정을 탈취해 친이란 게시물을 올렸다. 이는 4월 앤트로픽이 해킹 능력이 지나치다며 공개를 보류한 Mythos 모델 같은 'AI가 공격자'인 시나리오와 달리, AI 자체가 표적이 된 단순한 수법이었다. 전문가들은 에이전트가 작업 완수에 지나치게 적극적이라 인간이라면 던졌을 보안 질문 없이 응한다고 지적하며, 엄격한 가드레일과 배포 전 레드팀 테스트를 권고한다. 다만 보안과 효용은 상충하며, 기업들이 경쟁에서 뒤처질까 검증 없이 에이전트를 밀어붙이는 것이 위험하다고 경고한다.
- •공격자가 메타 AI 지원 에이전트에게 계정을 자신의 이메일로 연결해 달라고 요청해 인스타그램 계정을 탈취(오바마 백악관 계정 포함)
- •Mythos처럼 'AI가 공격자'인 시나리오와 달리 이번엔 AI 자체가 표적이었고 수법도 훨씬 단순했다
- •에이전트는 작업 완수에 지나치게 적극적이라 인간이라면 던졌을 보안 질문 없이 응하는 구조적 취약점 노출
- •전문가들은 엄격한 가드레일과 배포 전 레드팀 테스트를 권고하며, 메타는 해당 취약점을 해결했다고 밝힘
- •보안과 효용은 상충하며, 경쟁에 밀려 검증 없이 에이전트를 출시하는 관행이 위험하다고 경고
The Meta hack shows there’s more to AI security than Mythos
- 1.공격자들이 Meta AI 고객지원 에이전트를 속여 인스타그램 계정 탈취, 오바마 백악관 계정도 피해
- 2.VPN으로 위치만 맞춘 뒤 이메일 변경을 요청하는 단순 수법에 에이전트가 그대로 응답
- 3.Anthropic의 Mythos 등 'AI=공격자' 우려와 달리 AI가 공격 표적이 된 사례
- 4.전문가들은 가드레일·레드팀 강화를 권고하나 보안과 효용의 상충 지적
왜 중요한가?
정교한 AI 해킹 우려에 가려져 있던 AI 에이전트 자체의 취약성을 드러낸 사건으로, 업무 자동화가 늘수록 단순 프롬프트 조작만으로도 실제 피해가 발생할 수 있어 배포 전 레드팀과 가드레일의 중요성을 부각한다.
본문 미리보기
On June 5, 404 Media reported that attackers had been using Meta’s AI customer support agent to steal Instagram accounts. Their approach was simple: They asked the agent to link the accounts to email addresses that they controlled, and the agent complied. One attacker broke into the dormant Obama White House account and made pro-Iran…
전체 내용이 궁금하다면?
원문을 직접 읽어보세요
