Anthropic이 2026-04-08 공개한 244페이지 시스템 카드의 'Claude Mythos' 논픽션 — 공개 출시하지 않을 모델을 공개적으로 공식 문서화한 초유의 사례. Forbes는 'Anthropic이 아무도 쓰게 하지 않는 AI', BBC는 '전례 없음'으로 표현. Mythos는 수천 건의 제로데이 취약점을 자동 발견했으며, 사이버 능력이 공격·방어 양면에서 프런티어를 크게 넘어섰다고 판단해 Anthropic이 '묶어두기'로 결정. 내부 코드네임은 'Capybara'였으며 2026-03-26 CMS 오구성으로 문서 일부 유출되며 존재가 알려짐. 저자는 이를 GPT-5.4·Claude Opus 4.6 대비 포지셔닝을 '봉인된 프런티어 모델'이라는 새 카테고리로 구분한다.
- •Claude Mythos = Anthropic이 출시 않을 모델을 244페이지 시스템 카드로 공개 문서화한 전례 없는 사례.
- •수천 건의 제로데이 취약점 자동 발견 — 사이버 공격·방어 양면에서 프런티어 돌파.
- •코드네임 'Capybara' — 2026-03-26 CMS 오구성으로 존재 유출 후 Anthropic 공식 인정.
- •Forbes '아무도 쓰게 하지 않는 AI', BBC '전례 없음' — 안전 결정이 글로벌 미디어 톱 주제.
- •GPT-5.4·Opus 4.6 대비 Mythos는 '봉인된 프런티어' 새 카테고리로 위치 정의.
Claude Mythos vs GPT-5.4 vs Opus 4.6: The AI Race No One Saw Coming

- 1.Claude Mythos = 출시 않을 모델을 공식 시스템 카드로 공개한 최초 사례.
- 2.사이버 제로데이 자동 발견 능력이 위험 임계치를 넘어 봉인 결정.
- 3.'Capybara' 코드네임 CMS 유출로 존재가 먼저 드러남.
- 4.Forbes·BBC·HN 헤드라인 — AI 안전 의사결정이 글로벌 메이저 이슈로.
- 5.GPT-5.4·Opus 4.6 대비 '봉인된 프런티어'라는 새 카테고리 형성.
왜 중요한가?
AI 프런티어 개발자가 '안 내보낼 모델' 공개 문서화라는 새 규범을 시도한 사건. 한국·EU 등 AI 규제 당국에도 '출시 금지 + 투명 공개' 모델 카테고리가 어떻게 작동해야 하는지 실제 기준점 제시. 사이버보안 업계에는 공격자가 유사 모델 자체 구축을 시도할 수 있다는 위협 신호이기도 하며, HF 오픈 모델 커뮤니티(OpenMythos) 재현 시도가 이미 등장했다는 맥락을 더한다.
🏷️ 언급 프로젝트
본문 미리보기
Benchmark scores, cyber power & why one model was locked away Continue reading on Towards AI »
전체 내용이 궁금하다면?
원문을 직접 읽어보세요