MiniMax-M2 시리즈는 '미니 활성화로 최대 실세계 지능을 발휘한다'는 원칙 아래 설계된 Mixture-of-Experts(MoE) 언어 모델 패밀리다. 플래그십 M2는 총 2,299억 개 파라미터를 갖지만 토큰당 활성화는 98억 개에 불과해 추론 효율성을 극대화한다. 에이전트 코딩·협업을 위한 검증 가능 궤적 기반 데이터 파이프라인, 장기 에이전트 궤적에 특화된 Forge RL 시스템을 갖추며, M2.7 체크포인트는 학습 실행을 스스로 디버깅하고 스캐폴드를 수정하는 자기 진화의 첫 단계를 구현했다. 에이전트 코딩·딥서치·오피스 태스크·추론 벤치마크에서 프론티어급 성능을 달성했다.
- •MoE 아키텍체: 연산 파라미터 2,299억 중 토큰당 98억만 활성화해 추론 효율성 극대화.
- •에이전트 코딩·협업 검증 가능 군적 대규모 데이터 파이프라인으로 실행 기반 학습 데이터 구축.
- •Forge RL 시스템: 장기 에이전트 구조 특화, windowed-FIFO 스케줄링·prefix-tree 병합·추론 최적화 지원.
- •M2.7 체크포인트는 자체 학습 실행 디버깅 및 스캐폴드 자기 수정 기능으로 자기 진화의 첫 단계 구현.
The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence
- 1.MiniMax-M2: 총 229.9B 파라미터 중 토큰당 9.8B만 활성화하는 MoE 언어 모델 시리즈 공개
- 2.에이전트 코딩·협업 특화 대규모 검증 가능 트래젝토리 파이프라인과 Forge 에이전트 네이티브 RL 시스템 기반 훈련
- 3.M2.7 체크포인트는 훈련 실행 자동 디버깅 및 스캐폴드 자율 수정 등 자기진화 기능 초기 단계 구현
- 4.에이전틱 코딩·딥 서치·오피스 태스크·추론 벤치마크에서 최전선 수준 성능 달성
왜 중요한가?
소수 파라미터 활성화(Mini Activation)로 대규모 MoE 효율을 극대화하면서 자기진화 기능까지 도입, 오픈 에이전트 인프라 경쟁에서 중요한 이정표를 세웠다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2605.26494v1 Announce Type: new Abstract: We introduce the MiniMax-M2 series, a family of Mixture-of-Experts language models built around the principle that mini activations can unleash maximum real-world intelligence. The flagship M2 contains 229.9B total parameters with only 9.8B activated per token. Designed end-to-end for agentic deployment, the M2 series rests on three components: (i) agent-driven data pipelines producing large-scale, verifiable trajectories across agentic coding and
전체 내용이 궁금하다면?
원문을 직접 읽어보세요