Cohere가 개발자용 첫 모델 'North Mini Code'를 Apache 2.0 라이선스로 공개했다. 30B 파라미터 MoE 구조에 활성 파라미터는 3B로, 에이전트형 소프트웨어 엔지니어링에 특화돼 있다. Artificial Analysis 코딩 인덱스에서 33.4점을 기록해 Qwen3.5(35B), Gemma 4, Devstral Small 2는 물론 Nemotron 3 Super(120B) 등 훨씬 큰 모델까지 앞섰다. 2단계 SFT 후 검증가능 보상 강화학습(RLVR)으로 후처리해 SWE-Bench Verified pass@1을 3.0%p, Terminal-Bench v2를 7.9%p 끌어올렸다. 비슷한 크기 오픈소스 모델 중 최상위권 성능으로, 소형 모델로도 강력한 코딩 에이전트를 구축할 수 있음을 보였다.
- •30B 파라미터(활성 3B) Mixture-of-Experts 모델로 Hugging Face에 Apache 2.0 라이선스로 공개
- •AA 코딩 인덱스 33.4점으로 Qwen3.5·Gemma 4·Devstral 및 더 큰 Nemotron 3 Super(120B)까지 상회
- •2단계 cascaded SFT(64K→128K 컨텍스트) 후 CISPO 기반 비동기 RLVR로 후처리, 70k개 검증가능 태스크·5k 저장소 활용
- •여러 에이전트 하네스(SWE-Agent, mini-SWE-agent, OpenCode, Terminus 2)에 노출해 크로스 하네스 일반화 확보
- •RLVR로 SWE-Bench Verified pass@1 +3.0%p, Terminal-Bench v2 +7.9%p 향상 및 트래젝토리 단축·오류 툴콜 감소
Introducing North Mini Code: Cohere’s First Model For Developers
- 1.코히어, 첫 개발자용 모델 North Mini Code를 Apache 2.0으로 오픈 공개
- 2.30B MoE·활성 3B 파라미터, Artificial Analysis 코딩 인덱스 33.4점 기록
- 3.SWE-Bench Verified pass@10 80.2%, Terminal-Bench v2 pass@10 55.1% 달성
- 4.2단계 SFT 후 검증 보상 RLVR로 더 큰 오픈모델까지 능가
왜 중요한가?
Qwen3.5·Devstral 2 등 더 큰 오픈모델을 제치고 동급 최강 수준의 에이전트 코딩 성능을 오픈 웨이트로 제공해, 자체 코딩 에이전트를 구축하려는 개발자에게 비용 효율적 대안이 된다.
🏷️ 언급 프로젝트
전체 내용이 궁금하다면?
원문을 직접 읽어보세요