🇰🇷 한국어 요약by Claude · 2026. 6. 1.

JetBrains가 12B 파라미터 Mixture-of-Experts 모델 Mellum2를 오픈소스(Apache 2.0)로 공개했다. 토큰당 2.5B 파라미터만 활성화하는 MoE 아키텍처 덕분에 동급 크기 모델 대비 2배 이상 빠른 추론 속도를 제공한다. 라우팅·오케스트레이션, RAG 파이프라인, 서브에이전트, 프라이빗 배포 등 지연 시간에 민감한 소프트웨어 엔지니어링 워크로드를 위해 설계됐으며, 코드와 자연어를 모두 지원한다. 단일 프론티어 모델에 의존하는 모놀리식 구조 대신, 고빈도 중간 작업을 빠르고 저렴하게 처리하는 "focal 모델"로서 멀티 에이전트 AI 스택의 핵심 구성 요소가 될 수 있다.

•12B 총 파라미터 중 토큰당 2.5B만 활성화하는 MoE 구조로 동급 오픈 모델 대비 2배 이상 빠른 추론 속도 달성
•라우팅·오케스트레이션, RAG 파이프라인, 서브에이전트 등 AI 시스템 내 지연 민감 중간 작업에 최적화된 'focal 모델'로 포지셔닝
•코드 완성 전용이었던 Mellum 1세대를 확장해 자연어·소프트웨어 엔지니어링 전반으로 적용 범위 넓힘
•Apache 2.0 라이선스로 Hugging Face 공개; 기술 리포트(arXiv 2605.31268)에서 벤치마크·아키텍처 세부 사항 확인 가능

AI2026년 6월 1일AI 점수: 95%

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

출처:HuggingFace Blog

✨ AI 인사이트

🧑‍💻 개발자

1.JetBrains가 12B MoE 모델 Mellum2 공개 — 토큰당 2.5B 파라미터만 활성화, Apache 2.0 오픈 라이선스
2.동급 오픈 모델 대비 2배 이상 빠른 추론 속도로 고처리량·저지연 워크로드에 최적화
3.라우팅·RAG·서브에이전트·코드 완성 등 멀티모델 AI 시스템 내 중간 컴포넌트 역할 특화
4.프라이빗 배포 지원으로 사내 코드·내부 데이터 환경에서도 활용 가능, HuggingFace 공개

💡

왜 중요한가?

대형 추론 모델 없이도 라우팅·RAG 등 반복·저지연 작업을 처리하는 효율적 오픈 모델로, 멀티에이전트 AI 스택 비용과 지연시간을 실질적으로 낮출 수 있다. 소프트웨어 엔지니어링 특화 인프라 설계에서 MoE 경량 모델의 현실적 선택지가 된다.

🏷️ 언급 프로젝트

JetBrains Mellum2

📝 AIChainDay 편집노트왜 이 기사를 골랐나

JetBrains가 12B 파라미터의 혼합 전문가(MoE) 모델인 Mellum2를 공개하며 AI 모델 개발의 새로운 방향성을 제시했습니다. 한국 AI 시장에서도 효율적이고 성능 좋은 대규모 모델에 대한 수요가 높은 만큼, 이러한 기술은 국내 기업들이 차별화된 AI 솔루션을 구축하고 경쟁력을 확보하는 데 중요한 계기가 될 수 있습니다.

전체 내용이 궁금하다면?

원문을 직접 읽어보세요

원문 보기

#JetBrains#Mellum2#혼합전문가모델#코드생성AI#AI모델출시

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

관련 글

Advancing next-gen AI with materials science innovation

PlanFlip: Attacking Multi-Agent LLM Systems via Planning-Phase Prompt Injection

Democratizing AI with Small Language Models: Structured Benchmarking and Parameter-Efficient Fine-Tuning for Local Deployment

Generative Ontology Induction: Domain-Agnostic Schema Discovery from Document Corpora Using Large Language Models