CyberSecQwen-4B는 방어적 사이버보안 작업에 특화된 소형 AI 모델로, 민감 데이터의 외부 전송 없이 12GB 소비자용 GPU에서 로컬 실행이 가능합니다. AMD Instinct MI300X 단일 GPU에서 ROCm 7과 LoRA 파인튜닝으로 학습되었으며, CTI-Bench 평가에서 Cisco의 Foundation-Sec-Instruct-8B(8B 모델) 대비 CTI-MCQ 점수를 +8.7 포인트 초과하면서도 절반의 파라미터(4B)로 동등 이상의 성능을 달성했습니다. CVE→CWE 매핑, CWE 분류, 구조화된 CTI Q&A 등 방어적 보안 작업에 최적화되어 있으며, Apache 2.0 라이선스로 공개되어 있습니다.
- •호스팅 API의 비용 문제와 민감 데이터 외부 전송 위험을 해결하기 위해 로컬 실행 가능한 소형 특화 모델을 설계했습니다.
- •CTI-Bench에서 Cisco 8B 모델 대비 CTI-MCQ +8.7pp 높은 성능을 4B 파라미터로 달성해 효율성을 입증했습니다.
- •AMD Instinct MI300X 192GB GPU에서 단일 학습 실행으로 전체 파이프라인(학습·병합·평가)을 완료했습니다.
- •CVE→CWE 매핑, CWE 분류, 위협 인텔리전스 Q&A 등 방어적 사이버보안 작업에 특화되어 있습니다.
- •Apache 2.0 라이선스로 공개되어 에어갭 환경·온프레미스 인프라에서도 자유롭게 배포·활용할 수 있습니다.
CyberSecQwen-4B: Why Defensive Cyber Needs Small, Specialized, Locally-Runnable Models
- 1.CyberSecQwen-4B는 AMD MI300X에서 훈련된 4B 파라미터 방어적 사이버보안 특화 모델이다
- 2.8B 모델 대비 CTI-MCQ에서 +8.7pp 우위, 절반 크기로 유사한 성능을 달성한다
- 3.민감 데이터 외부 전송 없이 로컈 실행 가능, SOC 환경과 에어곭 인프라에 적합
- 4.Apache 2.0 공개, CWE 분류와 CVE 매핑 등 방어 업무에 즉시 활용 가능
왜 중요한가?
방어적 사이버보안 환경은 민감 데이터 보호, 비용, 에어\uac ed 운영 등의 제약으로 로컈 실행 AI가 필수적이다. CyberSecQwen-4B는 12GB 소비자용 GPU에서 구동 가능한 4B 모델로 대형 모델에 필적하는 성능을 제공해 보안 실무자의 AI 도입 장벽을 실질적으로 낙춥단다.
전체 내용이 궁금하다면?
원문을 직접 읽어보세요