마이애미 스타트업 Subquadratic이 트랜스포머의 '밀집 어텐션(dense attention)'을 '희소 어텐션(sparse attention)'으로 대체한 새 LLM 'SubQ'를 공개하고, 제3자 평가기관 Appen의 독립 벤치마크로 핵심 주장을 뒷받침했다. SubQ는 토큰 간 연산을 동적으로 선별해 연산량을 줄여 속도 테스트에서 FlashAttention 기반 모델보다 56배 빨랐고, LiveCodeBench에서 89.7%로 프론티어급 코딩 성능을 냈다. 최대 1,200만 토큰의 컨텍스트 윈도우(일반 모델은 약 100만)에서 needle-in-a-haystack 검색 98%를 기록했으며, RULER 128 테스트 비용이 Opus 4.6의 2,600달러 대비 8달러에 불과했다. 다만 모델이 아직 널리 공개되지 않았고 중국 Qwen 가중치를 재사용해 학습한 점 때문에 '병목을 완전히 풀었다'는 강한 주장에는 회의론이 남아 있다.
- •Subquadratic은 트랜스포머의 밀집 어텐션 대신 희소 어텐션을 쓰는 LLM 'SubQ'를 내놓고, 어떤 토큰 관계를 곱할지 텍스트마다 동적으로 선별해 연산량(quadratic 확장)을 줄였다고 주장
- •Appen 독립 평가: 속도 테스트에서 FlashAttention 기반 모델 대비 56배 빠름, LiveCodeBench 89.7%로 상위 코딩 모델과 동급
- •최대 1,200만 토큰 컨텍스트(대형 모델 통상 100만)에서 needle-in-a-haystack 검색 98% 달성, 600만·1,200만 토큰 규모에서 장문 검색 성능 유지
- •비용 주장: Nvidia RULER 128 테스트 실행 비용이 Anthropic Opus 4.6는 2,600달러인 반면 SubQ는 8달러
- •SubQ가 처음부터 학습된 것이 아니라 중국 오픈소스 모델 Qwen 가중치로 부트스트랩됐고 일반 공개가 제한적이어서, 'LLM을 완전히 재발명했다'는 주장엔 회의론이 따름
A startup claims it broke through a bottleneck that’s holding back LLMs

- 1.마이애미 스타트업 Subquadratic, 희소 어텐션 LLM 'SubQ'로 트랜스포머 연산 병목 해결 주장
- 2.제3자 Appen 평가서 LiveCodeBench 89.7%, FlashAttention 대비 속도 56배 확인
- 3.컨텍스트 윈도우 최대 1200만 토큰, 600만·1200만 토큰서 정보검색 정확도 98% 달성
- 4.Qwen 가중치 재활용으로 부트스트랩, '병목 완전 해결' 주장엔 회의론 잔존
왜 중요한가?
트랜스포머의 dense attention은 텍스트 길이에 비례해 연산이 제곱으로 늘어 LLM 비용·전력의 핵심 병목이었다. SubQ가 희소 어텐션으로 RULER 128 기준 Opus 4.6의 $2600 작업을 $8로 낮췄다면 장문 문서 분석·코드베이스 검색 제품의 경제성을 근본적으로 바꿀 수 있다. 다만 모델 미공개와 Qwen 가중치 재활용으로 검증은 아직 제한적이다.
🏷️ 언급 프로젝트
미국 스타트업 서브쿼드래틱이 LLM 발전의 오랜 난제를 해결했다고 주장하며 주목받고 있습니다. 이 주장이 사실로 확인될 경우, 국내 LLM 기술 개발 및 상용화에 막대한 영향을 미쳐 관련 기업들의 경쟁 구도에 변화를 가져올 수 있습니다. 다만, 아직 구체적인 내용이 부족하고 회의적인 시각도 있어 기술 검증 및 투자 방향에 신중한 접근이 필요합니다.
본문 미리보기
Miami-based AI startup Subquadratic came out of stealth mode last month with a huge claim. It announced that it had solved a mathematical bottleneck that had been holding back large language models for almost a decade. The details were thin, and many people were unconvinced. But Subquadratic has started to bring the receipts, sharing the…
전체 내용이 궁금하다면?
원문을 직접 읽어보세요