A startup claims it broke through a bottleneck that’s holding back LLMs | AIChainDay

🇰🇷 한국어 요약by Claude · 2026. 6. 19.

마이애미 스타트업 Subquadratic이 트랜스포머의 '밀집 어텐션(dense attention)'을 '희소 어텐션(sparse attention)'으로 대체한 새 LLM 'SubQ'를 공개하고, 제3자 평가기관 Appen의 독립 벤치마크로 핵심 주장을 뒷받침했다. SubQ는 토큰 간 연산을 동적으로 선별해 연산량을 줄여 속도 테스트에서 FlashAttention 기반 모델보다 56배 빨랐고, LiveCodeBench에서 89.7%로 프론티어급 코딩 성능을 냈다. 최대 1,200만 토큰의 컨텍스트 윈도우(일반 모델은 약 100만)에서 needle-in-a-haystack 검색 98%를 기록했으며, RULER 128 테스트 비용이 Opus 4.6의 2,600달러 대비 8달러에 불과했다. 다만 모델이 아직 널리 공개되지 않았고 중국 Qwen 가중치를 재사용해 학습한 점 때문에 '병목을 완전히 풀었다'는 강한 주장에는 회의론이 남아 있다.

•Subquadratic은 트랜스포머의 밀집 어텐션 대신 희소 어텐션을 쓰는 LLM 'SubQ'를 내놓고, 어떤 토큰 관계를 곱할지 텍스트마다 동적으로 선별해 연산량(quadratic 확장)을 줄였다고 주장
•Appen 독립 평가: 속도 테스트에서 FlashAttention 기반 모델 대비 56배 빠름, LiveCodeBench 89.7%로 상위 코딩 모델과 동급
•최대 1,200만 토큰 컨텍스트(대형 모델 통상 100만)에서 needle-in-a-haystack 검색 98% 달성, 600만·1,200만 토큰 규모에서 장문 검색 성능 유지
•비용 주장: Nvidia RULER 128 테스트 실행 비용이 Anthropic Opus 4.6는 2,600달러인 반면 SubQ는 8달러
•SubQ가 처음부터 학습된 것이 아니라 중국 오픈소스 모델 Qwen 가중치로 부트스트랩됐고 일반 공개가 제한적이어서, 'LLM을 완전히 재발명했다'는 주장엔 회의론이 따름

AI2026년 6월 19일AI 점수: 95%

A startup claims it broke through a bottleneck that’s holding back LLMs

출처:MIT Technology Review AI

✨ AI 인사이트

🧑‍💻 개발자💼 투자자

1.마이애미 스타트업 Subquadratic, 희소 어텐션 LLM 'SubQ'로 트랜스포머 연산 병목 해결 주장
2.제3자 Appen 평가서 LiveCodeBench 89.7%, FlashAttention 대비 속도 56배 확인
3.컨텍스트 윈도우 최대 1200만 토큰, 600만·1200만 토큰서 정보검색 정확도 98% 달성
4.Qwen 가중치 재활용으로 부트스트랩, '병목 완전 해결' 주장엔 회의론 잔존

💡

왜 중요한가?

트랜스포머의 dense attention은 텍스트 길이에 비례해 연산이 제곱으로 늘어 LLM 비용·전력의 핵심 병목이었다. SubQ가 희소 어텐션으로 RULER 128 기준 Opus 4.6의 $2600 작업을 $8로 낮췄다면 장문 문서 분석·코드베이스 검색 제품의 경제성을 근본적으로 바꿀 수 있다. 다만 모델 미공개와 Qwen 가중치 재활용으로 검증은 아직 제한적이다.

🏷️ 언급 프로젝트

Subquadratic SubQ

📝 AIChainDay 편집노트왜 이 기사를 골랐나

미국 스타트업 서브쿼드래틱이 LLM 발전의 오랜 난제를 해결했다고 주장하며 주목받고 있습니다. 이 주장이 사실로 확인될 경우, 국내 LLM 기술 개발 및 상용화에 막대한 영향을 미쳐 관련 기업들의 경쟁 구도에 변화를 가져올 수 있습니다. 다만, 아직 구체적인 내용이 부족하고 회의적인 시각도 있어 기술 검증 및 투자 방향에 신중한 접근이 필요합니다.

본문 미리보기

Miami-based AI startup Subquadratic came out of stealth mode last month with a huge claim. It announced that it had solved a mathematical bottleneck that had been holding back large language models for almost a decade. The details were thin, and many people were unconvinced. But Subquadratic has started to bring the receipts, sharing the…

전체 내용이 궁금하다면?

원문을 직접 읽어보세요

원문 보기