RAG 논문 수천 편에도 불구하고 실제 프로덕션에 투입하면 '엣지 케이스'가 계속 드러나며 해결이 어렵다는 현실. 저자는 핵심 문제가 'retrieval'이 아니라 'intent(의도)'라고 주장한다. '밀크셰이크 문제' 예시: 벡터 DB에 '아이들은 밀크셰이크를 좋아한다'가 있고 사용자가 '마트에서 뭐 살까?'라고 물으면 BM25(토큰 중복 0)·덴스 임베딩(쇼핑 vs 취향)·HyDE 모두 밀크셰이크를 가져오지 못한다. 검색 기법이 아닌 '의도 매칭'이 풀어야 할 진짜 문제.
- •RAG의 진짜 문제는 retrieval이 아닌 intent(의도)
- •밀크셰이크 문제: 쇼핑 질문 → 취향 문서 매칭 실패
- •BM25·덴스 임베딩·HyDE 모두 단독으로 해결 불가
- •프로덕션 RAG는 '문서 검색' 이상의 의미 추론 필요
- •수많은 RAG 논문이 진짜 문제를 비켜감
The RAG Problem

- 1.RAG 본질 문제 재정의: retrieval→intent 매칭
- 2.벡터·BM25·HyDE 모두 단독으로는 불충분
- 3.프로덕션 RAG의 실제 난관 제시
왜 중요한가?
RAG 도입 기업의 대부분이 retrieval 튜닝에만 집중하지만 본질적 한계는 쿼리-문서의 의미 매칭. 이 글은 RAG 설계 패러다임 전환을 촉구.
본문 미리보기
Why RAG looks Easy, but is really much Harder Continue reading on Towards AI »
전체 내용이 궁금하다면?
원문을 직접 읽어보세요