DR-DCI는 검색기(retriever)를 에이전트가 호출 가능한 동작으로 취급해, 전체 코퍼스를 직접 다루는 대신 관련 문서만 동적으로 로컬 워크스페이스에 끌어와 직접 코퍼스 상호작용(DCI)을 수행하는 프레임워크다. 검색기의 높은 재현율과 DCI의 정밀한 문서 간 검증·비교를 결합해 대규모 코퍼스에서도 안정적으로 작동한다. Browsecomp-Plus에서 71.2% 정확도로 기존 DCI 대비 최대 8.3점 향상하면서 도구 사용·실행 시간·비용을 줄였고, 워크스페이스 보존형 컨텍스트 리셋 시 73.3%까지 올랐다. 100K~10M 문서 규모에서도 성능을 유지해, 순수 DCI가 불안정해지는 대규모 에이전트 검색의 실용적 대안을 제시한다.
- •검색을 에이전트 호출 동작으로 삼아 관련 문서만 로컬 워크스페이스로 끌어와 DCI 수행
- •Browsecomp-Plus 71.2% 정확도, 순수 DCI 대비 최대 8.3점 향상하며 도구 사용·시간·비용 감소
- •컨텍스트 리셋(워크스페이스 보존) 적용 시 정확도 73.3%로 추가 상승
- •100K~10M 문서까지 안정적, 20M 규모 Wiki-18 QA에서 6개 벤치마크 평균 63.0 달성
- •순수 DCI가 대규모에서 불안정해지고 BM25가 크게 뒤처지는 한계 해결
Dr-DCI: Scaling Direct Corpus Interaction via Dynamic Workspace Expansion
본문 미리보기
arXiv:2606.14885v1 Announce Type: new Abstract: Agentic search over large corpora relies on retriever-mediated interfaces (e.g., BM25 or ColBERT) for scalable candidate discovery. While effective at ranking relevant documents, these interfaces expose evidence only as ranked results or bounded document views, limiting agents' ability to reorganize material and verify constraints across documents. Direct Corpus Interaction (DCI) addresses this limitation by exposing shell-executable corpus operat
전체 내용이 궁금하다면?
원문을 직접 읽어보세요