여러 방향이 그럴듯해 보이지만 일부만 신뢰할 증거로 이어지는 딥서치(deep search)의 탐색 전략 문제를 다룬다. TreeSeeker는 트리 구조 상태에서 분기-복귀(branch-and-return) 방식으로 탐색을 조직하는 추론시(inference-time) 프레임워크로, 각 분기는 하위 목표에 대한 잠정 방향이다. 가치·불확실성·위험을 나타내는 텍스트 UCB 신호로 유망 분기 활용, 불확실한 대안 탐색, 비생산적 가지 가지치기 후 복귀 중 하나를 선택하며, TreeMem이 증거·충돌·실패 단서를 해당 분기에 부착해 이후 결정을 돕는다. XBench-DeepSearch, BrowseComp, BrowseComp-ZH에서 강력한 오픈소스 기준선을 일관되게 능가했다.
- •트리 구조 상태에서 분기-복귀로 탐색을 통제하는 추론시 프레임워크 TreeSeeker 제안
- •가치·불확실성·위험의 텍스트 UCB 신호로 활용·탐색·가지치기 중 선택
- •TreeMem이 증거·불확실성·충돌·실패 단서를 분기에 부착해 이후 결정에 활용
- •XBench-DeepSearch·BrowseComp·BrowseComp-ZH에서 강력한 오픈소스 기준선을 일관되게 상회
TreeSeeker: Tree-Structured Trial, Error, and Return in Deep Search
- 1.딥서치 에이전트의 탐색 방향 선택 문제를 가지치기-복귀 트리 탐색으로 제어하는 프레임워크 TreeSeeker 제안
- 2.각 분기를 하위목표의 잠정 방향으로 두고 텍스트 UCB 신호(가치·불확실성·위험)로 활용·탐색·가지치기 선택
- 3.TreeMem이 분기별 증거·충돌·진전·실패 단서를 보존해 이후 의사결정을 유도
- 4.XBench-DeepSearch·BrowseComp·BrowseComp-ZH에서 강력한 오픈소스 베이스라인을 일관되게 상회
왜 중요한가?
딥서치 에이전트가 그리디 탐색이면 약한 경로를 계속 확장하고 무분별 탐색이면 예산을 낭비하는 딜레마를 명시적 분기-복귀 제어로 해소한다. 추론·도구 실행 강화와 보완 관계라는 점에서 웹 리서치 에이전트의 신뢰성과 효율을 함께 끌어올리는 실용적 설계다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.11662v1 Announce Type: new Abstract: Deep search requires agents to answer complex questions through multi-step web search, browsing, evidence comparison, and synthesis. A central challenge is deciding how to search when several directions look plausible but only some will later lead to reliable evidence. If an agent greedily follows the current best-looking direction, it may keep extending a weak continuation. If it explores without discipline, it may waste budget on disconnected tr
전체 내용이 궁금하다면?
원문을 직접 읽어보세요