환자 맥락은 수백 개의 이질적 문서와 수천 개의 구조화 데이터로 흩어져 있지만 AI가 검색·분류에 필요한 문서 수준 메타데이터는 부재하거나 불완전해, 표준 검색증강생성(RAG)은 시간 추론·문서 간 의존성·메타데이터 결측을 잘못 처리한다. 저자들은 에센 대학병원에 ACIE(에이전트형 임상 정보 추출)를 배포했는데, 이는 완전한 환자 맥락을 추론하고 모든 답을 원문 구절에 근거시켜 임상의가 검증할 수 있게 하는 온프레미스 에이전트 RAG 파이프라인이다. 메타데이터 공백을 정량화하고 그것이 형성한 아키텍처 결정을 추적했으며, 핵의학 의사가 추출된 모든 값을 인용 출처와 대조 검증한 독립적 림프종 레지스트리 연구로 평가했다. 총 7,326건 판정에서 임상의가 추출의 96.5%를 수용했고 유형별 수용률은 80~99%였다.
- •표준 RAG가 시간 추론·문서 간 의존·메타데이터 결측을 잘못 처리하는 문제 제기
- •에센 대학병원에 배포한 온프레미스 에이전트 RAG ACIE, 모든 답을 원문 구절에 근거
- •핵의학 의사가 추출값을 인용 출처와 대조 검증한 림프종 레지스트리 연구로 평가
- •총 7,326건 판정에서 수용률 96.5%, 유형별 80~99%
Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why
본문 미리보기
arXiv:2606.19602v1 Announce Type: new Abstract: Patient contexts span hundreds of heterogeneous documents and thousands of structured data points, yet the document-level metadata that AI systems need for retrieval and triage is absent or incomplete. Standard retrieval-augmented generation fails on this data, mishandling temporal reasoning, cross-document dependencies, and missing metadata. We deploy ACIE (Agentic Clinical Information Extraction) at University Medicine Essen: an on-premise agent
전체 내용이 궁금하다면?
원문을 직접 읽어보세요