OncoAgent는 종양학 임상 의사결정 지원을 위한 오픈소스 프라이버시 보호 시스템으로, AMD MI300X 하드웨어에서 QLoRA로 파인튜닝된 이중 계층 LLM(9B·27B)과 LangGraph 기반 8노드 멀티에이전트 토폴로지를 결합했다. NCCN·ESMO 가이드라인 70개 이상을 기반으로 한 4단계 수정 RAG 파이프라인을 통해 환각을 방지하며, CRAG 문서 등급 성공률 100%를 달성했다. Unsloth와 시퀀스 패킹으로 26만 6,854개 샘플 파인튜닝을 약 50분(기존 5시간 대비 6배 단축)에 완료했으며, 3계층 반성(reflexion) 안전 검증기와 Zero-PHI 정책으로 환자 데이터를 클라우드 없이 온프레미스에서 완전 보호한다.
- •9B(Tier 1)와 27B(Tier 2) 두 파인튜닝 LLM을 사례 복잡도 점수(S)에 따라 자동 라우팅하는 이중 계층 아키텍처를 채택했다.
- •AMD MI300X에서 Unsloth와 시퀀스 패킹을 조합해 26만 6,854개 샘플 전체 파인튜닝을 약 50분 만에 완료, 기존 5시간 대비 약 6배 단축했다.
- •NCCN·ESMO 가이드라인 70개 이상 기반 4단계 수정 RAG 파이프라인으로 CRAG 문서 등급 성공률 100%와 RAG 신뢰도 점수 2.3+ 달성했다.
- •Zero-PHI 정책과 클라우드 의존 없는 온프레미스 완전 배포로 HIPAA·GDPR 환경의 병원에도 적용 가능하다.
- •LangGraph 8노드 토폴로지, 3계층 reflexion 안전 검증기, 필수 인간개입(HITL) 게이트를 통해 다층 안전 설계를 구현했다.
"OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support"
- 1.OncoAgent는 암 치료 의사결정 지원을 위한 오픈소스 프라이버시 보존 AI 시스템임
- 2.듀얼 티어 LLM(9B/27B)과 8노드 LangGraph 멀티에이전트 구조를 결합한 아키텍처
- 3.AMD MI300X에서 QLoRA 파인튜닝으로 266,854건 데이터셋을 약 50분 만에 학습 완료
- 4.4단계 Corrective RAG와 3중 안전 검증으로 환각 없는 가이드라인 기반 추천 구현
왜 중요한가?
온코로지 AI에서 환각과 클라우드 의존성 문제를 동시에 해결한 오픈소스 솔루션이다. AMD 온프레미스 배포로 환자 데이터 주권을 확보하면서 SOTA 성능을 달성해 의료 AI 실용화에 중요한 기여를 한다.
전체 내용이 궁금하다면?
원문을 직접 읽어보세요