REVEAL++는 망막 안저영상과 구조화된 임상 위험 서사를 짝지어 알츠하이머병(AD) 조기 예측을 개선하는 비전-언어 정렬 프레임워크로, 핵심은 표현형 그룹화를 이산적 하드 클러스터가 아닌 연속적·미분 가능한 구조로 재정식화한 점이다. 기존 방식은 유사 위험군을 고정 집단으로 배정해 그룹 형성과 표현 학습을 분리했으나, 이 연구는 망막영상과 위험 프로파일의 모달리티 내 임베딩 유사도에서 도출한 미분 가능한 가중 함수로 피험자 간 유사도를 모델링한다. 이 가중치가 연속 집계 연산자를 통해 부드러운 다중양성 관계를 정의해 질환 위험의 스펙트럼적 성격을 반영하며, 교차모달 정렬과 표현형 구조를 종단간 학습하는 소프트타깃 대조 목적함수를 도입한다. UK Biobank 망막영상 기반 AD 발생 예측에서 이산 그룹 기반 대조학습과 표준 비전-언어 기준선을 일관되게 능가했다.
- •표현형 그룹화를 이산 하드 할당이 아닌 연속·미분 가능한 가중 함수로 재정식화
- •모달리티 내 임베딩 유사도에서 도출한 가중치로 부드러운 다중양성 관계 정의
- •교차모달 정렬과 표현형 구조를 종단간 학습하는 소프트타깃 대조 목적함수 도입
- •UK Biobank 망막영상 AD 발생 예측에서 이산 그룹 대조학습·표준 기준선을 일관되게 능가
REVEAL++: Differentiable Phenotypic Grouping for Vision-Language Retinal Modeling of Alzheimer's Disease Risk
본문 미리보기
arXiv:2606.19522v1 Announce Type: new Abstract: The retina offers a noninvasive window into neurodegenerative disease, capturing subtle structural patterns associated with a risk of future cognitive decline. Vision-language alignment frameworks such as REVEAL have shown that pairing retinal fundus images with structured clinical risk narratives improves early prediction of Alzheimer's disease (AD). A key design choice in these approaches is the use of phenotypic grouping, where individuals with
전체 내용이 궁금하다면?
원문을 직접 읽어보세요