이 논문은 확산 모델(diffusion)과 플로 매칭(Flow Matching)을 Wasserstein 공간의 단일 기하학 위에서 통합적으로 설명한다. 유한한 2차 모멘트를 갖는 확률측도 공간은 2차 Wasserstein 거리로 리만 다양체 구조를 가지며, 그 위에서 자유에너지 F(ρ)=KL(ρ‖π)의 경사 흐름이 정확히 Fokker-Planck 방정식이고 그 암시적 오일러 이산화가 JKO 스킴이다. 이것이 확산 모델의 기하학적 바탕으로, 각 디노이징 단계가 하나의 JKO 단계를 실현하며 DDPM·DDIM·NCSN/SMLD·Energy Matching을 하나의 스킴으로 통합한다. 같은 다양체의 측지선(Benamou-Brenier 최소작용 곡선)은 플로 매칭이 학습하는 최적수송 경로와 정확히 일치한다. 즉 확산은 자유에너지 경사 흐름(초기값 문제), 플로 매칭은 Wasserstein 측지선(경계값 문제)으로, 서로 다른 경로로 같은 종점에 도달한다.
- •2차 Wasserstein 거리로 확률측도 공간을 리만 다양체로 보는 기하학적 틀
- •자유에너지 경사 흐름=Fokker-Planck, 그 이산화=JKO 스킴이 확산 모델의 바탕
- •DDPM·DDIM·NCSN/SMLD·Energy Matching을 하나의 스킴으로 통합
- •플로 매칭은 Benamou-Brenier 측지선(최적수송 경로)을 학습해 결정론적 ODE로 샘플링 단계 대폭 감소
- •확산=초기값 문제, 플로 매칭=경계값 문제로 서로 다른 경로로 같은 종점 도달
The Geometry Behind Diffusion and Flow Matching: Gradient Flows and Geodesics in Wasserstein Space
본문 미리보기
arXiv:2606.24157v1 Announce Type: new Abstract: The space $\mathcal{P}_2(\mathbb{R}^d$) of probability measures with finite second moment carries a natural geometry: the quadratic Wasserstein distance W_2 makes it a complete metric space and, following Otto, a (formal) Riemannian manifold whose geodesics are the optimal-transport interpolations. On this manifold, the gradient flow of the free energy F(rho) = KL(rho || \pi) is exactly the Fokker-Planck equation, and its implicit-Euler discretiza
전체 내용이 궁금하다면?
원문을 직접 읽어보세요