이미지에 내장된 수치 앵커가 6개 비전-언어 모델에서 품질 판단을 체계적으로 편향시킴을 실증합니다. 앵커 효과는 심각한 이미지 품질 저하보다 2.5배 크며, 레이어별 프로빙으로 앵커 분류 포화 레이어와 품질 예측 최적 레이어 간의 불리성을 발견했습니다. 이 결과는 시각적 앵커링 편향의 인과적 설명을 제시하며 표현 역학과 행동 취약성을 연결합니다.
- •이미지 내 수치 앵커가 6개 VLM에서 품질 판단을 체계적으로 편향시킵니다(eta²=0.18~0.77).
- •앵커 효과는 심각한 이미지 품질 저하보다 2.5배 크며 시각적 변화로 환원되지 않습니다.
- •앵커 분류 포화 레이어(L12-L34)와 품질 예측 최적 레이어 간 명확한 불리성이 관찰됩니다.
- •아키텍처에 따라 L1-L2에서 즉각 융합되거나 부분/비융합되는 구조 의존적 통합 패턴이 확인됩니다.
Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs
- 1.이미지 내 숫자 앵커가 6개 VLM의 품질 판단에 체계적 편향을 유발함을 실험적으로 확인
- 2.앵커 효과가 심각한 이미지 품질 저하보다 2.5배 더 큰 영향 미침
- 3.계층별 프롬빙으로 앵커 분류와 품질 예측 최적 레이어 간 분리 현상 발견
- 4.아키텍처별 시각-언어 융합 패턴의 차이 규명
왜 중요한가?
VLM이 이미지 품질 평가 시 숫자 정보에 강하게 편향되는 취약점을 인과적으로 분석하여, 신뢰할 수 있는 VLM 평가 시스템 설계에 중요한 시사점을 제공한다.
본문 미리보기
arXiv:2605.11218v1 Announce Type: new Abstract: Embedded numeric anchors on images systematically bias Vision-Language Model quality judgments across six VLMs from five architectural families (ANOVA eta^2 = 0.18-0.77, all p < 0.001). Anchor effects are 2.5x larger than severe image quality degradation, confirming bias is not reducible to visual changes. Layer-wise probing reveals consistent dissociation: layers where anchor classification saturates (L12-L34) are suboptimal for quality predictio
전체 내용이 궁금하다면?
원문을 직접 읽어보세요