암시적 피드백은 접근성·일반성 덕에 추천시스템에 널리 쓰이지만 클릭베이트·위치 편향 같은 잡음 표본을 포함하며, 신규 아이템 유입으로 생기는 콜드스타트 아이템일수록 이런 잡음에 더 취약한데도 콜드 아이템의 잡음 제거는 간과돼 왔다. 기존 디노이징은 높은 손실값 같은 휴리스틱으로 잡음을 식별하고 표본 선택·재가중으로 완화하나 적응성이 낮아 콜드스타트에서 비효과적이다. 저자들은 모델 비종속 디노이징 기법 DIF를 제안하는데, 콘텐츠 선호가 안정적이라는 점을 활용해 콘텐츠가 유사한 웜 아이템으로 콜드 아이템에 대한 관심 여부 의사라벨을 추론하고, 콘텐츠 유사도로 의사라벨 신뢰도를 모델링·집계한다. 나아가 상대 엔트로피와 콜드스타트 상태로 잡음 라벨의 불확실성을 추정해 표본 수준에서 잡음 라벨을 적응적으로 교정한다. DIF는 이론적 정당화와 실데이터 실험으로 우수성이 입증됐고, 10억 사용자 규모 쇼트비디오 앱 콰이쇼우(Kuaishou)에 배포돼 콜드스타트 상업 지표를 크게 개선했다.
- •콜드 아이템이 잡음 표본에 더 취약하다는 간과된 문제를 겨냥한 모델 비종속 기법 DIF
- •콘텐츠가 유사한 웴 아이템으로 콜드 아이템 관심 의사라벨을 추론·집계
- •상대 엔트로피와 콜드스타트 상태로 잡음 라벨 불확실성을 추정해 적응적 교정
- •10억 사용자 규모 Kuaishou에 배포돼 콜드스타트 상업 지표 크게 개선
Denoising Implicit Feedback for Cold-start Recommendation
본문 미리보기
arXiv:2606.19658v1 Announce Type: new Abstract: Implicit feedback is widely used in recommender systems due to its accessibility and generality, yet it usually presents noisy samples (e.g., clickbait, position bias). Meanwhile, recommenders inevitably face the item cold-start problem due to the continuous influx of new items. We identify that cold items are more prone to noisy samples due to the aforementioned factors, and researchers often overlook the significance of denoising implicit feedba
전체 내용이 궁금하다면?
원문을 직접 읽어보세요