생성형 AI의 공정성 문제를 다루기 위해 인과적 편향 감지를 위한 새로운 방법론을 제안합니다. 생성 모델은 단일 예측 함수 대신 모든 인과 메커니즘에 대한 자체 믿음을 암묵적으로 구성하므로 표준 ML 공정성 연구와 다른 접근이 필요하며, 표준 ML과 생성형 AI를 통합하는 공통 이론 프레임워크를 제시합니다. 인과 경로와 실세계 메커니즘 대체 효과를 세밀하게 정량화하는 인과 분해 결과를 도출하고 LLM에서 인종·성별 편향을 실증 분석했습니다.
- •생성형 AI는 단일 예측 함수가 아닌 모든 인과 메커니즘에 대한 자체 신념을 구성하므로 새로운 공정성 분석이 필요합니다.
- •표준 ML과 생성형 AI 환경을 통합하는 공통 이론 프레임워크를 제시합니다.
- •인과 경로와 실세계 메커니즘 대체 효과를 세밀히 분리하는 인과 분해 결과를 도출합니다.
- •대규모 언어 모델에서 인종과 성별 편향을 실제 데이터로 분석·검증했습니다.
Causal Bias Detection in Generative Artifical Intelligence
- 1.생성 AI의 인과적 편향 탐지를 위한 통합 이론 프레임워크 개발
- 2.생성 모델은 단일 예측 함수가 아닌 모든 인과 메커니즘에 자체 신념을 구성한다는 점에서 표준 ML과 근본적으로 다름
- 3.인과 경로별 공정성 영향을 세분화하여 정량화하는 분해 결과 도출
- 4.LLM의 인종·젠더 편향 분석에 방법론 적용 및 검증
왜 중요한가?
생성 AI가 공정성 문제에서 고유한 복잡성을 가진다는 점을 형식화하고, LLM의 편향을 인과적으로 측정하는 새로운 방법을 제시하여 책임 있는 AI 개발에 기여한다.
본문 미리보기
arXiv:2605.11365v1 Announce Type: new Abstract: Automated systems built on artificial intelligence (AI) are increasingly deployed across high-stakes domains, raising critical concerns about fairness and the perpetuation of demographic disparities that exist in the world. In this context, causal inference provides a principled framework for reasoning about fairness, as it links observed disparities to underlying mechanisms and aligns naturally with human intuition and legal notions of discrimina
전체 내용이 궁금하다면?
원문을 직접 읽어보세요