USC 쇼아 재단과 예일 포튜노프 영상 아카이브 구술 증언 1,600편 이상을 담화 분할, 주제 모델링, LLM 분석으로 대규모 비교했다. 두 아카이브의 구조적 차이(인터뷰어 가이드형 vs 자유형)를 대체로 확인했으나, 개별 인터뷰 내 및 공통 서술 패턴에서 상당한 중첩이 발견되어 단순 이분법에 의문을 제기했다. 이 연구는 디지털 구술 역사 비교 분석을 위한 확장 가능하고 재현 가능한 프레임워크를 제시한다.
- •USC 쇼아 재단·예일 포튜노프 아카이브 구술 증언 1,600편 이상을 담화 분할·주제 모델링·LLM 분석으로 대규모 비교
- •두 아카이브의 구조적 차이(인터뷰어 가이드형 vs 자유형)를 대체로 확인하면서도 개별 인터뷰 내 상당한 중첩 발견
- •'구조화 vs 자유형' 단순 이분법에 의문을 제기하며 홀로코스트 연구의 기존 통념을 복잡화
- •비교 말뭉치 분석을 위한 확장 가능하고 재현 가능한 프레임워크 제시로 디지털 구술 역사 분야 기여
The Shape of Testimony: A Scalable Framework for Oral History Archive Comparison
- 1.1,600개 이상 홀로코스트 구술 증언을 LLM 기반 대규모 계산 분석으로 비교 연구
- 2.USC Shoah Foundation과 Yale Fortunoff 아카이브의 구조적 차이를 정량화
- 3.'구조적 vs. 자유형식' 이분법이 단순화된 것임을 밝히며 두 컬렉션 간 유사성도 확인
- 4.디지털 구술 역사와 시민과학 어노테이션 플랫폼 설계에 재현 가능한 프레임워크 제공
왜 중요한가?
역사 연구에서 LLM과 계산 분석 도구를 활용한 대규모 구술 아카이브 비교 분석의 새로운 방법론을 제시하며, 디지털 인문학 연구의 확장 가능성을 보여준다.
본문 미리보기
arXiv:2605.21623v1 Announce Type: new Abstract: Researchers in Holocaust studies have often distinguished between two styles of oral survivor testimony: the USC Shoah Foundation's interviews tend to follow a structured, interviewer-guided format, whereas the Yale Fortunoff Video Archive generally favors a more free-form, open-ended style. This distinction has influenced both scholarly research and the development of later archives. In this study, we critically examine that claim by conducting a
전체 내용이 궁금하다면?
원문을 직접 읽어보세요