OpenAI가 Hub에 공개한 Privacy Filter — 8개 카테고리 PII를 single forward pass로 128k context에서 라벨링하는 오픈소스 PII 디텍터(1.5B 파라미터·50M active·Apache 2.0). HuggingFace 팀이 이를 활용해 3개 데모 앱을 gradio.Server로 빌드: (1) Document Privacy Explorer — PDF/DOCX 업로드 후 PII span 하이라이트, (2) Image Anonymizer — 이미지 내 이름·이메일·계좌번호 등 redact, (3) SmartRedact Paste — 민감 텍스트 paste 후 redacted 공개 URL + private reveal 링크 분리. 모두 gradio.Server로 custom HTML/JS 프런트엔드와 Gradio 큐잉·ZeroGPU·SDK 결합. PII-Masking-300k 벤치마크 SOTA.
- •OpenAI Privacy Filter — 8 카테고리 PII 단일 forward pass·128k context·1.5B 파라미터·Apache 2.0.
- •PII 카테고리: private_person·address·email·phone·url·date / account_number / secret.
- •HuggingFace 3 데모: Document Explorer / Image Anonymizer / SmartRedact Paste.
- •gradio.Server로 custom HTML/JS + Gradio 큐잉·ZeroGPU·gradio_client SDK 결합.
- •PII-Masking-300k 벤치마크 SOTA — 오픈소스 PII 디텍터의 새 baseline.
How to build scalable web apps with OpenAI's Privacy Filter
- 1.OpenAI가 8개 카테고리 PII 탐지 오픈소스 모델 Privacy Filter를 HuggingFace에 공개
- 2.문서 프라이버시 탐색기, 이미지 익명화기, SmartRedact Paste 등 3가지 데모 앱 구현 소개
- 3.gradio.Server를 활용해 커스텀 HTML/JS 프론트엔드와 Gradio 큐·ZeroGPU를 통합하는 패턴 제시
- 4.1.5B 파라미터, 128k 컨텍스트 지원, Apache 2.0 라이선스로 상업적 활용 가능
왜 중요한가?
PII 탐지 모델의 오픈소스 공개와 실전 활용 패턴 제시는 개인정보 보호 기능을 웹 앱에 통합하려는 개발자들에게 즉시 활용 가능한 레퍼런스를 제공한다.
🏷️ 언급 프로젝트
전체 내용이 궁금하다면?
원문을 직접 읽어보세요