PaddleOCR 3.5는 OCR 및 문서 파싱 작업을 Hugging Face Transformers 백엔드와 연동할 수 있도록 지원하는 새로운 버전입니다. engine="transformers" 파라미터 하나만으로 PP-OCRv5, PaddleOCR-VL 1.5 등 지원 모델을 Transformers 기반 인프라에서 실행할 수 있습니다. 이를 통해 RAG, Document AI, 에이전트 애플리케이션 개발 시 문서 수집 단계의 통합 마찰을 크게 줄일 수 있습니다. 단, 처리량 극대화가 목표라면 기본 paddle_static 백엔드가 여전히 권장됩니다.
- •engine 파라미터를 통해 Paddle static/dynamic 그래프와 Transformers 중 원하는 추론 백엔드를 선택할 수 있으며, engine_config로 dtype, device, attention 구현 방식 등 세부 옵션을 설정합니다.
- •RAG·Document AI·에이전트 파이프라인에서 PDF, 스캔 문서, 표, 수식, 복잡한 레이아웃 등을 구조화된 데이터로 변환하는 문서 수집 과정의 통합이 용이해집니다.
- •Transformers 백엔드는 Hugging Face 중심 팀에 친숙한 개발 경험과 Hub 호환 모델 배포·배포 경로를 제공하며, 처리량이 최우선인 경우 기본 Paddle 백엔드를 사용하는 것이 적합합니다.
- •PaddleOCR 팀은 Hugging Face 엔지니어들과 협력해 풀리퀘스트 검토 및 문서화를 완료하였으며, Spaces에서 실시간 데모를 체험할 수 있습니다.
PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend

- 1.PaddleOCR 3.5가 Hugging Face Transformers를 추론 백엔드로 지원해 HF 생태계와의 통합이 간편해짐
- 2.PP-OCRv5, PaddleOCR-VL 1.5 등 OCR·문서 파싱 모델을 Transformers 백엔드로 실행 가능
- 3.RAG·Document AI 등 다운스트림 워크플로우와의 연동 마찰을 줄이는 자연스러운 통합 경로 제공
- 4.engine 파라미터로 백엔드 선택, engine_config로 dtype·device 등 세부 설정 지원
왜 중요한가?
PaddleOCR의 강력한 문서 파싱 능력이 PyTorch/Transformers 스택과 통합됨으로써, HF 중심 개발 환경에서 OCR 기반 RAG·에이전트 구축이 크게 간편해졌습니다.
전체 내용이 궁금하다면?
원문을 직접 읽어보세요