허깅페이스 Spaces가 agents.md 표준을 통해 별도 통합 코드 없이 에이전트가 직접 호출·연결하는 멀티미디어 빌딩블록으로 자리잡았음을 실증한 사례다. 저자는 코딩 에이전트에 파리 명소를 3D 가우시안 스플랫 갤러리로 만들라고 지시했고, 에이전트는 ideogram-ai/ideogram4로 명소 이미지를 생성한 뒤 VAST-AI/TripoSplat으로 단일 이미지를 3D 스플랫(.ply)으로 재구성하는 파이프라인을 스스로 연결했다. agents.md 한 번 호출로 스키마·호출·폴링·인증 방법을 모두 얻어 클라이언트 라이브러리 없이 Space를 구동했고, Y축 보정·.ksplat 압축(약 3배)·Three.js 뷰어 제작까지 글루 코드를 자동 작성했다. 통합 장벽이 사라지면서 서로 다른 조직의 SOTA 모델을 코드 없이 조합하는 '빌딩블록 경제'가 멀티미디어 AI로 확산되고 있음을 보여준다.
- •에이전트가 ideogram4(이미지 생성)와 TripoSplat(단일 이미지→3D 가우시안 스플랫) 두 Space를 통합 코드 없이 연결해 파리 명소 3D 갤러리를 제작
- •모든 Gradio Space가 제공하는 agents.md가 스키마 URL·호출/폴링 템플릿·파일 업로드·인증 힌트를 한 번에 제공해 클라이언트 라이브러리 불필요
- •에이전트가 TripoSplat의 Y-down 출력 보정, .ply→.ksplat 약 3배 압축, Three.js 스크롤 전환 뷰어 구축 등 글루 작업까지 자동 수행
- •인간 개입은 '더 줌아웃' '오벨리스크 교체' 같은 취향 수준 지시에 국한
- •Mitchell Hashimoto의 '빌딩블록 경제' 논의가 멀티미디어 AI로 확장되는 사례로 제시
How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces

- 1.코딩 에이전트가 이미지·3D 도구를 직접 안 다루고 허깅페이스 스페이스 두 개만 호출해 파리 3D 갤러리 제작
- 2.ideogram4로 기념물 이미지 생성, VAST-AI TripoSplat으로 단일 이미지→3D 가우시안 스플랫(.ply) 변환
- 3.모든 Gradio 스페이스가 agents.md를 노출해 클라이언트 라이브러리 없이 에이전트가 API 호출·체이닝 가능
- 4.에이전트가 Y축 반전 보정·.ksplat 압축·Three.js 뷰어까지 자동 처리, 인간은 취향 수준만 지시
왜 중요한가?
통합 코드 없이 서로 다른 조직의 SOTA 이미지·3D 모델을 agents.md만으로 연결했다는 점에서, 멀티미디어 제작이 모델을 npm 패키지처럼 조합하는 '빌딩블록 경제'로 이동함을 보여준다. 한때 프로젝트였던 작업이 파이프라인의 한 단계로 축소됐다.
🏷️ 언급 프로젝트
전체 내용이 궁금하다면?
원문을 직접 읽어보세요