AI2026년 6월 18일AI 점수: 92%
MosaicLeaks: Can your research agent keep a secret?
출처:HuggingFace Blog
✨ AI 인사이트
🧑💻 개발자👥 일반
- 1.딥리서치 에이전트의 외부 웹 검색 로그만으로 사내 기밀이 재구성되는 '모자이크 누출' 위협 제기
- 2.MosaicLeaks: 로컬·웹 정보를 엮은 멀티홉 1,001개 체인으로 의도·정답·전체정보 누출을 측정하는 벤치마크
- 3.PA-DR 학습법으로 정답/전체정보 누출 34.0%→9.9%, 엄격 체인 성공률 48.7%→58.7% 동시 달성
- 4.성능만 학습시키면 누출이 51.7%로 악화되고, 프롬프트로 '누출 금지' 지시해도 효과는 미미
💡
왜 중요한가?
프롬프트 경고만으로는 프라이버시를 막을 수 없고 오히려 성능만 높이면 누출이 늘어난다는 점을 실증해, 사내 문서를 외부 도구와 함께 다루는 기업용 리서치 에이전트는 검색 쿼리 구성 방식 자체를 학습 단계에서 설계해야 함을 보여준다.
🏷️ 언급 프로젝트
전체 내용이 궁금하다면?
원문을 직접 읽어보세요
공유:
#AI 에이전트#AI 안전성#데이터 유출#연구 에이전트

