한국어 요약by Claude · 2026. 6. 18.

ServiceNow 연구진은 딥리서치 에이전트가 외부 웹 검색을 수행할 때 사내 비공개 정보를 단편적으로 흘려 관찰자가 이를 재조합해 비밀을 복원하는 '모자이크 효과' 위험을 측정하는 벤치마크 MosaicLeaks를 공개했다. 공개·비공개 정보를 교차하는 1,001개 멀티홉 추론 체인으로 구성되며, 의도·답변·전체정보 누출 세 가지를 평가한다. 단순히 과제 성능만 높이도록 학습하면 누출이 34.0%에서 51.7%로 오히려 악화됐고, 검색을 하지 말라는 프롬프트만으로는 효과가 미미했다. 이에 단계별 상황 보상과 Qwen3-4B 분류기 기반 프라이버시 보상을 결합한 강화학습 기법 PA-DR을 제안해 엄격 체인 성공률을 48.7%에서 58.7%로 유지하면서 답변/전체정보 누출을 34.0%에서 9.9%로 낮췄다. 프라이버시는 프롬프트로 넣을 수 없고 학습으로 심어야 한다는 점을 실증한다.

•MosaicLeaks는 비공개 사내 문서와 웹 검색을 결합한 딥리서치 에이전트의 쿼리 로그에서 비밀이 재조합되는 '모자이크 효과'를 측정하는 벤치마크로, 1,001개 멀티홉 체인(학습 559·검증 98·테스트 344)으로 구성된다.
•누출을 의도 누출, 답변 누출, 전체정보 누출 세 단계로 구분해 적대자가 관찰한 쿼리 로그만으로 비공개 정보를 추론할 수 있는지 평가한다.
•과제 성능만 높이는 학습은 성공률을 48.7%→59.3%로 올리지만 답변/전체정보 누출을 34.0%→51.7%로 함께 악화시켰다 — 더 정보가 풍부한 쿼리가 성능엔 이롭고 프라이버시엔 해롭다는 긴장이 핵심이다.
•제안 기법 PA-DR은 단계별 상황 보상과 Qwen3-4B 분류기 기반 프라이버시 보상을 결합해 엄격 체인 성공률 58.7%를 유지하면서 누출을 9.9%로 낮춰, 원래 베이스 모델의 34.0%보다도 낮은 수치를 달성했다.
•상황 보상은 전체 롤아웃을 한 번에 채점하는 대신 같은 단계·홉의 호출끼리 비교해 신용을 정밀하게 배분하며, 결과 보상 대비 약 5~6배 적은 샘플로 동일 성능에 도달한다.

0단 자동

AI가 규칙대로 쓰고 그대로 게시했습니다. 사람이 따로 보지 않았습니다.

규칙 판: 규칙 판 도입 이전 기사입니다.
남기는 것: 규칙 판 · 모델 · 시각
판 기록: 아직 없습니다.

AI2026년 6월 18일AI 점수: 92%

MosaicLeaks: Can your research agent keep a secret?

출처:HuggingFace Blog

AI 인사이트

개발자일반

1.딥리서치 에이전트의 외부 웹 검색 로그만으로 사내 기밀이 재구성되는 '모자이크 누출' 위협 제기
2.MosaicLeaks: 로컬·웹 정보를 엮은 멀티홉 1,001개 체인으로 의도·정답·전체정보 누출을 측정하는 벤치마크
3.PA-DR 학습법으로 정답/전체정보 누출 34.0%→9.9%, 엄격 체인 성공률 48.7%→58.7% 동시 달성
4.성능만 학습시키면 누출이 51.7%로 악화되고, 프롬프트로 '누출 금지' 지시해도 효과는 미미

왜 중요한가?

프롬프트 경고만으로는 프라이버시를 막을 수 없고 오히려 성능만 높이면 누출이 늘어난다는 점을 실증해, 사내 문서를 외부 도구와 함께 다루는 기업용 리서치 에이전트는 검색 쿼리 구성 방식 자체를 학습 단계에서 설계해야 함을 보여준다.

언급 프로젝트

MosaicLeaks PA-DR ServiceNow Qwen3-4B DRBench

AIChainDay 편집노트왜 이 기사를 골랐나

AI 연구 에이전트의 기밀 유지 능력을 다루는 이 기사는 국내 기업들에게 중요한 보안 경고를 던집니다. 한국 기업들이 민감한 데이터와 지식재산 보호를 위해 AI 에이전트를 도입하고 있는 만큼, 시스템 내부의 잠재적 정보 유출 위험에 대한 철저한 점검과 대비가 필수적입니다. 이는 국내 데이터 보안 규제 준수와 기업의 경쟁력 유지에 직결되는 사안입니다.

전체 내용이 궁금하다면?

원문을 직접 읽어보세요

원문 보기

#AI 에이전트#AI 안전성#데이터 유출#연구 에이전트

이 글이 만들어진 과정

03:56AI 초안

판 이력 전체 보기 →

MosaicLeaks: Can your research agent keep a secret?

이 글이 만들어진 과정

관련 글

Alibaba’s Qwen unveils 2.4 trillion parameter AI model, open weights coming next week

UK hiring falls as demand for AI skills surges, Indeed reports

OpenAI discloses its AI escaped a testing environment and hacked into Hugging Face

The Worst First Job You Can Give an Agent Is the Visible One