PrologMCP는 Prolog를 Model Context Protocol(MCP)을 통해 상태를 가진 도구로 노출하는 과제 비종속·오픈소스 서버다. 컴팩트한 도구 인터페이스, 구조화된 오류 보고, 세션별 격리를 제공해 '번역-실행-검사-수정' 루프를 재사용 가능한 기본 단위로 만든다. PARARULE-Plus에서 PrologMCP를 활용한 형식화 에이전트는 일반 샘플에서 추론 LLM과 동등하거나 능가했고(정확도 1.00 대 1.00/0.998), 표준 모델 대비 격차가 가장 컸다(GPT-4.1 0.762). 더 어려운 부분집합에서는 형식화 에이전트가 1.00/0.99로 거의 완벽한 반면 추론 LLM은 0.95/0.94로 떨어져, 추론을 Prolog에 위임하는 방식이 긴 자연어 추론의 견고하고 검사 가능한 대안임을 보인다.
- •Prolog를 MCP 기반 상태 보유 도구로 노출하는 과제 비종속 오픈소스 서버 PrologMCP 제안
- •구조화된 오류 보고·세션 격리로 '번역-실행-검사-수정' 루프를 재사용 가능한 프리미티브화
- •PARARULE-Plus 일반 샘플에서 추론 LLM과 동등(1.00), 표준 모델(GPT-4.1 0.762) 대비 격차 최대
- •어려운 부분집합에서 형식화 에이전트 1.00/0.99 유지, 추론 LLM은 0.95/0.94로 하락
- •심볼릭 추론 위임이 확장형 자연어 추론보다 견고하고 검사 가능한 대안임을 입증
PrologMCP: A Standardized Prolog Tool Interface for LLM Agents
본문 미리보기
arXiv:2606.14935v1 Announce Type: new Abstract: Frontier reasoning-tuned language models still fail on deductive tasks at depth, and the cost of improved performance through extended internal reasoning scales poorly. Symbolic delegation offers a complementary route: a language model translates the problem, while a solver performs the inference. However, current autoformalization pipelines for logic programming are typically bespoke integrations tied to particular tasks or agents. We introduce P
전체 내용이 궁금하다면?
원문을 직접 읽어보세요