"Harness"는 모델을 호출하고 툴 실행과 종료 시점을 제어하는 실행 레이어이며, "Scaffold"는 시스템 프롬프트·툴 설명·컨텍스트 관리 등 모델 행동을 정의하는 레이어로 두 개념은 명확히 구분된다. 커뮤니티에서 통용되는 공식은 Agent = Model + Harness이며, Claude Code·Codex·Cursor 같은 제품은 각각 특정 모델 위에 구축된 하네스다. 컨텍스트 엔지니어링은 매 스텝에서 에이전트의 컨텍스트 창에 무엇을 넣을지 설계하는 분야로, 단기 메모리와 외부 저장 기반 장기 메모리를 모두 포함한다. RL 학습 파이프라인에서는 환경·트레이너·롤아웃·리워드 네 개념이 핵심이다. ICLR 2026에서 제기된 용어 혼용 문제를 계기로 작성된 이 글로시는 에이전트 시스템을 개발·배포·학습시키는 실무자들에게 공통 언어 기반을 제공한다.
- •"Harness"는 모델 호출·툴 실행·종료 판단을 담당하는 실행 레이어, "Scaffold"는 시스템 프롬프트·툴 설명·컨텍스트 관리 등 모델 행동을 정의하는 레이어로, 두 개념은 명확히 구분된다.
- •커뮤니티 정의: Agent = Model + Harness. Claude Code·Codex·Cursor 등은 특정 모델 위에 구축된 하네스이며, 같은 모델도 하네스가 다르면 완전히 다른 동작을 보인다.
- •컨텍스트 엔지니어링은 매 스텝 에이전트가 보는 내용(시스템 프롬프트·히스토리·검색 결과 등)을 설계하며, 단기 메모리(현재 컨텍스트 창)와 장기 메모리(외부 저장 후 필요 시 주입)를 포함한다.
- •RL 학습에서는 환경(액션→관찰 반환), 트레이너(에피소드 실행·가중치 업데이트), 롤아웃(전체 실행 궤적), 리워드(학습 신호) 4개 개념이 핵심 파이프라인을 구성한다.
- •스킬(Skill)은 다단계 목표를 위한 재사용 가능한 지식 패키지로, 단순 함수 호출인 툴(Tool)과 독립 추론·행동하는 서브에이전트(Sub-agent)와 명확히 구별된다.
Harness, Scaffold, and the AI Agent Terms Worth Getting Right
- 1.Harness(실행 루프·툴 호출·종료 판단)와 Scaffold(시스템 프롬프트·툴 설명·컨텍스트 관리)는 별개 레이어로 구분
- 2.Agent = Model + Harness 공식 제시; Claude Code·Codex·Cursor는 특정 모델 위 Harness 구현체
- 3.Context Engineering은 각 스텝에서 모델 컨텍스트 윈도우 설계 전반을 가리키며 훈련·추론 양쪽에 적용
- 4.훈련 파이프라인 전용 용어로 RL Environment·Trainer·Rollout·Reward 4가지를 별도 정의
왜 중요한가?
ICLR 2026 현장에서 Harness/Scaffold 혼재 사용 문제가 표면화된 것을 계기로 작성된 실무 용어집으로, 동일 모델에 다른 Harness를 얹으면 전혀 다른 제품이 된다는 점을 구체 예시로 명확히 해 LLM 에이전트 개발·연구 커뮤니케이션의 공통 기준점을 제공한다.
🏷️ 언급 프로젝트
전체 내용이 궁금하다면?
원문을 직접 읽어보세요