Dynamic Flexible Job Shop Scheduling Problem(DFJSP)을 위한 진단 프레임워크 DynaSchedBench를 제안한다. Sequential Event-Space Calibrator(SESC)가 Schedule Stress Index(SSI)를 계산해 인스턴스 난이도를 계층화하며, 진화적 기준선보다 계산 효율이 높다. 핵심 발견은 단계별 온라인 의사결정에서 전체 구조 정보를 제공하면 오히려 성능이 저하되는 '관찰성 역설(Observability Paradox)'로, 대부분의 LLM 에이전트가 강력한 디스패칭 기준선을 일관되게 넘지 못함을 보였다.
- •SESC와 SSI로 DFJSP 인스턴스 난이도를 계층화하는 보정 프레임워크를 구성했다.
- •LLM 에이전트에 전체 구조 정보를 제공하면 오히려 성능이 저하되는 '관찰성 역설'을 최초 규명했다.
- •도구 증강·정제 전략 모두 LLM 에이전트 성능을 안정적으로 향상시키지 못했다.
- •대부분의 LLM 에이전트가 강력한 디스패칭 기준선을 일관되게 넘지 못해 우월한 최적화기보다 휴리스틱 근사기에 가깝다.
DynaSchedBench: Calibrated Dynamic Scheduling Benchmarks and Observability Paradox in LLM-based Scheduling Agents
- 1.DynaSchedBench: DFJSP용 진단 프레임워크, SESC로 Schedule Stress Index 기반 난이도 계층화
- 2.'관찰 가능성 역설': 에이전트에 전체 구조 정보 제공 시 간결한 정보 대비 성능 저하 발생
- 3.대부분 LLM 에이전트가 강력한 디스패칭 베이스라인을 일관되게 능가하지 못함
왜 중요한가?
LLM 기반 스케줄링 에이전트가 동적 환경에서 전통 방법을 능가한다는 가정을 체계적으로 도전했으며, 더 많은 정보가 오히려 성능을 떨어뜨리는 '관찰 가능성 역설'을 발견한 것이 중요하다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2605.27566v1 Announce Type: new Abstract: Progress in neural combinatorial optimization for Dynamic Flexible Job Shop Scheduling Problem (DFJSP) is currently hindered by a methodological tension: static benchmarks encourage benchmark overfitting, while uncalibrated generators obscure algorithmic capability with stochastic noise. To resolve this, we introduce \textbf{DynaSchedBench}, a diagnostic framework for DFJSP that rigorously controls the instance-generation process. Instead of relyi
전체 내용이 궁금하다면?
원문을 직접 읽어보세요