연구진은 오픈숍 스케줄링 문제(OSSP)를 풀기 위해 멀티헤드 어텐션 기반의 인코더-디코더 Transformer 스케줄링 정책을 제안했다. 처리시간 행렬만 입력으로 사용해 Taillard 벤치마크(4x4~10x10)로 학습했고, 재학습 없이 40x40~100x100 대규모 인스턴스에 적용했다. 대규모 문제에서 표준 하한 대비 평균 12.89~15.12%의 격차를 보였으며, SPT·LPT를 크게 앞서고 EST와는 근소한 차이로 경쟁력을 유지했다. 작은 인스턴스로 학습한 정책이 훨씬 큰 문제로 일반화됨을 보여, 별도 튜닝이 많이 필요한 고전 디스패칭 규칙의 가벼운 학습형 대안이 될 수 있음을 시사한다.
- •인코더-디코더 + 멀티헤드 어텐션 Transformer로 OSSP 스케줄링 정책 구성, 입력은 처리시간 행렬만 사용
- •Taillard 벤치마크(4x4~10x10)로 학습 후 재학습 없이 40x40~100x100 대규모 인스턴스에 적용
- •대규모 인스턴스에서 표준 하한 대비 평균 12.89~15.12% 격차 달성
- •SPT·LPT 대비 크게 우수하고 EST와는 근소한 차이로 경쟁력 유지
- •소규모 학습 정책의 대규모 일반화 입증, 고전 디스패칭 규칙의 가벼운 학습형 대안 제시
A Deep Reinforcement Learning (DRL)-Based Transformer Method for Solving the Open Shop Scheduling Problem
본문 미리보기
arXiv:2606.13682v1 Announce Type: new Abstract: The open shop scheduling problem (OSSP) arises in many industrial and service settings but remains computationally challenging as the number of jobs and machines increases. While exact methods quickly become intractable, classical dispatching rules and metaheuristics may require substantial tuning to maintain solution quality at large scales. This study develops a Transformer-based scheduling policy for OSSP using an encoder-decoder architecture w
전체 내용이 궁금하다면?
원문을 직접 읽어보세요