공급망 AI 에이전트가 겪는 인식 격차—LLM은 정책을 해석하지만 물리적 근거가 없고, 강화학습은 흐름을 최적화하지만 비정형 제약에 무지함—를 메우는 REFLECTICHAIN을 제안했다. 이질적 공급망을 물리 보존이 반영된 6차원 그래프-잠재 공간으로 인코딩하는 생성형 공급망 세계 모델(SC-WM)과, 인식 불확실성(KL 신뢰영역 정책 적응)과 우연 불확실성(확률적 잠재 롤아웃)을 분리하는 이중 루프 학습을 결합한다. 10노드 반도체 벤치마크 Semi-Sim에서 근거 일관성 점수를 33.0% 향상(p<0.0001, d=2.78)시키고, 적대적 충격에도 82.3% 가동성을 유지하며 중간 압력에서 +40.2%의 반취약(anti-fragile) 거동을 보였다.
- •LLM의 의미 해석과 RL의 흐름 최적화 사이 인식 격차를 메우는 REFLECTICHAIN 제안
- •물리 보존이 반영된 6차원 그래프-잠재 공간의 생성형 공급망 세계 모델(SC-WM)
- •인식 불확실성과 우연 불확실성을 분리하는 이중 루프 학습
- •Semi-Sim 벤치마크에서 근거 일관성 점수 33.0% 향상, 적대적 충격 속 가동성 82.3% 유지
- •중간 압력에서 +40.2%의 반취약 거동 확인
ReflectiChain: Epistemic Grounding in LLM-Driven World Models for Supply Chain Resilience
- 1.REFLECTICHAIN, LLM의 의미이해와 RL의 물리최적화 간 인식격차를 결합
- 2.공급망을 6차원 그래프-잠재공간으로 인코딩한 생성형 SC-WM 제시
- 3.인식적·우연적 불확실성을 분리하는 이중 루프 학습 도입
- 4.Semi-Sim 벤치마크서 근거일관성 33% 향상·적대충격서 82.3% 운용성 유지
왜 중요한가?
정책을 해석하나 물리적 근거가 없는 LLM과, 흐름을 최적화하나 비정형 제약에 무지한 RL의 상보적 약점을 세계모델로 메워, 적대적 충격 속에서도 안티프래자일(중압하 +40.2%) 거동을 보이는 공급망 에이전트 설계를 제시했다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.10359v1 Announce Type: new Abstract: AI agents in supply chains face a fundamental epistemic gap: large language models (LLMs) interpret policies but lack physical grounding, while reinforcement learning (RL) optimizes flows but is semantically blind to unstructured constraints. We introduce REFLECTICHAIN, bridging this gap through a Generative Supply Chain World Model (SC-WM) - encoding heterogeneous supply networks into a 6-dim graph-latent space with physical conservation - and Do
전체 내용이 궁금하다면?
원문을 직접 읽어보세요