LLM과 기존 연산 모듈이 혼합된 다중 에이전트 워크플로우에서 지연·신뢰성·비용 간의 근본적 트레이드오프를 분석했다. LLM 에이전트에는 추론·출력 토큰 수에 따른 파라메트릭 지수 신뢰도 함수를, 비LLM 에이전트에는 연산 노력 대비 출력 품질 모델을 도입했다. 지연·비용 제약 하의 순차 워크플로우 설계에서 워터필링(water-filling) 토큰 할당 정책과 쉐도우 가격 기반 최적 신뢰도 특성화를 도출했다. LLM 에이전트 시스템의 신뢰 가능한 설계를 위한 이론적 기반을 제공한다.
- •LLM 에이전트의 신뢰도를 토큰 수의 파라메트릭 지수 함수로 모델링, LLM/비LLM 혼합 워크플로우 성능 분석 틀 제시.
- •지연·비용 제약 하의 순차 워크플로우 최적화에서 워터필링 토큰 할당 정책 도출.
- •콰도우 가격 기반으로 최적 워크플로우 신뢰도를 특성화하는 이론 결과 제시.
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
- 1.LLM 기반 에이전트 워크플로의 지연·신뢰성·비용 트레이드오프를 분석하는 성능 모델 제안
- 2.LLM 에이전트 신뢰성을 추론·출력 토큰 함수인 파라메트릭 지수 신뢰도 함수로 포착
- 3.순차 워크플로 설계에서 워터필링 토큰 할당 정책과 섀도 가격 기반 최적 신뢰도 특성화 도출
왜 중요한가?
실제 LLM 에이전트 워크플로 설계 시 토큰 예산을 어느 에이전트에 얼마나 배분해야 신뢰성·비용·지연을 최적화할지 이론적 근거를 처음으로 제시했다.
본문 미리보기
arXiv:2605.23929v1 Announce Type: new Abstract: Modern AI systems increasingly rely on workflows composed of multiple interacting agents, some powered by large language models (LLMs) and others by conventional computational modules. This paper analyzes the fundamental tradeoffs between latency, reliability, and cost in LLM-enabled agentic workflows. We introduce performance models for both LLM and non-LLM agents that capture the relationship between computational effort and output quality, inco
전체 내용이 궁금하다면?
원문을 직접 읽어보세요