Can LLMs Be CEOs? Benchmarking Strategic Resource Reallocation with Multi-Role Agent Simulation
- 1.LLM의 CEO급 전략적 자원 재배분 능력을 평가하는 멀티에이전트 벤치마크 'CEO-Bench'
- 2.CFO·CTO·COO·CMO 4명의 상충 조언을 종합해 배분안 수립, 역할통합·대담성 등 4축 평가
- 3.5개 프런티어 모델·13개 시나리오서 구조적 타당성은 높지만 전략적 보정에서 크게 갈림
- 4.단일 조언자 포획·모호성하 보수적 기본값·이력 망각 등 실패와 통합-대담성 트레이드오프 발견
왜 중요한가?
기존 벤치마크가 고립된 인지 과제에 집중한 것과 달리, 정보 비대칭·조직 제약하 상충 의견 종합이라는 실제 경영 의사결정의 핵심을 측정해 LLM의 조직 의사결정 능력 한계를 드러냈다.
🏷️ 언급 프로젝트
본문 미리보기
arXiv:2606.17459v1 Announce Type: new Abstract: Evaluating the decision-making capabilities of large language models (LLMs) is a growing research priority, yet existing benchmarks focus on isolated cognitive tasks such as reasoning, knowledge retrieval, and economic rationality in stylized settings. These evaluations overlook the defining challenge of real executive decision-making: integrating conflicting recommendations from specialized stakeholders under information asymmetry, organizational
전체 내용이 궁금하다면?
원문을 직접 읽어보세요