딥러닝으로 대규모 작업 할당 문제 해결: 실제 세계 적용 가능한 DRL 기반 DSS
본 논문은 딥 강화 학습(DRL)을 이용하여 실제 세계의 대규모 동적 작업 할당 문제(DTAP)를 해결하는 혁신적인 의사결정 지원 시스템(DSS)을 제시합니다. 그래프 구조와 새로운 보상 함수를 통해 실제 로그 데이터 기반의 다양한 DTAP 인스턴스에서 기존 방법보다 우수하거나 동등한 성능을 달성했습니다. 이는 실제 산업 현장에 적용 가능한 실용적인 시스템으로서, 다양한 분야에 획기적인 개선을 가져올 수 있을 것으로 기대됩니다.

Riccardo Lo Bianco, Willem van Jaarsveld, Jeroen Middelhuis, Luca Begnardi, Remco Dijkman 등이 발표한 논문 "Automated decision-making for dynamic task assignment at scale"은 실시간으로 자원을 작업에 매칭하는 동적 작업 할당 문제(DTAP) 에 대한 혁신적인 해결책을 제시합니다. 특히, 각 작업이 확률적인 활동 순서로 구성된 복잡한 DTAP에 초점을 맞춰, 딥 강화 학습(DRL) 을 활용하여 최적의 직원-활동 할당을 결정하는 의사결정 지원 시스템(DSS)을 개발했습니다.
기존 연구들이 주로 소규모 합성 문제에 국한되었던 것과 달리, 이 연구는 실제 세계의 대규모 DTAP에 적용 가능한 시스템을 제시합니다. 핵심은 두 가지 혁신적인 요소에 있습니다. 첫째, 그래프 구조를 사용하여 관측값과 행동을 효과적으로 표현함으로써 다양한 DTAP에 유연하게 대응합니다. 둘째, 평균 작업 처리 시간 최소화라는 목표와 수학적으로 동등한 새로운 보상 함수를 도입하여 DRL 에이전트의 학습 효율을 높였습니다.
연구팀은 프로세스 마이닝을 통해 실제 로그 데이터에서 추출한 다섯 가지 DTAP 인스턴스를 이용하여 제안된 DSS를 평가했습니다. 그 결과, 제안된 DRL 에이전트는 모든 인스턴스에서 기존 최고 성능의 기준 모델과 동등하거나 더 나은 성능을 보였으며, 다양한 시간 범위와 인스턴스에 대해 일반화되는 능력을 입증했습니다.
이는 단순한 이론적 모델이 아닌, 실제 산업 현장에 바로 적용될 수 있는 실용적인 시스템임을 의미합니다. 대규모 작업 관리가 필요한 다양한 분야, 예를 들어 고객센터 운영, 물류 관리, 제조 공정 최적화 등에 획기적인 개선을 가져올 수 있을 것으로 기대됩니다. 하지만, 실제 적용 시에는 데이터의 질과 양, 시스템 통합 과정 등에 대한 추가적인 고려가 필요할 것입니다. 향후 연구에서는 더욱 다양한 실제 환경에서의 테스트와 시스템의 안정성 및 확장성에 대한 연구가 필요할 것으로 예상됩니다.
핵심 내용:
- 실제 세계 대규모 DTAP를 위한 DRL 기반 DSS 제안
- 그래프 구조를 이용한 유연한 관측 및 행동 표현
- 수학적으로 검증된 새로운 보상 함수
- 실제 데이터 기반 평가 및 성능 검증
- 다양한 시간 범위와 인스턴스에 대한 일반화 능력
Reference
[arxiv] Automated decision-making for dynamic task assignment at scale
Published: (Updated: )
Author: Riccardo Lo Bianco, Willem van Jaarsveld, Jeroen Middelhuis, Luca Begnardi, Remco Dijkman
http://arxiv.org/abs/2504.19933v1