저고도 UAV 구조 임무 최적화: 생성형 AI 기반 다중 에이전트 강화 학습의 혁신
본 논문은 저고도 UAV의 구조 및 감시 임무를 향상시키기 위해 AI 기반 컨볼루션 신경망과 다중 에이전트 강화 학습을 결합한 새로운 협력 프레임워크를 제시합니다. Lyapunov 최적화 기법, 헝가리안 알고리즘, GDM 기반 MADDPG 알고리즘을 활용하여 작업 할당 및 탐색 최적화 문제를 해결하고, 시뮬레이션을 통해 작업 효율, 지연 시간 감소, 시스템 안정성 향상을 검증합니다.

AI 기반 컨볼루션 신경망을 활용한 저고도 무인 항공기(UAV)의 혁신적인 구조 및 감시 임무 수행
최근 Xin Tang 등 연구진은 AI 기반 컨볼루션 신경망을 활용하여 저고도 UAV와 지상 컴퓨팅 노드(GCN)가 알 수 없는 환경에서 구조, 검사, 감시 임무를 수행하는 기술을 발표했습니다. 하지만 높은 계산 요구량은 단일 UAV의 용량을 초과하여 시스템 불안정성을 야기하고, 제한적이고 역동적인 GCN 자원은 이 문제를 더욱 악화시킵니다.
제한된 자원과 역동적인 환경 속, 시스템 안정성을 위한 혁신적인 협력 구조
연구진은 이러한 과제를 해결하기 위해 UAV, 지상 로봇(GER), 고고도 플랫폼(HAP)을 포함하는 새로운 협력 프레임워크를 제안했습니다. UAV-to-GER(U2G) 및 UAV-to-HAP(U2H) 통신을 통해 자원 풀링을 가능하게 하여 UAV 오프로딩 작업에 대한 컴퓨팅 서비스를 제공합니다. 핵심은 작업 완료 시간과 에너지 소비를 최소화하면서 시스템 안정성을 유지하는 다목적 최적화 문제를 해결하는 것입니다.
Lyapunov 최적화 기법과 헝가리안 알고리즘, 그리고 생성 확산 모델(GDM) 기반 MADDPG 알고리즘의 조화
연구진은 Lyapunov 최적화 기법을 사용하여 안정성 제약 조건이 있는 원래 문제를 슬롯별 결정론적 문제로 변환했습니다. 그리고 헝가리안 알고리즘과 GDM 기반 다중 에이전트 심층 결정적 정책 경사(MADDPG) 접근 방식을 결합한 HG-MADDPG 알고리즘을 제안했습니다. 헝가리안 알고리즘은 탐색 영역 선택에 사용되어 UAV의 효율성을 높이고, GDM과 MADDPG는 작업 오프로딩 및 자원 할당과 같은 작업 할당 결정을 최적화하는 데 사용됩니다.
시뮬레이션 결과: 작업 오프로딩 효율, 지연 시간 감소, 시스템 안정성 향상
시뮬레이션 결과는 제안된 접근 방식의 효과를 보여주었습니다. 기존 방법과 비교하여 작업 오프로딩 효율이 크게 향상되었고, 지연 시간이 감소했으며, 시스템 안정성이 높아졌습니다. 이 연구는 AI 기반 컨볼루션 신경망과 다중 에이전트 강화 학습을 결합하여 저고도 UAV의 구조 및 감시 임무 수행 능력을 크게 향상시킨 혁신적인 성과입니다. 향후, 더욱 복잡하고 예측 불가능한 환경에서도 안정적이고 효율적인 UAV 운영을 위한 기반을 마련할 것으로 기대됩니다. 🎉
Reference
[arxiv] Task Assignment and Exploration Optimization for Low Altitude UAV Rescue via Generative AI Enhanced Multi-agent Reinforcement Learning
Published: (Updated: )
Author: Xin Tang, Qian Chen, Wenjie Weng, Chao Jin, Zhang Liu, Jiacheng Wang, Geng Sun, Xiaohuan Li, Dusit Niyato
http://arxiv.org/abs/2504.13554v1