똑똑한 반사 표면으로 더 똑똑해진 광 무선 통신: 두 에이전트 심층 강화 학습의 활약


본 논문은 IRS와 NOMA 기술을 결합한 OWC 네트워크에서 에너지 효율과 공정성을 극대화하기 위해 두 에이전트 기반 DRL 알고리즘을 제시합니다. 실험 결과, 제안된 알고리즘은 기존 방식보다 뛰어난 성능을 보였습니다.

related iamge

최근, 지능형 반사 표면(IRS) 기술이 가시광 통신(VLC) 시스템의 새로운 가능성으로 떠오르고 있습니다. IRS는 장애물로 인한 직접적인 시선(LoS) 차단 문제를 극복하고 통신 범위를 확장하는 데 큰 기여를 할 수 있기 때문입니다. 특히, 하향 링크 비직교 다중 접속(NOMA) 기술과 IRS를 통합하면 다수의 사용자에게 더 높은 데이터 전송률을 제공하여 시스템 성능을 크게 향상시킬 수 있습니다.

하지만, 이러한 IRS 지원 NOMA-VLC 시스템의 최적화 문제는 쉽지 않습니다. Ahrar N. Hamad 등의 연구진은 최대 에너지 효율(SEE)과 공정성을 달성하기 위한 전력 할당 및 IRS 거울 방향 최적화 문제를 다루면서 이 어려움에 직면했습니다. 문제의 비볼록성과 비선형 제약 조건으로 인해, 기존의 최적화 방법으로는 실시간 해결이 불가능했습니다.

연구진은 이 문제를 해결하기 위해 두 에이전트 기반의 심층 강화 학습(DRL) 알고리즘을 고안했습니다. 이는 중앙 집중식 학습과 분산 실행을 결합한 독창적인 접근 방식입니다. 이를 통해 동적인 환경에서도 빠르고 실시간으로 최적의 전력 할당과 IRS 방향을 결정할 수 있습니다.

연구 결과는 놀랍습니다. 제안된 DRL 알고리즘은 기존의 DRL 알고리즘이나 IRS를 사용하지 않은 시스템에 비해 훨씬 우수한 성능을 보였습니다. 특히, 에너지 효율과 사용자 간의 공정성을 크게 향상시켰다는 점에서 주목할 만합니다. 이는 IRS 기술과 DRL 알고리즘의 시너지 효과를 명확하게 보여주는 결과입니다.

이 연구는 단순한 기술적 진보를 넘어, 더욱 효율적이고 공정한 차세대 광 무선 통신 시스템 구축을 위한 중요한 발걸음을 내디뎠습니다. 앞으로도 이러한 지능형 기술의 발전이 더욱 가속화되어 우리의 일상 생활에 혁신적인 변화를 가져올 것으로 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Two-Agent DRL for Power Allocation and IRS Orientation in Dynamic NOMA-based OWC Networks

Published:  (Updated: )

Author: Ahrar N. Hamad, Ahmad Adnan Qidan, Taisir E. H. El-Gorashi, Jaafar M. H. Elmirghani

http://arxiv.org/abs/2504.18937v1