안정적인 신경망 제어기 학습의 혁신: Zubov 표본 추출과 반복적 영역 확장


리 하오유 등 연구진은 신경망 제어기의 안정성을 보장하고 유인 영역을 효율적으로 추정하는 새로운 두 단계 학습 프레임워크를 제안했습니다. Zubov 표본 추출, 반복적 영역 확장, 향상된 αβ-CROWN 검증기를 활용하여 기존 방법 대비 유인 영역 크기를 최대 15만 배, 검증 속도를 최대 1만 배 향상시켰습니다.

related iamge

학습 기반 신경망 제어기는 뛰어난 실험적 성능을 보여주지만, 안정성 보장과 유인 영역(Region of Attraction) 추정은 여전히 어려운 과제입니다. 기존 연구들은 이 문제에 대한 해결책을 제시했지만, 상당한 보수성이 남아있었습니다. 리 하오유(Haoyu Li) 등 연구진은 이러한 한계를 극복하기 위해 두 단계 학습 프레임워크를 제안했습니다.

혁신적인 두 단계 학습 프레임워크

이 연구의 핵심은 Zubov 영감을 받은 유인 영역 특성화를 활용하여 안정성 경계를 직접 추정하는 것입니다. 연구진은 이를 바탕으로 새로운 데이터 표본 추출 전략영역 업데이트 메커니즘을 제안하여 학습 과정에서의 보수성을 획기적으로 줄였습니다. 기존의 연속 시간 시스템 연구는 SMT 솔버에 의존하여 Lyapunov 조건을 공식적으로 검증했지만, 이 연구는 최첨단 신경망 검증기인 αβ-CROWN을 확장하여 동역학 시스템의 Jacobian을 통한 자동 경계 전파 기능과 효율적인 검증 기법을 추가했습니다. 이는 비용이 많이 드는 이분법(bisection)을 피할 수 있게 해줍니다.

놀라운 실험 결과

연구진은 다양한 차원의 여러 복잡한 비선형 시스템에서 제어기를 합성하고 검증하는 실험을 수행했습니다. 그 결과, 기존 방법과 비교하여 유인 영역의 크기가 5배에서 최대 15만 배까지 증가했으며, 연속 시스템에 대한 검증 속도는 기존 SMT 솔버인 dReal에 비해 40배에서 최대 1만 배까지 빨라졌습니다. 이는 https://github.com/Verified-Intelligence/Two-Stage_Neural_Controller_Training 에서 공개된 코드를 통해 확인할 수 있습니다.

미래를 향한 발걸음

이 연구는 신경망 제어기의 안정성과 신뢰성을 높이는 데 중요한 발걸음입니다. 더욱 안전하고 신뢰할 수 있는 AI 기반 시스템 개발에 기여할 것으로 기대됩니다. 향후 연구에서는 더욱 복잡한 시스템에 대한 적용 및 실제 시스템으로의 확장이 중요한 과제가 될 것입니다. 하지만 이번 연구 결과는 AI 제어 시스템의 안정성과 효율성을 획기적으로 개선할 가능성을 보여주는 중요한 이정표입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Two-Stage Learning of Stabilizing Neural Controllers via Zubov Sampling and Iterative Domain Expansion

Published:  (Updated: )

Author: Haoyu Li, Xiangru Zhong, Bin Hu, Huan Zhang

http://arxiv.org/abs/2506.01356v1