우주 컴퓨팅 시대의 서막: 위성 연합 학습으로 초거대 AI 모델의 한계를 뛰어넘다
본 기사는 위성의 제한된 연산 능력에도 불구하고, 위성-지상 협업 연합 미세 조정 프레임워크와 효율적인 통신 전략을 통해 초거대 AI 모델을 위성에서 효과적으로 학습시키는 연구에 대해 소개합니다. 이를 통해 우주 컴퓨팅 분야의 새로운 가능성을 제시하며, 약 33%의 훈련 시간 단축 효과를 확인했습니다.

인공지능(AI)과 저궤도 위성(LEO) 기술의 발전은 원격 감지 초거대 모델의 다양한 응용 분야를 촉진했습니다. 하지만, 이러한 모델을 지상으로 직접 다운로드하여 미세 조정하는 것은 개인 정보 보호 문제와 제한된 대역폭으로 인해 어려움을 겪고 있습니다.
Yan zhu, Jingyang zhu 등 연구진은 이러한 문제를 해결하기 위해 위성 연합 학습(FL) 이라는 혁신적인 접근 방식을 제안했습니다. 위성 연합 학습은 모델을 위성에서 직접 미세 조정하고 데이터를 다운로드하지 않고 모델 업데이트를 집계하는 방식입니다. 하지만, 초거대 모델의 경우 위성의 연산 능력이 기존 위성 FL 프레임워크에서 효과적인 온보드 미세 조정을 지원하기에는 부족하다는 한계가 존재합니다.
연구진은 이러한 과제를 해결하기 위해 위성-지상 협업 연합 미세 조정 프레임워크를 제시했습니다. 이 프레임워크의 핵심은 모델 구성 요소를 합리적으로 분해하고 할당하여 제한된 온보드 연산 능력을 완화하는 데 있습니다. 미세 조정 중에 위성은 순전파 및 역전파를 위해 지상국 또는 다른 위성과 중간 결과를 교환합니다. 이는 간헐적인 위성-지상 통신, 짧은 위성-지상 통신 창, 불안정한 궤도 간 위성 링크(ISL)와 같은 우주 전송 네트워크의 특수한 통신 토폴로지로 인해 통신 과제를 야기합니다.
전송 지연을 줄이기 위해 연구진은 통신 및 컴퓨팅 리소스를 통합하는 맞춤형 통신 전략을 추가로 도입했습니다. 구체적으로, 궤도 내 병렬 통신 전략, 토폴로지 인식 위성-지상 통신 전략, 지연 최소화 궤도 간 통신 전략을 제안하여 우주 통신 비용을 줄였습니다. 시뮬레이션 결과는 훈련 시간을 약 33% 단축하는 것을 보여주었습니다.
이 연구는 우주 컴퓨팅 분야에서 초거대 AI 모델의 활용 가능성을 크게 확장하는 획기적인 성과입니다. 위성의 제한된 자원을 효율적으로 활용하는 기술은 앞으로 우주 탐사, 기후 변화 관측, 재난 예측 등 다양한 분야에서 혁신적인 발전을 가져올 것으로 기대됩니다. 하지만, 우주 환경의 특수성과 안정성 문제를 완벽하게 해결하기 위한 추가적인 연구가 지속적으로 필요할 것입니다.
Reference
[arxiv] Satellite Federated Fine-Tuning for Foundation Models in Space Computing Power Networks
Published: (Updated: )
Author: Yan zhu, Jingyang zhu, Ting Wang, Yuanming Shi, Chunxiao Jiang, Khaled Ben Letaief
http://arxiv.org/abs/2504.10403v1