Moonbeam: 절대/상대 음악 속성을 모두 포착하는 MIDI 기반 거대 언어 모델


Zixun Guo와 Simon Dixon이 개발한 Moonbeam은 81,600시간의 음악 데이터를 기반으로 한 혁신적인 MIDI 기반 음악 생성 모델입니다. 절대 및 상대적 음악 속성을 모두 포착하는 독창적인 토큰화 방식과 MRA를 통해 기존 모델들을 능가하는 성능을 보이며, 코드와 사전 학습 모델을 오픈소스로 공개하여 학계와 산업계에 큰 영향을 미칠 것으로 예상됩니다.

related iamge

81,600시간의 음악, 180억 개의 토큰: Moonbeam의 탄생

최근, Zixun Guo와 Simon Dixon이 이끄는 연구팀이 음악 분야의 혁신을 가져올 새로운 모델, Moonbeam을 발표했습니다. Moonbeam은 무려 81,600시간 분량의 음악과 180억 개의 토큰으로 구성된 방대한 MIDI 데이터셋을 기반으로 학습된, 트랜스포머 기반의 음악 생성 모델입니다. 이는 기존 모델들을 압도하는 규모로, 음악 생성의 새로운 지평을 열 것으로 기대됩니다.

절대와 상대, 두 세계를 잇는 다리: 혁신적인 토큰화와 MRA

Moonbeam의 가장 큰 특징은 절대적상대적 음악 속성을 모두 포착하는 능력입니다. 연구팀은 새로운 도메인 지식 기반 토큰화 방식을 도입하여 이를 실현했습니다. 여기에 더해, Multidimensional Relative Attention (MRA) 기법을 통해 추가적인 학습 매개변수 없이 상대적 음악 정보를 효과적으로 포착합니다. 이는 계산 효율성을 높이는 동시에 모델의 성능을 향상시키는 핵심 요소입니다.

성능 검증과 오픈소스 공개: 미래를 향한 발걸음

연구팀은 사전 학습된 Moonbeam을 기반으로 두 가지 파인튜닝 아키텍처를 제안하여 음악 이해와 조건부 음악 생성(음악 채우기 포함) 두 가지 범주의 다운스트림 작업에 적용했습니다. 그 결과, 4개 데이터셋에서 3가지 음악 분류 작업에 대한 정확도와 F1 점수에서 다른 대규모 사전 학습 음악 모델들을 대부분 능가하는 성능을 달성했습니다. 또한, 조건부 음악 생성 모델은 REMI 유사 토크나이저를 사용한 강력한 트랜스포머 기준 모델보다 우수한 성능을 보였습니다. 더욱 고무적인 것은, 연구팀이 코드, 사전 학습된 모델, 생성된 샘플을 Github에 공개하여 연구의 확산과 발전에 기여한다는 점입니다. 이는 학계와 산업계 모두에 큰 영향을 미칠 것으로 예상됩니다.

마무리: Moonbeam이 제시하는 미래

Moonbeam은 단순한 음악 생성 모델을 넘어, 음악의 이해와 창작에 대한 새로운 패러다임을 제시합니다. 절대적/상대적 음악 정보의 통합, 뛰어난 성능, 그리고 오픈소스 공개를 통해 Moonbeam은 음악 AI 분야의 혁신을 가속화하고, 더욱 다양하고 창의적인 음악 생성을 가능하게 할 것입니다. 이 연구는 음악 AI 분야의 괄목할 만한 진전이며, 앞으로 어떤 발전을 이룰지 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Moonbeam: A MIDI Foundation Model Using Both Absolute and Relative Music Attributes

Published:  (Updated: )

Author: Zixun Guo, Simon Dixon

http://arxiv.org/abs/2505.15559v1