강화학습 기반 주식 거래 알고리즘의 혁신: 최적의 시간 창을 찾아라!
Sina Montazeria, Haseebullah Jumakhanb, Amir Mirzaeinia 연구팀은 2D CNN을 활용한 강화학습 기반 주식 거래 알고리즘을 통해 시간 창 최적화의 중요성을 입증했습니다. 특징 재배열을 통해 최적 시간 창을 찾고, Global X Guru 등 경쟁사들을 능가하는 성능을 달성했습니다.

강화학습으로 주식 시장 정복하기: 시간의 비밀을 풀다!
최근 AI 기반 주식 거래 알고리즘 개발이 활발한 가운데, Sina Montazeria, Haseebullah Jumakhanb, Amir Mirzaeinia 연구팀이 혁신적인 연구 결과를 발표했습니다. "강화학습을 이용한 주식 시장 거래에서 최적의 거래 이력 찾기" 라는 제목의 이 논문은 2D Convolutional Neural Networks (CNNs)를 활용하여 금융 심층 강화 학습(DRL) 모델의 시간적 윈도우(temporal windows) 최적화에 초점을 맞추고 있습니다.
시간, 하이퍼파라미터로 만들다!
연구팀은 기존의 방식을 탈피하여 시간적 영역을 모델의 하이퍼파라미터로 설정하는 새로운 시도를 선보였습니다. 2주에서 12주까지 관찰 기간을 점진적으로 늘려가며, 시간 창의 크기가 모델 성능에 미치는 영향을 분석했습니다. 여기서 핵심은 바로 데이터 특징 재배열입니다. 회사별로 특징을 그룹화하여 모델이 각 회사의 데이터를 전체적으로 파악하도록 한 경우와, 일반적인 카테고리별로 특징을 배열한 경우를 비교 분석했습니다.
놀라운 결과: 시간의 길이가 성능을 좌우한다!
실험 결과, 특징 재배열을 하지 않은 경우에는 짧은 시간 창이 효과적이었습니다. 하지만 회사별로 특징을 재배열하면 모델은 더 긴 시간 창을 활용하여 성능을 크게 향상시켰습니다. 이러한 패턴은 다우존스 지수 30개 기업을 대상으로, 서로 다른 특징을 가진 두 개의 데이터셋에서 일관되게 관찰되었습니다. 이는 시간 창의 최적화가 단순히 데이터의 양에만 의존하는 것이 아니라, 데이터의 구조적 특성과 밀접한 관련이 있음을 보여줍니다.
Mirae Asset을 넘어서: 압도적인 성능!
결과적으로 연구팀은 Global X Guru 와 같은 글로벌 금융 서비스 업체들을 능가하는, Mirae Asset을 벤치마크로 삼을 만큼 뛰어난 성능을 가진 주식 거래 모델을 개발하는 데 성공했습니다. 이는 시간 창 최적화라는 단순한 변화가 주식 거래 알고리즘의 성능에 얼마나 큰 영향을 미칠 수 있는지 보여주는 강력한 증거입니다.
미래를 향한 전망: 더욱 정교한 AI 주식 거래 시스템
이번 연구는 단순히 새로운 알고리즘을 제시하는 것을 넘어, 강화학습 기반 주식 거래 시스템 개발에 있어 시간적 요소의 중요성을 강조합니다. 앞으로 더욱 정교한 시간 창 최적화 기법과 데이터 처리 방식을 통해 AI 기반 주식 거래 시스템의 성능 향상을 기대할 수 있습니다. 시간의 흐름을 정확하게 이해하고 활용하는 것이야말로 미래 주식 시장을 지배하는 열쇠가 될 것입니다!
Reference
[arxiv] Finding Optimal Trading History in Reinforcement Learning for Stock Market Trading
Published: (Updated: )
Author: Sina Montazeria, Haseebullah Jumakhanb, Amir Mirzaeinia
http://arxiv.org/abs/2502.12537v1