인도 주식시장 예측의 혁명: MiMIC 데이터셋과 다중 모달 모델


Sohom Ghosh, Arnab Maji, Sudip Kumar Naskar 세 연구원은 인도 주식 시장 예측을 위한 혁신적인 다중 모달 모델과 MiMIC 데이터셋을 개발했습니다. 텍스트, 이미지, 표를 포함한 다양한 정보원을 활용하고, Nifty 50, MidCap 50, SmallCap 50 지수를 포함한 방대한 데이터셋을 통해 예측 정확도를 크게 향상시켰습니다. CC-NC-SA-4.0 라이선스 하에 공개된 MiMIC 데이터셋은 향후 관련 연구의 활성화에 크게 기여할 것으로 기대됩니다.

related iamge

주식 시장 예측은 늘 투자자와 연구자들에게 어려운 숙제였습니다. 하지만 최근, 인도 주식 시장 예측에 획기적인 변화를 가져올 연구 결과가 발표되었습니다! Sohom Ghosh, Arnab Maji, Sudip Kumar Naskar 세 연구원이 이끄는 연구팀은 MiMIC (Multi-Modal Indian Earnings Calls) 데이터셋을 개발하고, 이를 기반으로 한 다중 모달 예측 모델을 제시했습니다.

텍스트, 이미지, 표까지! 다양한 정보원의 통합

기존의 주식 시장 예측 모델은 주로 텍스트 데이터(실적 발표 내용)에만 의존하는 경우가 많았습니다. 하지만 이번 연구는 한 단계 더 나아가, 실적 발표 텍스트, 관련 이미지, 표까지 모두 활용하는 다중 모달 접근 방식을 채택했습니다. 이는 마치 퍼즐 조각을 하나씩 맞추듯, 다양한 정보원으로부터 얻은 단서들을 종합적으로 분석하여 예측 정확도를 높이는 전략입니다. 이를 통해 단순히 숫자만 보는 것이 아니라, 실적 발표 자료의 시각적, 문맥적 정보까지 종합적으로 고려함으로써 보다 정확한 예측이 가능해졌습니다.

Nifty 50, MidCap 50, SmallCap 50 포함! 방대한 데이터셋 MiMIC

MiMIC 데이터셋은 인도 주식 시장의 주요 지수인 Nifty 50, Nifty MidCap 50, Nifty SmallCap 50에 상장된 기업들의 실적 발표 자료를 포함하고 있습니다. 이는 단순히 특정 기업에 국한되지 않고, 인도 주식 시장 전체를 아우르는 광범위한 데이터를 제공하며, 모델의 일반화 성능을 향상시키는 데 크게 기여합니다. 또한, 기본적인 재무 정보와 기술적 지표까지 포함하여, 분석의 깊이를 더했습니다. 이렇게 방대한 데이터셋과 정교한 분석 모델의 결합은 인도 주식 시장 예측의 정확도를 획기적으로 높일 것으로 기대됩니다.

공개된 데이터셋과 미래 연구의 가능성

연구팀은 MiMIC 데이터셋을 CC-NC-SA-4.0 라이선스 하에 공개하여, 다른 연구자들도 자유롭게 활용할 수 있도록 했습니다. 이는 인도 주식 시장 분석 및 예측 분야의 연구 활성화에 크게 기여할 것으로 예상되며, 향후 더욱 정교하고 정확한 주식 시장 예측 모델 개발에 밑거름이 될 것입니다. 이 연구는 단순히 인도 주식 시장에만 국한되지 않고, 다른 국가의 주식 시장 분석에도 적용 가능한 범용적인 방법론을 제시한다는 점에서 큰 의의를 지닙니다. 앞으로 MiMIC 데이터셋을 기반으로 한 다양한 연구 결과들이 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] MiMIC: Multi-Modal Indian Earnings Calls Dataset to Predict Stock Prices

Published:  (Updated: )

Author: Sohom Ghosh, Arnab Maji, Sudip Kumar Naskar

http://arxiv.org/abs/2504.09257v1