미국 주택 시장 예측의 혁신: HouseTS 데이터셋의 등장


Shengkun Wang 등 7명의 연구자들이 개발한 HouseTS는 미국 주택 시장의 장기 예측을 위한 대규모 다중 모달 공간-시간 데이터셋으로, 14가지 모델 평가 및 비전 언어 모델 활용을 통한 도시 진화 분석 등의 혁신적인 연구를 가능하게 합니다. Kaggle과 GitHub를 통한 공개로 재현성과 접근성을 확보했습니다.

related iamge

정확한 주택 가격 예측은 투자자, 계획자, 연구자 모두에게 필수적입니다. 하지만 장기 예측을 위한 충분한 공간-시간적 깊이와 풍부한 문맥 정보를 갖춘 재현 가능한 벤치마크는 부족했습니다. 이러한 문제를 해결하기 위해 Shengkun Wang을 비롯한 7명의 연구자들은 HouseTS, 대규모 다중 모달 공간-시간 미국 주택 데이터셋을 발표했습니다. 🎉

HouseTS는 2012년 3월부터 2023년 12월까지 미국 30개 주요 대도시 지역의 6,000개 우편번호에 대한 월별 주택 가격을 포함하는 89만 개가 넘는 기록으로 구성됩니다. 여기에 관심 지점(POI), 사회경제적 지표, 상세 부동산 지표까지 풍부하게 담겨 있어, 단순한 가격 예측을 넘어 주택 시장의 다각적인 측면을 분석할 수 있는 토대를 마련했습니다.

연구진은 고전 통계 기법, 심층 신경망(DNN), 사전 훈련된 시계열 기본 모델 등 14가지 모델을 평가하여 표준화된 성능 기준을 제시했습니다. 이는 향후 연구자들이 HouseTS를 이용하여 자신들의 모델을 객관적으로 비교하고 성능을 평가할 수 있도록 돕는 중요한 기여입니다.

특히 주목할 만한 점은 비전 언어 모델을 활용한 사례 연구입니다. 시간 기반 위성 이미지에서 지리적 변화에 대한 구조화된 텍스트 설명을 추출하여 도시 진화에 대한 해석 가능하고 근거 있는 통찰력을 제공합니다. 단순한 숫자 예측을 넘어, 도시 변화의 시각적, 언어적 이해를 제공하는 획기적인 시도입니다.

HouseTS는 Kaggle에서 호스팅되며, 모든 전처리 파이프라인, 벤치마크 코드, 문서는 GitHub에서 공개적으로 관리되어 완벽한 재현성과 쉬운 접근성을 보장합니다. 이를 통해 전 세계 연구자들이 HouseTS를 자유롭게 활용하고, 미국 주택 시장에 대한 보다 정확하고 심도있는 이해를 증진시킬 수 있을 것으로 기대됩니다. HouseTS는 미국 주택 시장 연구의 새로운 이정표를 세울 뿐만 아니라, 다양한 공간-시간 데이터 분석 분야에도 널리 활용될 수 있는 잠재력을 가지고 있습니다. 앞으로 HouseTS를 기반으로 한 다양한 연구 결과들이 기대됩니다. ✨


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset

Published:  (Updated: )

Author: Shengkun Wang, Yanshen Sun, Fanglan Chen, Linhan Wang, Naren Ramakrishnan, Chang-Tien Lu, Yinlin Chen

http://arxiv.org/abs/2506.00765v1