데이터 치료사: AI가 전문가의 지식을 끌어내는 방법
신숭복, 전현, 홍상현, 닐라스 엘름퀴스트 연구팀이 개발한 '데이터 테라피스트'는 AI를 활용하여 전문가의 암묵적 지식을 끌어내 데이터 시각화를 개선하는 웹 기반 도구입니다. 다양한 분야 전문가를 대상으로 한 연구 결과, AI 지원을 통해 데이터에 대한 이해도를 높이고 시각화 디자인을 개선할 수 있음을 확인했습니다.

데이터 시각화는 단순히 기술적인 능력만으로는 부족합니다. 데이터가 존재하는 특정 분야에 대한 깊은 이해가 필수적입니다. 하지만 데이터의 출처, 품질, 의도된 사용법 등은 종종 데이터 자체에는 명시적으로 드러나지 않는 암묵적인 지식으로 존재합니다. 신숭복, 전현, 홍상현, 닐라스 엘름퀴스트 연구팀은 이러한 문제를 해결하기 위해 '데이터 테라피스트(Data Therapist)' 라는 웹 기반 도구를 개발했습니다.
암묵지의 표출: 대화형 AI의 역할
데이터 테라피스트는 대규모 언어 모델(LLM)을 기반으로 하여, 반복적인 질문과 답변(Q&A)과 상호작용적인 주석 기능을 결합한 혼합 방식(mixed-initiative process)을 통해 전문가들이 이러한 암묵적인 지식을 표출하도록 돕습니다. 시스템은 사용자가 제공한 데이터를 분석하고, 표적화된 질문을 제시하며, 다양한 수준의 세분화된 주석을 허용합니다. 그 결과 생성된 구조화된 지식 베이스는 사람과 자동화된 시각화 디자인 모두에 유용한 정보를 제공합니다.
다양한 분야 전문가 참여 연구
연구팀은 분자생물학, 회계, 정치학, 사용자 보안 분야의 전문가 짝(expert pairs)을 대상으로 질적 연구를 수행하여 데이터 테라피스트를 평가했습니다. 이 연구는 전문가들이 데이터에 대해 추론하는 방식에 대한 반복적인 패턴을 밝히고, AI 지원이 시각화 디자인을 개선할 수 있는 영역을 강조했습니다. 즉, AI가 전문가의 도메인 지식을 효과적으로 끌어내어 데이터 시각화의 질을 높이는 데 기여할 수 있음을 보여준 것입니다.
미래를 향한 시선
데이터 테라피스트는 단순한 도구를 넘어, 전문가와 AI의 협력을 통해 데이터 이해와 시각화의 새로운 지평을 열었습니다. 앞으로 이러한 기술은 더욱 발전하여 다양한 분야에서 데이터 기반 의사결정을 혁신적으로 변화시킬 것으로 기대됩니다. 하지만 동시에, AI가 생성하는 질문과 해석의 편향성을 최소화하고, 전문가의 판단을 보조하는 역할에 집중해야 함을 명심해야 합니다. 데이터 테라피스트의 성공적인 활용은 결국 인간 전문가와 AI의 상호보완적인 협력에 달려 있습니다.
Reference
[arxiv] Data Therapist: Eliciting Domain Knowledge from Subject Matter Experts Using Large Language Models
Published: (Updated: )
Author: Sungbok Shin, Hyeon Jeon, Sanghyun Hong, Niklas Elmqvist
http://arxiv.org/abs/2505.00455v1