DeepInnovationAI: 학계 연구에서 산업 특허까지 AI 혁신의 지도를 그리다


DeepInnovationAI는 200만 건 이상의 특허와 350만 건 이상의 학술 논문을 포함하는 방대한 데이터셋으로, AI 혁신을 학계 연구에서 산업 특허까지 추적하여 분석할 수 있도록 합니다. 대규모 언어 모델과 초그래프 분석을 활용하여 데이터의 정확성과 신뢰성을 높였으며, AI 기술 발전과 상용화 과정에 대한 깊이 있는 이해를 제공합니다.

related iamge

DeepInnovationAI: AI 혁신의 새로운 지평을 열다

급변하는 인공지능(AI) 분야에서 혁신 패턴을 파악하고 연구에서 응용으로의 효과적인 기술 이전을 이해하는 것은 경제 성장에 필수적입니다. 하지만 기존 데이터 인프라는 단편화, 불완전한 적용 범위, 부족한 평가 능력으로 어려움을 겪고 있습니다.

이러한 문제를 해결하고자 등장한 것이 바로 DeepInnovationAI입니다. DeepInnovationAI는 학계 연구에서 산업 특허까지 AI 혁신을 포괄적으로 매핑하는 글로벌 데이터셋으로, 세 개의 구조화된 파일로 구성되어 있습니다.

첫째, DeepPatentAI.csv는 8개의 특징 속성을 가진 2,356,204건의 특허 기록을 포함합니다. 둘째, DeepDiveAI.csv는 13개의 메타데이터 필드를 가진 3,511,929건의 학술 논문을 담고 있습니다. 이 두 데이터셋은 대규모 언어 모델, 다국어 텍스트 분석, 이중 레이어 BERT 분류기를 활용하여 AI 관련 콘텐츠를 정확하게 식별하고, 초그래프 분석을 통해 강력한 혁신 지표를 생성합니다. 이는 단순한 데이터 나열을 넘어, AI 기술의 흐름을 깊이 있게 분석할 수 있는 기반을 마련합니다.

마지막으로 DeepCosineAI.csv는 의미 벡터 근접도 분석을 적용하여 약 1억 개의 논문-특허 유사도 쌍을 제공합니다. 이를 통해 이론적 발전이 상용 기술로 어떻게 전환되는지를 이해하는 데 도움을 줍니다.

DeepInnovationAI는 연구자, 정책 입안자, 업계 리더들이 트렌드를 예측하고 협력 기회를 발견할 수 있도록 지원합니다. 광범위한 시간적, 지리적 범위를 통해 기술 개발 패턴과 국제 경쟁 역학에 대한 상세한 분석을 지원하며, AI 혁신과 기술 이전 과정을 모델링하기 위한 기반을 구축합니다. 이는 AI 기술의 발전뿐 아니라, 국가 경쟁력 강화에도 크게 기여할 것으로 기대됩니다.

이 데이터셋은 단순한 데이터의 집합을 넘어, AI 혁신 생태계를 이해하고 미래를 예측하는 데 중요한 역할을 할 것입니다. 앞으로 DeepInnovationAI가 AI 연구와 산업 발전에 어떤 영향을 미칠지 주목할 필요가 있습니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents

Published:  (Updated: )

Author: Haixing Gong, Hui Zou, Xingzhou Liang, Shiyuan Meng, Pinlong Cai, Xingcheng Xu, Jingjing Qu

http://arxiv.org/abs/2503.09257v4