텍스트로 3D 모델링 시대의 개막: Text-to-CadQuery의 놀라운 가능성


Haoyang Xie와 Feng Ju가 개발한 Text-to-CadQuery는 대규모 언어 모델을 활용하여 텍스트로부터 직접 CadQuery 코드를 생성하는 혁신적인 시스템입니다. 17만 개의 CadQuery 주석을 추가한 데이터셋과 다양한 크기의 LLM 미세 조정을 통해 상위 1개 정확도 일치율을 58.8%에서 69.3%로 향상시키는 놀라운 성과를 달성했습니다. 이는 생성형 CAD 기술의 획기적인 발전이며, 다양한 산업 분야에 혁신적인 변화를 가져올 잠재력을 지닙니다.

related iamge

텍스트로 3D 모델링 시대의 개막: Text-to-CadQuery의 놀라운 가능성

오늘날, 컴퓨터 지원 설계(CAD)는 현대 공학 및 제조의 근간을 이룹니다. 하지만 전문적인 지식과 특수 소프트웨어 없이는 CAD 모델 생성이 어려운 현실입니다. 하지만 최근 대규모 언어 모델(LLM)의 발전으로 자연어를 이용해 3D 모델을 생성하는 생성형 CAD라는 새로운 가능성이 열렸습니다.

Xie와 Ju가 이끄는 연구팀은 이러한 가능성을 현실로 만들기 위해 Text-to-CadQuery라는 혁신적인 시스템을 개발했습니다. 기존의 방식들은 자연어를 CAD 명령어 시퀀스로 변환하는 복잡한 중간 과정을 거쳐야 했지만, Text-to-CadQuery는 파이썬 기반 스크립팅 언어인 CadQuery 코드를 직접 생성합니다. 이를 통해 불필요한 복잡성을 제거하고 3D 모델 생성 과정을 간소화했습니다.

연구팀은 LLM이 이미 뛰어난 파이썬 코드 생성 및 공간 추론 능력을 가지고 있다는 점에 착안하여, Text-to-CadQuery 데이터셋에 17만 개의 CadQuery 주석을 추가하여 데이터셋을 확장했습니다. 그리고 다양한 크기의 6개의 오픈소스 LLM을 미세 조정하여 성능을 비교 분석했습니다.

그 결과, 최고 성능 모델은 상위 1개 정확도 일치율이 58.8%에서 69.3%로 향상, Chamfer Distance는 48.6% 감소하는 놀라운 결과를 보였습니다. 이는 LLM의 크기가 커질수록 미세 조정 후 성능이 향상된다는 가설을 뒷받침하는 결과입니다.

Text-to-CadQuery는 CAD 모델 생성 과정의 혁신을 가져올 뿐만 아니라, 전문적인 지식이 없는 사용자도 쉽게 3D 모델을 생성할 수 있는 길을 열었습니다. 이는 다양한 산업 분야에 혁신적인 변화를 가져올 수 있는 잠재력을 지닌 기술입니다. 자세한 내용은 프로젝트 페이지 (https://github.com/Text-to-CadQuery/Text-to-CadQuery)에서 확인할 수 있습니다.

향후 전망: 향상된 데이터셋과 더욱 강력한 LLM의 등장은 Text-to-CadQuery의 성능을 더욱 향상시키고, 보다 복잡하고 정교한 3D 모델 생성을 가능하게 할 것으로 예상됩니다. 이 기술은 단순한 CAD 모델 생성을 넘어, AI 기반 설계 자동화 및 개인 맞춤형 제품 제작 등 다양한 분야에 응용될 가능성을 가지고 있습니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Text-to-CadQuery: A New Paradigm for CAD Generation with Scalable Large Model Capabilities

Published:  (Updated: )

Author: Haoyang Xie, Feng Ju

http://arxiv.org/abs/2505.06507v1