브라질 소득세 AI 혁신: BR-TaxQA-R 데이터셋 공개


브라질 상파울루대 연구진이 개발한 BR-TaxQA-R 데이터셋은 브라질 소득세법 관련 질의응답에 특화된 자원으로, OpenAI 기술을 활용한 RAG 파이프라인 성능 평가를 통해 상용 AI 모델과의 비교 분석 결과를 제시합니다. 법률 분야 AI의 신뢰성 확보를 위해 전문가 검토의 중요성을 강조하며, 데이터셋의 공개를 통해 AI 기반 법률 서비스 발전에 기여할 것으로 기대됩니다.

related iamge

브라질 상파울루대학교 연구진이 브라질 개인 소득세법에 관한 질의응답 데이터셋인 BR-TaxQA-R을 공개했습니다. 이는 AI 기반 법률 서비스의 발전에 중요한 이정표가 될 전망입니다.

BR-TaxQA-R은 브라질 국세청의 공식 질의응답 문서(2024년) 715개 질문을 바탕으로 제작되었으며, 법 조항과 CARF(Conselho Administrativo de Recursos Fiscais)의 행정 판결문을 포함하여 더욱 풍부한 정보를 제공합니다. 연구진은 OpenAI의 임베딩과 GPT-4o-mini를 활용하여 Retrieval-Augmented Generation (RAG) 파이프라인을 구축, ChatGPT 및 Perplexity.ai 등 상용 도구와 성능을 비교했습니다.

흥미로운 점은, BR-TaxQA-R 기반 RAG 파이프라인이 상용 시스템보다 질문과 응답의 관련성이 더 높게 나타났다는 것입니다. 즉, 사용자 질문에 더욱 정확하게 부합하는 답변을 생성했다는 의미입니다. 반면, 상용 모델은 사실 정확성과 유창성 측면에서 더 높은 점수를 얻었습니다. 이는 법률적 근거를 갖춘 응답 생성과 언어적 유창성 사이의 균형점을 고려해야 함을 시사합니다.

연구 결과는 고위험 분야(예: 세금)에서 AI가 생성한 답변의 법적 유효성을 보장하기 위해서는 전문가 검토가 필수적임을 강조합니다. 이는 단순히 기술적 성능 향상뿐 아니라 윤리적, 법적 책임까지 고려해야 함을 보여주는 중요한 시사점입니다.

BR-TaxQA-R 데이터셋은 Hugging Face에서 공개되어 누구나 활용 가능합니다. 이를 통해 브라질 소득세법 관련 AI 모델 개발이 활성화되고, 더욱 정확하고 효율적인 법률 서비스 제공의 가능성이 열릴 것으로 기대됩니다. 앞으로 AI와 법률 분야의 협력이 어떻게 발전할지 지켜볼 필요가 있습니다. 🎉


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] BR-TaxQA-R: A Dataset for Question Answering with References for Brazilian Personal Income Tax Law, including case law

Published:  (Updated: )

Author: Juvenal Domingos Júnior, Augusto Faria, E. Seiti de Oliveira, Erick de Brito, Matheus Teotonio, Andre Assumpção, Diedre Carmo, Roberto Lotufo, Jayr Pereira

http://arxiv.org/abs/2505.15916v1