일반인을 위한 법률 지식 접근성 향상: 대규모 언어 모델 기반 법률 질문 뱅크 구축
본 연구는 대규모 사전 훈련 언어 모델을 활용하여 법률 질문 데이터베이스를 구축하고, 이를 기반으로 한 CLIC 페이지 및 추천 시스템을 통해 일반인의 법률 정보 접근성을 향상시키는 새로운 접근 방식을 제시합니다. 기계 생성 질문과 인간 작성 질문의 비교 분석을 통해 각 방식의 장단점을 분석하고, 실제 시스템 프로토타입을 공개하여 접근 방식의 실용성을 입증했습니다.

일반인을 위한 법률 지식의 문턱을 낮추다: 혁신적인 3단계 접근 방식
법률 정보 접근은 정의로운 사회를 위한 필수 요소입니다. 하지만 법률 문서는 전문 용어로 가득 차 있어 일반인에게는 이해하기 어려운 경우가 많습니다. 홍콩과학기술대학교(HKUST) 연구팀(Mingruo Yuan 외)은 이러한 문제를 해결하기 위해 대규모 사전 훈련 언어 모델을 활용한 혁신적인 3단계 접근 방식을 제시했습니다. 이 연구는 단순히 법률 문서를 제공하는 것을 넘어, 일반인도 쉽게 이해하고 활용할 수 있도록 법률 정보를 변환하는 데 초점을 맞춥니다.
1단계: CLIC 페이지 - 전문 용어를 쉽게 풀어쓰다
연구팀은 먼저 법률 조항들을 일반인이 이해하기 쉬운 작은 단위의 설명(CLIC 페이지)으로 변환했습니다. 각 CLIC 페이지는 특정 법률 개념을 쉽게 설명하는 데 집중합니다. 이는 마치 어려운 법률 용어 사전을 만드는 것과 같습니다. 복잡한 법 조항을 쉽게 풀어 쓴 CLIC 페이지는 법률 지식 접근성을 크게 높일 수 있는 핵심 요소입니다.
2단계: 법률 질문 뱅크(LQB) - 궁금증을 해소하는 지식 창고
CLIC 페이지를 기반으로 연구팀은 법률 질문 뱅크(LQB)를 구축했습니다. LQB는 CLIC 페이지에 답이 있는 다양한 법률 질문의 모음입니다. 여기서 핵심은 바로 GPT-3와 같은 대규모 언어 모델을 활용하여 질문을 자동 생성했다는 점입니다. 기계 생성 질문(MGQs)은 인간 작성 질문(HCQs)보다 확장성과 비용 효율성이 높고, 다양한 질문을 제공할 수 있다는 장점을 보였습니다. 물론 HCQs는 MGQs보다 정확성이 높다는 점을 감안하여, 두 방식의 장점을 모두 활용하는 것이 중요한 과제로 남았습니다.
3단계: CLIC 추천 시스템(CRec) - 맞춤형 법률 정보 제공
마지막으로 연구팀은 CLIC 추천 시스템(CRec)을 설계했습니다. 사용자가 자신의 법적 상황을 설명하면, CRec는 이를 분석하여 관련 질문을 LQB에서 찾아내고, 해당 CLIC 페이지를 추천합니다. 사용자는 자신의 상황에 맞는 법률 정보를 쉽고 빠르게 찾을 수 있습니다. 이는 사용자 중심의 편리한 법률 정보 접근 시스템을 구축하는 핵심 기술입니다.
이 연구는 대규모 언어 모델을 활용하여 법률 정보 접근성을 향상시키는 새로운 패러다임을 제시합니다. MGQs와 HCQs의 장단점을 비교 분석하고, 실제 시스템 프로토타입까지 공개함으로써, 이 접근 방식의 실용성을 입증했습니다. 앞으로 더욱 발전된 기술을 통해 더욱 많은 사람들에게 정의로운 법률 정보 접근의 기회를 제공할 수 있기를 기대합니다.
Reference
[arxiv] Bringing legal knowledge to the public by constructing a legal question bank using large-scale pre-trained language model
Published: (Updated: )
Author: Mingruo Yuan, Ben Kao, Tien-Hsuan Wu, Michael M. K. Cheung, Henry W. H. Chan, Anne S. Y. Cheung, Felix W. H. Chan, Yongxi Chen
http://arxiv.org/abs/2505.04132v1