혁신적인 AI 기반 사이버 위협 분석: LLM과 SciBERT의 만남


본 연구는 LLM과 SciBERT를 활용하여 사이버 위협 정보 보고서에서 공격 기법을 효과적으로 식별하는 새로운 방법을 제시합니다. 기존 방식의 한계를 극복하기 위해 제안된 2단계 파이프라인은 데이터 불균형 문제를 해결하고 정확도를 향상시켜, 사이버 보안 분야의 혁신적인 발전을 가져올 것으로 기대됩니다.

related iamge

LLM과 SciBERT를 활용한 사이버 위협 정보 분석의 획기적인 발전

최근 사이버 위협의 지능화 및 고도화에 따라, 효과적인 위협 정보 분석 시스템의 필요성이 그 어느 때보다 강조되고 있습니다. Nguyen 등 연구진은 MITRE ATT&CK 프레임워크를 기반으로 웹 상의 사이버 위협 정보 보고서에서 공격 기법을 효과적으로 식별하는 방법을 연구했습니다. 기존의 Threat Report ATT&CK Mapper (TRAM)Llama2와 같은 오픈소스 LLM을 활용한 네 가지 설정을 분석한 결과, 데이터 불균형, 과적합, 도메인 특유의 복잡성 등의 문제점을 발견했습니다.

하지만 이들은 단순히 문제점을 지적하는 데 그치지 않았습니다. 연구진은 이러한 문제를 해결하기 위해 획기적인 2단계 파이프라인을 제안했습니다. 먼저, LLM을 사용하여 위협 보고서를 요약하고, 다음으로, LLM이 생성한 데이터로 확장된 재균형 데이터셋을 처리하는 재학습된 SciBERT 모델을 적용하는 것입니다.

이 방법은 기존 모델에 비해 F1-score를 향상시켰으며, 여러 공격 기법에서 0.90 이상의 F1-score를 달성하는 놀라운 결과를 보였습니다. 이는 LLM을 활용한 데이터 증강 기법이 데이터 불균형 문제 해결에 효과적임을 증명하는 것입니다.

이 연구는 웹 기반 CTI 시스템의 효율성을 높이고, 상호 연결된 디지털 환경에서 협력적인 사이버 보안 운영을 지원하는 데 중요한 기여를 했습니다. 특히, 인간-AI 협업 플랫폼 통합에 대한 후속 연구의 가능성을 열어, 사이버 보안 분야의 혁신적인 발전을 예고하고 있습니다. 이 연구는 단순한 기술적 발전을 넘어, 더 안전하고 신뢰할 수 있는 디지털 세상을 만들기 위한 중요한 한 걸음이 될 것입니다.

핵심: 본 연구는 LLM과 SciBERT를 결합한 새로운 접근법을 통해 사이버 위협 분석의 정확도와 효율성을 크게 향상시켰다는 점에서 큰 의미를 가집니다. 이는 미래 사이버 보안 연구의 방향을 제시하는 중요한 결과물입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Towards Effective Identification of Attack Techniques in Cyber Threat Intelligence Reports using Large Language Models

Published:  (Updated: )

Author: Hoang Cuong Nguyen, Shahroz Tariq, Mohan Baruwal Chhetri, Bao Quoc Vo

http://arxiv.org/abs/2505.03147v1