안드로이드 악성코드 분석을 위한 코드 LLMs 벤치마킹: CAMA 프레임워크 등장
본 기사는 안드로이드 악성코드 분석에 특화된 코드 LLMs 벤치마킹 프레임워크 CAMA에 대한 최신 연구 결과를 소개합니다. CAMA는 악성 함수 식별 및 악성코드 목적 요약 등의 주요 작업에 대한 구조화된 모델 출력을 지원하며, 일관성, 충실도, 의미 관련성 등의 도메인별 평가 지표를 통해 LLMs의 성능을 엄격하게 평가합니다. 실제 안드로이드 악성코드 샘플을 이용한 실험 결과는 Code LLMs의 잠재력과 한계를 동시에 보여주며, 향후 연구 방향을 제시합니다.

안드로이드 악성코드 분석의 새로운 지평: CAMA 프레임워크
최근 발표된 연구 논문이 코드 기반 대규모 언어 모델(LLMs)의 안드로이드 악성코드 분석 능력을 혁신적으로 평가하는 새로운 기준을 제시했습니다. Yiling He 등 7명의 연구원이 개발한 CAMA(Code Assessment for Malware Analysis) 프레임워크는, 기존의 LLMs 성능 평가 방식의 한계를 극복하고 안드로이드 악성코드 분석에 특화된 평가 시스템을 제공합니다.
왜 CAMA가 필요한가?
기존의 코드 분석 방식은 복잡하고 방대한 안드로이드 악성코드를 효율적으로 분석하는 데 어려움을 겪어 왔습니다. 특히, 악의적인 코드가 수많은 함수에 숨겨져 있고, 함수 이름이 의미를 갖지 않는 경우가 많아 분석의 어려움이 가중됩니다. CAMA는 이러한 문제점을 해결하기 위해 고안된 획기적인 벤치마킹 프레임워크입니다.
CAMA의 핵심 기능:
- 구조화된 모델 출력: 악성 함수 식별, 악성코드 목적 요약 등 주요 악성코드 분석 작업을 지원하는 명확한 출력 형식을 정의합니다. 이는 모델 간의 비교 및 분석을 용이하게 합니다.
- 도메인별 평가 지표: 일관성, 충실도, 의미 관련성이라는 세 가지 지표를 통해 LLMs의 성능을 다각적으로 평가합니다. 이를 통해 모델의 안정성과 효과성을 엄격하게 검증하고, 서로 다른 모델들을 정확하게 비교할 수 있습니다.
- 실제 악성코드 데이터셋: 최근 수년간 수집된 13개 계열의 118개 안드로이드 악성코드 샘플(750만 개 이상의 함수 포함)을 기반으로 실제 환경에서의 모델 성능을 평가합니다. 이는 실제 악성코드 분석 환경을 보다 정확하게 반영합니다.
CAMA를 통한 발견:
연구진은 CAMA를 사용하여 4가지 유명한 오픈소스 Code LLMs를 평가했습니다. 실험 결과는 Code LLMs가 디컴파일된 코드를 어떻게 해석하는지, 그리고 함수 이름 변경에 얼마나 민감한지에 대한 통찰력을 제공합니다. 이를 통해 Code LLMs의 악성코드 분석에서의 잠재력과 현재의 한계를 명확하게 제시합니다. 특히 함수 이름 변경에 대한 민감도는 향후 연구의 중요한 과제로 제시되고 있습니다.
결론:
CAMA는 안드로이드 악성코드 분석 분야에 획기적인 발전을 가져올 잠재력을 지닌 벤치마킹 프레임워크입니다. 이 연구는 Code LLMs의 발전 방향을 제시하고, 더욱 안전하고 효율적인 악성코드 분석 시스템 구축에 기여할 것입니다. 앞으로 CAMA를 기반으로 더욱 정교하고 강력한 악성코드 분석 기술이 개발될 것으로 기대됩니다.
Reference
[arxiv] On Benchmarking Code LLMs for Android Malware Analysis
Published: (Updated: )
Author: Yiling He, Hongyu She, Xingzhi Qian, Xinran Zheng, Zhuo Chen, Zhan Qin, Lorenzo Cavallaro
http://arxiv.org/abs/2504.00694v2