🚨 LLMs, μ˜ν™” μΆ”μ²œ 데이터 μ•”κΈ°ν–ˆμ„κΉŒμš”? 🎬 MovieLens-1M을 μ€‘μ‹¬μœΌλ‘œ ν•œ λ†€λΌμš΄ 연ꡬ κ²°κ³Ό!


μ΄νƒˆλ¦¬μ•„ μ‹œμ‹œν”„ μ—°κ΅¬μ†Œμ˜ 연ꡬ진은 LLM이 MovieLens-1M 데이터셋을 μ•”κΈ°ν•˜λŠ” ν˜„μƒμ„ λ°ν˜€λƒˆμŠ΅λ‹ˆλ‹€. λͺ¨λΈ 크기와 μ’…λ₯˜μ— 따라 μ•”κΈ° 정도가 λ‹€λ₯΄λ©°, μ΄λŠ” μΆ”μ²œ μ„±λŠ₯에 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€. LLM 기반 μΆ”μ²œ μ‹œμŠ€ν…œ 개발 μ‹œ μ•”κΈ° λ¬Έμ œμ™€ μΌλ°˜ν™” μ„±λŠ₯ ν–₯상에 λŒ€ν•œ κ³ λ €κ°€ ν•„μš”ν•©λ‹ˆλ‹€.

related iamge

LLM이 μ˜ν™” μΆ”μ²œ 데이터λ₯Ό μ•”κΈ°ν•˜λ‹€?! πŸ€”

졜근 λͺ‡ λ…„κ°„, λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 μžμ—°μ–΄ 이해 및 생성 λŠ₯λ ₯을 λ°”νƒ•μœΌλ‘œ μΆ”μ²œ μ‹œμŠ€ν…œ λΆ„μ•Όμ—μ„œ μ£Όλͺ©λ°›κ³  μžˆμŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ, μ—°κ΅¬μžλ“€μ€ ν•œ κ°€μ§€ μ€‘μš”ν•œ μ˜λ¬Έμ μ„ κ°–κ²Œ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. λ°”λ‘œ LLM이 ν›ˆλ ¨ λ°μ΄ν„°λ‘œ μ‚¬μš©λœ 곡개 μΆ”μ²œ 데이터셋을 μ•”κΈ°ν•˜λŠ”μ§€ μ—¬λΆ€μž…λ‹ˆλ‹€. μ΄λŠ” 연ꡬ 결과의 μΌλ°˜ν™” κ°€λŠ₯성을 λ–¨μ–΄λœ¨λ¦¬κ³ , 편ν–₯을 μ¦ν­μ‹œν‚¬ 수 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€.

μ΄νƒˆλ¦¬μ•„ μ‹œμ‹œν”„ μ—°κ΅¬μ†Œ(SISINF Lab)의 Dario Di Palma λ“± 6λͺ…μ˜ μ—°κ΅¬μžλ“€μ€ 이 λ¬Έμ œμ— λŒ€ν•œ ν₯미둜운 연ꡬ κ²°κ³Όλ₯Ό λ°œν‘œν–ˆμŠ΅λ‹ˆλ‹€. 그듀은 "Do LLMs Memorize Recommendation Datasets? A Preliminary Study on MovieLens-1M" μ΄λΌλŠ” 논문을 톡해 GPT와 Llama κ³„μ—΄μ˜ λ‹€μ–‘ν•œ 크기의 LLM이 μ–Όλ§ˆλ‚˜ MovieLens-1M 데이터셋을 μ•”κΈ°ν•˜λŠ”μ§€ λΆ„μ„ν–ˆμŠ΅λ‹ˆλ‹€. MovieLens-1M은 μΆ”μ²œ μ‹œμŠ€ν…œ λΆ„μ•Όμ—μ„œ κ°€μž₯ 널리 μ‚¬μš©λ˜λŠ” 데이터셋 쀑 ν•˜λ‚˜μž…λ‹ˆλ‹€.

연ꡬ 방법: μ•”κΈ° 정도 μΈ‘μ • 및 μΆ”μ²œ μ„±λŠ₯ 뢄석

연ꡬ진은 LLM이 μ•„μ΄ν…œ 속성, μ‚¬μš©μž ν”„λ‘œν•„, μ‚¬μš©μž-μ•„μ΄ν…œ μƒν˜Έμž‘μš©μ„ μ–Όλ§ˆλ‚˜ μ •ν™•ν•˜κ²Œ κ²€μƒ‰ν•˜λŠ”μ§€ μΈ‘μ •ν•˜μ—¬ μ•”κΈ° 정도λ₯Ό ν‰κ°€ν–ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, μ•”κΈ° 정도가 μΆ”μ²œ μ„±λŠ₯에 λ―ΈμΉ˜λŠ” 영ν–₯κ³Ό λͺ¨λΈ 크기 및 μ’…λ₯˜μ— λ”°λ₯Έ μ•”κΈ° μ •λ„μ˜ 차이λ₯Ό λΆ„μ„ν–ˆμŠ΅λ‹ˆλ‹€.

λ†€λΌμš΄ κ²°κ³Ό: λͺ¨λ“  λͺ¨λΈμ—μ„œ μ•”κΈ° ν˜„μƒ 발견!

κ²°κ³ΌλŠ” λ†€λΌμ› μŠ΅λ‹ˆλ‹€. λͺ¨λ“  λͺ¨λΈμ—μ„œ MovieLens-1M λ°μ΄ν„°μ…‹μ˜ 일정 뢀뢄을 μ•”κΈ°ν•˜κ³  μžˆμ—ˆκ³ , μΆ”μ²œ μ„±λŠ₯은 μ•”κΈ° 정도와 λ°€μ ‘ν•œ 관련이 μžˆμ—ˆμŠ΅λ‹ˆλ‹€. 즉, 데이터λ₯Ό 많이 μ•”κΈ°ν• μˆ˜λ‘ μΆ”μ²œ μ„±λŠ₯이 λ†’μ•„μ§€λŠ” κ²½ν–₯을 λ³΄μ˜€μŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ, μ΄λŠ” μ‹€μ œ μΌλ°˜ν™”λœ μ„±λŠ₯을 보μž₯ν•˜μ§€ μ•ŠλŠ”λ‹€λŠ” 점을 κ°•μ‘°ν–ˆμŠ΅λ‹ˆλ‹€. 더 λ‚˜μ•„κ°€, 연ꡬ진은 λͺ¨λΈμ˜ 크기와 μ’…λ₯˜μ— 따라 μ•”κΈ° 정도가 λ‹€λ₯΄λ‹€λŠ” 것을 ν™•μΈν–ˆμŠ΅λ‹ˆλ‹€.

μ—°κ΅¬μ˜ μ˜λ―Έμ™€ μ‹œμ‚¬μ 

이 μ—°κ΅¬λŠ” LLM을 μΆ”μ²œ μ‹œμŠ€ν…œμ— μ μš©ν•  λ•Œ ν›ˆλ ¨ 데이터 μ•”κΈ° 문제λ₯Ό κ³ λ €ν•΄μ•Ό 함을 μ‹œμ‚¬ν•©λ‹ˆλ‹€. λ‹¨μˆœνžˆ λ²€μΉ˜λ§ˆν‚Ή 결과만으둜 μ„±λŠ₯을 ν‰κ°€ν•΄μ„œλŠ” μ•ˆλ˜λ©°, μΌλ°˜ν™” κ°€λŠ₯μ„±κ³Ό 편ν–₯ 문제λ₯Ό 꼼꼼히 κ²€ν† ν•΄μ•Ό ν•©λ‹ˆλ‹€. 연ꡬ진은 GitHub (https://github.com/sisinflab/LLM-MemoryInspector)에 μ½”λ“œλ₯Ό κ³΅κ°œν•˜μ—¬, λ‹€λ₯Έ μ—°κ΅¬μžλ“€μ΄ 이 연ꡬλ₯Ό μž¬ν˜„ν•˜κ³  λ°œμ „μ‹œν‚¬ 수 μžˆλ„λ‘ ν–ˆμŠ΅λ‹ˆλ‹€.

이 μ—°κ΅¬λŠ” LLM의 잠재λ ₯κ³Ό λ™μ‹œμ— κ·Έ ν•œκ³„λ₯Ό λͺ…ν™•νžˆ λ³΄μ—¬μ£ΌλŠ” μ€‘μš”ν•œ μ‚¬λ‘€μž…λ‹ˆλ‹€. μ•žμœΌλ‘œ LLM 기반 μΆ”μ²œ μ‹œμŠ€ν…œμ˜ λ°œμ „μ„ μœ„ν•΄μ„œλŠ” μ•”κΈ° 문제 ν•΄κ²° 및 μΌλ°˜ν™” μ„±λŠ₯ ν–₯상에 λŒ€ν•œ 지속적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.


*이 κΈ°μ‚¬λŠ” AIκ°€ μƒμ„±ν•œ λ‚΄μš©μœΌλ‘œ, 일뢀 정보가 μ‹€μ œμ™€ λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€. μ •ν™•ν•œ 확인을 μœ„ν•΄ 좔가적인 검증을 ꢌμž₯λ“œλ¦½λ‹ˆλ‹€.

Reference

[arxiv] Do LLMs Memorize Recommendation Datasets? A Preliminary Study on MovieLens-1M

Published: Β (Updated: )

Author: Dario Di Palma, Felice Antonio Merra, Maurizio Sfilio, Vito Walter Anelli, Fedelucio Narducci, Tommaso Di Noia

http://arxiv.org/abs/2505.10212v1