๐จ ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ์ ํ๊ณ: ์ ๋์ SQuAD์ ๋ํ ๊ฐ๊ฑด์ฑ ํฅ์์ ํจ๊ณผ ์์ด!
Paul K. Mandal์ ์ฐ๊ตฌ๋ SQuAD ๋ฐ์ดํฐ์ ์์ ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ ๊ธฐ๋ฒ์ ํจ๊ณผ๋ฅผ ๊ฒ์ฆํ ๊ฒฐ๊ณผ, ์ ๋์ ์์ ์ ๋ํ ๊ฐ๊ฑด์ฑ ํฅ์์๋ ํฐ ํจ๊ณผ๊ฐ ์๋ค๋ ๊ฒ์ ๋ฐํ์ต๋๋ค. ํ์ต ์ญ๋์ฑ ๋ถ์์ ํตํด ๋ฐ์ดํฐ์ ์ ๋ถ๋ฅํ์ฌ ํ์ตํ์์๋ ๋ถ๊ตฌํ๊ณ , SQuAD ๊ฒ์ฆ ์ธํธ ๋ฐ AddSent ์ ๋์ ๋ฐ์ดํฐ์ ์์ ์ผ๋ฐํ ์ฑ๋ฅ์ด ํฅ์๋์ง ์์์ต๋๋ค. ์ด๋ ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ์ ์ ์ฉ์ ์ ์คํ ์ ๊ทผ์ด ํ์ํจ์ ์์ฌํฉ๋๋ค.

๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ, SQuAD์์๋ ํจ๊ณผ ์๋ค? ๐ค
Paul K. Mandal์ ์ต๊ทผ ์ฐ๊ตฌ ๋ ผ๋ฌธ์ด ์ถฉ๊ฒฉ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ์ต๋๋ค. ๋ฐ๋ก ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ๊ฐ ์ถ์ถ์ ์ง์์๋ต(Extractive Question Answering)์์ ํญ์ ํจ๊ณผ์ ์ธ ๊ฒ์ ์๋๋ผ๋ ๊ฒ์ ๋๋ค. ํนํ SQuAD ๋ฐ์ดํฐ์ ์ ๋์์ผ๋ก ์งํ๋ ์ด ์ฐ๊ตฌ๋, ๊ธฐ์กด์ ๊ธ์ ์ ์๊ฐ๊ณผ๋ ์๋ฐ๋๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ฉฐ AI ์ฐ๊ตฌ๊ณ์ ์๋ก์ด ๋ ผ์๊ฑฐ๋ฆฌ๋ฅผ ๋์ ธ์ฃผ๊ณ ์์ต๋๋ค.
SQuAD์ ์ ๋์ ๋ฐ์ดํฐ์ : AddSent & AddOneSent
์ฐ๊ตฌ์ง์ SQuAD ๋ฐ์ดํฐ์ ์ ์ฃผ์ ์ค๋ฅ๋ฅผ ๋ถ์ํ๊ณ , ๋ ๊ฐ์ง ์ ๋์ ๋ฐ์ดํฐ์ ์ธ AddSent์ AddOneSent๋ฅผ ์ฌ์ฉํ์ฌ ELECTRA-small ๋ชจ๋ธ์ ํ๊ฐํ์ต๋๋ค. AddSent์ AddOneSent๋ SQuAD์ ํน๋ณํ ์ด๋ ค์์ ์ฃผ๋๋ก ๊ณ ์๋ ๋ฐ์ดํฐ์ ์ผ๋ก, ๋ชจ๋ธ์ ๊ฐ๊ฑด์ฑ์ ์ํํ๋ ๋ฐ ์ฌ์ฉ๋์์ต๋๋ค.
ํ์ต ์ญ๋์ฑ ๋ถ์: ๋ฐ์ดํฐ์ ์ ์ฌ๋ถ๋ฅ
ํต์ฌ์ ๋ฐ๋ก ํ์ต ์ญ๋์ฑ(Training Dynamics) ๋ถ์์ ๋๋ค. ์ฐ๊ตฌ์ง์ ํ์ต ๊ณผ์ ์ ๋ถ์ํ์ฌ SQuAD ๋ฐ์ดํฐ์ ์ ์ฌ์ด, ์ ๋งคํ, ์ด๋ ค์ด ์ธ ๊ฐ์ง ํ์ ๋ฐ์ดํฐ์ ์ผ๋ก ๋ถ๋ฅํ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ ํ์ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต์ํจ ํ, ์ฑ๋ฅ์ ๋น๊ต ๋ถ์ํ์ต๋๋ค. ์ด๋ ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ์ ํจ๊ณผ๋ฅผ ๊ฐ๊ด์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ํ ์ ๋ต์ด์์ต๋๋ค.
๊ฒฐ๊ณผ: ๊ธฐ๋์ ๋ค๋ฅธ ์ฑ๊ณผ
๊ฒฐ๊ณผ๋ ๋๋ผ์ ์ต๋๋ค. ์นด๋ฅดํ ๊ทธ๋ํผ ๊ธฐ๋ฐ์ ๋ฐ์ดํฐ์ ๋ถํ ํ์ต์ SQuAD ๊ฒ์ฆ ์ธํธ๋ AddSent ์ ๋์ ๋ฐ์ดํฐ์ ์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ํฅ์์ํค์ง ๋ชปํ์ต๋๋ค. AddOneSent ๋ฐ์ดํฐ์ ์์๋ '์ด๋ ค์ด' ํ์ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ ๋ F1 ์ ์๊ฐ ์ฝ๊ฐ ๋์์ก์ง๋ง, ์ ์ฒด์ ์ธ ์ฑ๋ฅ ํฅ์์ ๋ฏธ๋ฏธํ์ต๋๋ค.
๊ฒฐ๋ก : SQuAD์ SNLI์ ์ฐจ์ด์
์ฐ๊ตฌ๋ ๊ธฐ์กด SNLI ๋ฐ์ดํฐ์ ์์ ์ป์ ๊ฒฐ๊ณผ์ ๋น๊ต ๋ถ์ํ์ฌ SQuAD์์ ๋ํ๋ ๊ฒฐ๊ณผ์ ์ฐจ์ด์ ์ ์ค๋ช ํ๋ ค๊ณ ์๋ํ์ต๋๋ค. ์ด๋ฅผ ํตํด ๋ฐ์ดํฐ์ ์ ํน์ฑ๊ณผ ์ ๋์ ์์ ์ ๋ํ ๊ฐ๊ฑด์ฑ ํ๋ณด ์ ๋ต์ ๋ํ ์ฌ๋์๋ ๋ ผ์๊ฐ ํ์ํจ์ ์์ฌํฉ๋๋ค.
์์ฌ์ : ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ, ์ ์คํ ์ ๊ทผ ํ์
์ด ์ฐ๊ตฌ๋ ๋ฐ์ดํฐ์ ์นด๋ฅดํ ๊ทธ๋ํผ๊ฐ ๋ง๋ฅ ํด๊ฒฐ์ฑ ์ด ์๋๋ผ๋ ์ ์ ๋ถ๋ช ํ๊ฒ ๋ณด์ฌ์ค๋๋ค. ๋ฐ์ดํฐ์ ์ ํน์ฑ๊ณผ ๊ณผ์ ์ ์ ํ์ ๊ณ ๋ คํ ์ ์คํ ์ ๊ทผ์ด ํ์ํ๋ฉฐ, ๋ชจ๋ ๊ฒฝ์ฐ์ ํจ๊ณผ์ ์ด๋ผ๋ ๋งน์ ์ ๊ฒฝ๊ณํด์ผ ํฉ๋๋ค. AI ๋ชจ๋ธ์ ๊ฐ๊ฑด์ฑ ํฅ์์ ์ํ ์๋ก์ด ์ ๋ต๊ณผ ์ฐ๊ตฌ๊ฐ ๋์ฑ ํ์ํ ์์ ์ ๋๋ค.
Reference
[arxiv] When is dataset cartography ineffective? Using training dynamics does not improve robustness against Adversarial SQuAD
Published: ย (Updated: )
Author: Paul K. Mandal
http://arxiv.org/abs/2503.18290v1