AI ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด ๋ค์ํ ์ฑ๋ฅ ์งํ(metrics)๊ฐ ์ฌ์ฉ๋๋ค. ๋ชจ๋ธ์ด ์ผ๋ง๋ ์ ํํ๊ฒ ์๋ํ๋์ง, ์์ธก์ด ์ผ๋ง๋ ์ ๋ขฐํ ์ ์๋์ง๋ฅผ ํ๊ฐํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ๋ค. ์ด๋ฒ ๊ธ์์ ๋ํ์ ์ธ ์ฑ๋ฅ ์งํ๋ค์ ์๊ฐํ๊ฒ ๋ค.
1. ํ๊ท(Regression) ๋ชจ๋ธ ์ฑ๋ฅ ์งํ
ํ๊ท ๋ชจ๋ธ์ ์ฐ์์ ์ธ ์ซ์ ๊ฐ์ ์์ธกํ๋ ๋ชจ๋ธ์ด๋ฉฐ, ์ฃผ๋ก ํ๊ท ์ ๊ณฑ ์ค์ฐจ(Mean Squared Error)๋ ํ๊ท ์ ๋ ์ค์ฐจ(Mean Absolute Error) ๋ฑ์ ์งํ๋ฅผ ์ฌ์ฉํจ.
(1) MSE (Mean Squared Error, ํ๊ท ์ ๊ณฑ ์ค์ฐจ)
MSE๋ ์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ์ ์ฐจ์ด๋ฅผ ์ ๊ณฑํ ํ ํ๊ท ์ ๊ตฌํ ๊ฐ์. ๊ฐ์ด ์์์๋ก ๋ชจ๋ธ์ ์์ธก์ด ์ค์ ๊ฐ๊ณผ ๊ฐ๊น์์ ์๋ฏธํจ.
- ์ฅ์ : ์ค์ฐจ๋ฅผ ์ ๊ณฑํ์ฌ ํฐ ์ค์ฐจ๋ฅผ ๊ฐ์กฐํจ
- ๋จ์ : ์ ๊ณฑ์ด ์ ์ฉ๋๋ฏ๋ก ์ด์์น(outlier)์ ๋ฏผ๊ฐํจ
(2) RMSE (Root Mean Squared Error, ํ๊ท ์ ๊ณฑ๊ทผ ์ค์ฐจ)
RMSE๋ MSE์ ์ ๊ณฑ๊ทผ์ ์ทจํ ๊ฐ์ผ๋ก, ์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ ๊ฐ์ ํ๊ท ์ ์ธ ์ฐจ์ด๋ฅผ ๋ํ๋. ๋จ์๊ฐ ์๋ ๋ฐ์ดํฐ์ ๊ฐ์ ํด์์ด ์ฌ์.
- ์ฅ์ : ๋จ์๊ฐ ์๋ณธ ๋ฐ์ดํฐ์ ๋์ผํ์ฌ ์ง๊ด์ ํด์ ๊ฐ๋ฅ
- ๋จ์ : MSE์ฒ๋ผ ์ด์์น์ ๋ฏผ๊ฐํจ
(3) MAE (Mean Absolute Error, ํ๊ท ์ ๋ ์ค์ฐจ)
MAE๋ ์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ์ ์ ๋ ์ฐจ์ด์ ํ๊ท ์ ๊ตฌํ ๊ฐ์ผ๋ก, ์ค์ฐจ์ ํฌ๊ธฐ๋ฅผ ์ง์ ์ ์ผ๋ก ๋ฐ์ํจ.
- ์ฅ์ : ์ด์์น์ ๋ ๋ฏผ๊ฐํจ.
- ๋จ์ : ์ค์ฐจ์ ์ ๊ณฑ์ด ์ ์ฉ๋์ง ์์ ํฐ ์ค์ฐจ๋ฅผ ๊ฐ์กฐํ๋ ๋ฐ ๋ถ์กฑํจ.
(4) R² Score (๊ฒฐ์ ๊ณ์, ์ค๋ช ๋ ฅ)
๋ชจ๋ธ์ด ๋ฐ์ดํฐ๋ฅผ ์ผ๋ง๋ ์ ์ค๋ช ํ๋์ง ๋ํ๋ด๋ ์งํ๋ก, 1์ ๊ฐ๊น์ธ์๋ก ์ข์ ๋ชจ๋ธ์.
- ์ฅ์ : ๋ชจ๋ธ์ ์ค๋ช ๋ ฅ์ ์ง๊ด์ ์ผ๋ก ๋ํ๋
- ๋จ์ : ๋ค์ค ํ๊ท ๋ชจ๋ธ์์๋ ๋ณ์ ๊ฐ์ ์ฆ๊ฐ์ ๋ฐ๋ผ ๊ฐ์ด ๊ณผ๋ ํ๊ฐ๋ ์ ์์
2. ๋ถ๋ฅ(Classification) ๋ชจ๋ธ ์ฑ๋ฅ ์งํ
๋ถ๋ฅ ๋ชจ๋ธ์ ํน์ ํด๋์ค๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ด๋ฉฐ, ๋ํ์ ์ผ๋ก ์ ํ๋(Accuracy), ์ ๋ฐ๋(Precision), ์ฌํ์จ(Recall), F1-score ๋ฑ์ ์งํ๋ฅผ ์ฌ์ฉํจ.
(1) Accuracy (์ ํ๋)
์ ์ฒด ์ํ ์ค์์ ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๋น์จ์ ๋ํ๋.
- ์ฅ์ : ์ง๊ด์ ์ธ ์ฑ๋ฅ ์งํ์
- ๋จ์ : ๋ฐ์ดํฐ๊ฐ ๋ถ๊ท ํํ ๊ฒฝ์ฐ ์ฑ๋ฅ์ ๊ณผ๋ํ๊ฐํ ์ ์์
(2) Precision (์ ๋ฐ๋, ์์ฑ ์์ธก๋)
๋ชจ๋ธ์ด ์์ฑ(Positive)์ด๋ผ๊ณ ์์ธกํ ๊ฒ ์ค ์ค์ ๋ก ์์ฑ์ธ ๋น์จ์ ์๋ฏธํจ.
- ์ฅ์ : False Positive๋ฅผ ์ค์ด๋ ๋ฐ ์ ์ฉํจ
- ๋จ์ : FN์ ๊ณ ๋ คํ์ง ์์ผ๋ฏ๋ก, ์ค์ ์ค์ํ ์์ฑ์ ๋์น ์ ์์
(3) Recall (์ฌํ์จ, ๋ฏผ๊ฐ๋, True Positive Rate)
์ค์ ์์ฑ ์ค์์ ๋ชจ๋ธ์ด ์์ฑ์ด๋ผ๊ณ ์์ธกํ ๋น์จ์ ๋ํ๋.
- ์ฅ์ : FN์ ์ค์ด๋ ๋ฐ ์ ์ฉํจ
- ๋จ์ : FP๋ฅผ ๊ณ ๋ คํ์ง ์์ผ๋ฏ๋ก, ๋ถํ์ํ ์์ฑ ์์ธก์ด ๋ง์ ์ ์์
(4) F1-score (์กฐํ ํ๊ท )
์ ๋ฐ๋(Precision)์ ์ฌํ์จ(Recall)์ ์กฐํ ํ๊ท ์ผ๋ก, ๋ ๊ฐ์ ๊ท ํ ์๊ฒ ๊ณ ๋ คํจ.
- ์ฅ์ : Precision๊ณผ Recall์ ๊ท ํ์ ๋ง์ถค
- ๋จ์ : ํน์ ํ ์ํฉ์์ Precision๊ณผ Recall ์ค ํ๋๋ฅผ ๋ ๊ณ ๋ คํด์ผ ํ ์๋ ์์
(5) AUC-ROC (Area Under the Curve - Receiver Operating Characteristic curve)
ROC ์ปค๋ธ์ ์๋ ๋ฉด์ (AUC)์ ์๋ฏธํ๋ฉฐ, ๋ชจ๋ธ์ ๋ถ๋ฅ ์ฑ๋ฅ์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํจ.
- AUC ๊ฐ ์๋ฏธ
- 0.5: ๋ฌด์์ ์์ธก๊ณผ ๋์ผํ ์ฑ๋ฅ
- 0.7~0.8: ์ค์ํ ์ฑ๋ฅ
- 0.8~0.9: ์ข์ ์ฑ๋ฅ
- 0.9 ์ด์: ๋งค์ฐ ์ข์ ์ฑ๋ฅ
3. ๋ชจ๋ธ ํ๊ฐ ์ ๊ณ ๋ คํ ์
- ๋ฐ์ดํฐ ๋ถ๊ท ํ: Accuracy๋ง์ผ๋ก ํ๊ฐํ๋ฉด ์ ๋๊ณ Precision, Recall, F1-score ๋ฑ์ ํจ๊ป ๋ถ์ํด์ผ ํจ
- ๋น์ฆ๋์ค ๋ชฉ์ ์ ๋ฐ๋ฅธ ์งํ ์ ํ: ๊ธ์ต ์ฌ๊ธฐ ํ์ง ๊ฐ์ ๊ฒฝ์ฐ Recall์ ๋์ด๋ ๊ฒ์ด ์ค์ํ ์ ์๊ณ , ๊ด๊ณ ํด๋ฆญ ์์ธก์์๋ Precision์ด ์ค์ํ ์ ์์
- ์ด์์น ์ํฅ ๊ณ ๋ ค: ํ๊ท ๋ชจ๋ธ์์๋ ์ด์์น์ ๋ฏผ๊ฐํ MSE๋ณด๋ค MAE๋ฅผ ํ์ฉํ ์๋ ์์
4. ๊ฒฐ๋ก
AI ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด ๋ค์ํ ์งํ๊ฐ ์ฌ์ฉ๋จ. ํ๊ท ๋ชจ๋ธ๊ณผ ๋ถ๋ฅ ๋ชจ๋ธ์์ ๊ฐ๊ฐ ์ ์ ํ ์งํ๋ฅผ ์ ํํด์ผ ํ๋ฉฐ, ๋ฐ์ดํฐ ํน์ฑ๊ณผ ๋ฌธ์ ์ํฉ์ ๋ง๊ฒ ํ๊ฐ ๊ธฐ์ค์ ์ค์ ํ๋ ๊ฒ์ด ์ค์ํจ.