๋ฐ์ดํฐ ๋ถ์๊ณผ ๋จธ์ ๋ฌ๋์์ ๋ฐ์ดํฐ๋ฅผ ์ดํดํ๋ ๊ฒ์ ๋งค์ฐ ์ค์ํ๋ค. ํนํ ๋ฐ์ดํฐ์ ๊ตฌ์กฐ๋ฅผ ํ์ ํ๋ ๊ฒ์ ๋ชจ๋ธ ์ ํ๊ณผ ํด์์ ํฐ ์ํฅ์ ๋ฏธ์น๋ค. ๋ฐ์ดํฐ๋ ํฌ๊ฒ ์ ํ(linear)๊ณผ ๋น์ ํ(non-linear), ๋จ์กฐ(monotonic)์ ๋น๋จ์กฐ(non-monotonic) ํํ๋ก ๊ตฌ๋ถํ ์ ์๋ค.
1. ์ ํ(Linear) ๋ฐ์ดํฐ vs ๋น์ ํ(Non-Linear) ๋ฐ์ดํฐ
(1) ์ ํ ๋ฐ์ดํฐ (Linear Data)
์ ํ ๋ฐ์ดํฐ๋ ๋ณ์ ๊ฐ์ ๊ด๊ณ๊ฐ ์ง์ ์ผ๋ก ํํ๋ ์ ์๋ ๋ฐ์ดํฐ๋ฅผ ์๋ฏธํจ. ์ฆ, ํ ๋ณ์๊ฐ ์ฆ๊ฐํ ๋ ๋ค๋ฅธ ๋ณ์๋ ์ผ์ ํ ๋น์จ๋ก ์ฆ๊ฐํ๊ฑฐ๋ ๊ฐ์ํ๋ ํจํด์ ๋ณด์.
- ํน์ง
- ๋ฐ์ดํฐ๊ฐ ์ง์ ๊ด๊ณ๋ฅผ ๋ฐ๋ฆ
- ์ ํ ํ๊ท(Linear Regression) ๋ชจ๋ธ๋ก ์ฝ๊ฒ ์ค๋ช ๊ฐ๋ฅ
- ์์ธก์ด ์ง๊ด์ ์ด๋ฉฐ ๊ณ์ฐ ๋น์ฉ์ด ๋ฎ์
- ์์
- ํค์ ๋ชธ๋ฌด๊ฒ๊ฐ ์ผ์ ํ ๋น์จ๋ก ์ฆ๊ฐํ๋ ๊ฒฝ์ฐ
- ์๊ฐ์ ๋ฐ๋ผ ๊ท ๋ฑํ๊ฒ ์ฆ๊ฐํ๋ ํ๋งค๋ ๋ฐ์ดํฐ
- ์์ ํํ
y=ax+b์ฌ๊ธฐ์ a๋ ๊ธฐ์ธ๊ธฐ(slope), b๋ ์ ํธ(intercept)์
(2) ๋น์ ํ ๋ฐ์ดํฐ (Non-Linear Data)
๋น์ ํ ๋ฐ์ดํฐ๋ ๋ณ์ ๊ฐ์ ๊ด๊ณ๊ฐ ์ง์ ์ด ์๋ ๊ณก์ ์ผ๋ก ๋ํ๋๋ ๊ฒฝ์ฐ์. ์ฆ, ํ ๋ณ์๊ฐ ์ฆ๊ฐํด๋ ์ผ์ ํ ๋น์จ๋ก ์ฆ๊ฐํ๊ฑฐ๋ ๊ฐ์ํ์ง ์๊ณ ๋ณต์กํ ํจํด์ ๊ฐ์ง.
- ํน์ง
- ๋ฐ์ดํฐ๊ฐ ์ง์ ์ผ๋ก ํํ๋์ง ์์
- ๋คํญ์ ํ๊ท(Polynomial Regression), ์ ๊ฒฝ๋ง(Neural Network) ๋ฑ์ ๋ณต์กํ ๋ชจ๋ธ์ด ํ์ํจ
- ์์ธก์ด ์ด๋ ต๊ณ ๊ณ์ฐ ๋น์ฉ์ด ๋์ ์ ์์
- ์์
- ํ์ต๋๊ณผ ์ํ ์ฑ์ ์ ๊ด๊ณ(์ฒ์์๋ ๊ธ๊ฒฉํ ์์นํ์ง๋ง ์ด๋ ์์ ์ดํ์๋ ์๋งํด์ง)
- ๋ฐ์ด๋ฌ์ค ํ์ฐ ์๋(์ด๊ธฐ์๋ ์ฒ์ฒํ ์ฆ๊ฐํ๋ค๊ฐ ๊ธ๊ฒฉํ ์ฆ๊ฐํ๋ ํจํด)
- ์์ ํํ
y=ax^2+bx+c(2์ฐจ ์ด์์ ๋คํญ์ ๊ด๊ณ๋ฅผ ๊ฐ์ง ์ ์์.)
2. ๋จ์กฐ(Monotonic) ๋ฐ์ดํฐ vs ๋น๋จ์กฐ(Non-Monotonic) ๋ฐ์ดํฐ
(1) ๋จ์กฐ ๋ฐ์ดํฐ (Monotonic Data)
๋จ์กฐ ๋ฐ์ดํฐ๋ ์ ์ฒด์ ์ธ ์ฆ๊ฐ ๋๋ ๊ฐ์ ๋ฐฉํฅ์ด ์ ์ง๋๋ ๋ฐ์ดํฐ์. ์ฆ, ํ ๋ณ์๊ฐ ์ฆ๊ฐํ๋ฉด ๋ค๋ฅธ ๋ณ์๋ ์ง์์ ์ผ๋ก ์ฆ๊ฐํ๊ฑฐ๋ ๊ฐ์ํจ.
- ํน์ง
- ์ฆ๊ฐํ๊ฑฐ๋ ๊ฐ์ํ๋ ๊ฒฝํฅ์ด ์ ์ง๋จ
- ๊ตญ์์ ์ธ ๋ณ๋์ ์์ ์ ์์ง๋ง ์ ์ฒด์ ์ธ ๋ฐฉํฅ์ด ์ ์ง๋จ
- ์์ธก์ด ์๋์ ์ผ๋ก ์ฌ์
- ์์
- ๋์ด๊ฐ ์ฆ๊ฐํ ์๋ก ๋์ ์ง์ถ ๊ธ์ก์ด ์ฆ๊ฐํ๋ ๊ฒฝ์ฐ(์ผ์ ํ ์ฆ๊ฐ ํจํด ์ ์ง)
- ์ฐ๋ฃ ์๋น๋๊ณผ ์ด๋ ๊ฑฐ๋ฆฌ(์ฐ๋ฃ๊ฐ ์ค์ด๋ค์๋ก ์ด๋ ๊ฑฐ๋ฆฌ๋ ์ฆ๊ฐ)
- ์์ ํํ
- ๋จ์กฐ ์ฆ๊ฐ (Monotonically Increasing):
- ๋จ์กฐ ๊ฐ์ (Monotonically Decreasing):
x1 ≤ x2 ⇒ f(x1) ≥ f(x2)
- ๋จ์กฐ ์ฆ๊ฐ (Monotonically Increasing):
(2) ๋น๋จ์กฐ ๋ฐ์ดํฐ (Non-Monotonic Data)
๋น๋จ์กฐ ๋ฐ์ดํฐ๋ ์ฆ๊ฐ์ ๊ฐ์๊ฐ ๋ฐ๋ณต๋๋ ๋ฐ์ดํฐ์. ์ฆ, ๋ณ์ ๊ฐ์ ๊ด๊ณ๊ฐ ์ผ์ ํ ๋ฐฉํฅ์ฑ์ ๊ฐ์ง์ง ์์.
- ํน์ง
- ํ ๋ณ์๊ฐ ์ฆ๊ฐํ ๋ ๋ค๋ฅธ ๋ณ์๋ ์ฆ๊ฐํ๊ธฐ๋ ํ๊ณ ๊ฐ์ํ๊ธฐ๋ ํจ
- ๋ฐ์ดํฐ ํจํด์ด ๋ณต์กํ๋ฉฐ, ๋จ์ํ ์ ํ ๋ชจ๋ธ๋ก ์ค๋ช ํ๊ธฐ ์ด๋ ค์
- ๋จธ์ ๋ฌ๋์ด๋ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ํ์ฉํด์ผ ํ ๊ฐ๋ฅ์ฑ์ด ๋์
- ์์
- ์ฃผ์ ์์ฅ ๊ฐ๊ฒฉ(์ผ์ ํ ํจํด ์์ด ์ค๋ฅด๋ฝ๋ด๋ฆฌ๋ฝ ๋ณ๋)
- ์จ๋์ ์์ฐ์ฑ์ ๊ด๊ณ(๋๋ฌด ๋ฎ๊ฑฐ๋ ๋์ผ๋ฉด ์์ฐ์ฑ์ด ๋จ์ด์ง๊ณ , ์ ์ ํ ๋ฒ์์์ ์ต์ ํ๋จ)
- ์์ ํํ
- ์ฆ๊ฐ์ ๊ฐ์๊ฐ ๋ฐ๋ณต๋จ
- ์ผ๋ฐ์ ์ธ ์์ ์์ด ๋ค์ํ ๊ณก์ ํํ๋ก ๋ํ๋จ
3. ์ ๋ฆฌ
๊ตฌ๋ถ | ์ ์ | ํน์ง | ์์ |
์ ํ ๋ฐ์ดํฐ | ๋ณ์ ๊ฐ ์ง์ ๊ด๊ณ | ๊ธฐ์ธ๊ธฐ๊ฐ ์ผ์ ํจ | ํค์ ๋ชธ๋ฌด๊ฒ ๊ด๊ณ |
๋น์ ํ ๋ฐ์ดํฐ | ๋ณ์ ๊ฐ ๊ณก์ ๊ด๊ณ | ๋ณต์กํ ํจํด์ ๊ฐ์ง | ์ํ ๊ณต๋ถ ์๊ฐ๊ณผ ์ฑ์ ๊ด๊ณ |
๋จ์กฐ ๋ฐ์ดํฐ | ํญ์ ์ฆ๊ฐ ๋๋ ๊ฐ์ | ์ ์ฒด์ ์ธ ๋ฐฉํฅ์ฑ์ด ์ ์ง๋จ | ์ฐ๋ฃ ์๋น๋๊ณผ ์ด๋ ๊ฑฐ๋ฆฌ |
๋น๋จ์กฐ ๋ฐ์ดํฐ | ์ฆ๊ฐ์ ๊ฐ์๊ฐ ๋ฐ๋ณต๋จ | ๋ฐฉํฅ์ฑ์ด ์ผ์ ํ์ง ์์ | ์ฃผ์ ๊ฐ๊ฒฉ ๋ณ๋ |
'๊ฐ๋ฐ Code > ์ธ๊ณต์ง๋ฅ A.I.' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python][AI] OpenCV YuNet์ ํ์ฉํ ์ผ๊ตด ํ์ง (0) | 2025.02.17 |
---|---|
[Python][AI] OpenCV: ์ปดํจํฐ ๋น์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์๊ฐ (3) | 2025.02.17 |
[Python][AI] AI ๋ชจ๋ธ ์ฑ๋ฅ ์งํ(Metrics) ์ ๋ฆฌ (1) | 2025.02.16 |
[AI][CatBoost] CatBoost๋ก Wine Quality ์์ธกํ๊ธฐ (0) | 2025.02.14 |
[Python][AI] CatBoost: ๊ฐ๋ ฅํ ๊ทธ๋๋์ธํธ ๋ถ์คํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (1) | 2025.02.14 |