2023. 1. 19. 23:47ใ๐ง๐ป๐ซ Ideas/๋จธ์ ๋ฌ๋
๋ฆฟ์ง(Ridge)ํ๊ท์ ๋ผ์(Lasso)ํ๊ท ๋ชจ๋ธ์ ์ ๊ทํ๋ฅผ ์ํ ๊ท์ ๋ฅผ ๊ฐํ ๋ชจ๋ธ์ด๋ค.
๋จธ์ ๋ฌ๋์์ ์ ๊ทํ๋, ์ฃผ๋ก ๊ณผ๋์ ํฉ(ํน์ ๊ณผ์์ ํฉ)๋์ด์์ง ์์ "์ผ๋ฐํ"๋ ๋ชจ๋ธ๋ก ์กฐ์ ํ๋ ๊ฒ์ ์๋ฏธํ๋ค.
๊ฐ์ ๋งฅ๋ฝ์์, ํ๊ท๋ชจํ์ ๊ท์ ๋ฅผ ๊ฐํ์ฌ ์ ๊ทํํ ๋ชจ๋ธ์ด ๋ฐ๋ก ๋ฆฟ์ง์ ๋ผ์ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์๋ค.
๊ณผ์ ํฉ ๋ฌธ์ ๋ ๋๋ถ๋ถ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์์ ๊ฐ์ฅ ๊ฒฝ๊ณํ๋ ๋ถ์์ฉ์ด๋ค.
๊ณผ์ ํฉ(Overfitting) ๋ฌธ์ ๋ ์ฐ๋ฆฌ๊ฐ ํ์ต์ํจ ๋ฐ์ดํฐ์ ์ง๋์น๊ฒ ์ ํฉ๋์ด ๋ํ๋๋ ๋ฌธ์ ์ด๋ค.
์กฐ๊ธ ๋ ํ์ด์ ์ด์ผ๊ธฐ ํ๋ฉด, ์ฐ๋ฆฌ๊ฐ ๋ง๋ ํ์ต ํ๊ฒฝ์์๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง ํ์ค ์ธ๊ณ์ ์ ์ฉํ๋ฉด ๊ทธ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๋ฌธ์ ์ธ ๊ฒ์ด๋ค.
ํ์ต ํ๊ฒฝ์์๋ง ์ฑ๋ฅ์ด ์ข๋ค๋ ๊ฒ์ ํนํ๋ ๋น์ฆ๋์ค ๋ถ์ผ์์ ์ด๋ ํ ์๋ฏธ๋ ๊ฐ์ง ๋ชปํ๊ธฐ ๋๋ฌธ์,
๋ถ์๊ฐ๋ค์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ค๋ฃฐ ๋ ์ด ๋ฌธ์ ๋ฅผ ํญ์ ๊ฒฝ๊ณํด์ผ๋ง ํ๋ค.
๋ฆฟ์ง(Ridge)ํ๊ท / ๋ผ์(Lasso)ํ๊ท ๋ชจ๋ธ
ํ๊ท๋ชจ๋ธ์ ๊ณผ์ ํฉ ๋ฌธ์ ๋ฅผ ๊ท์ (ํจ๋ํฐ)๋ฅผ ํตํด ๋ณด์ํ ๋ชจ๋ธ์ด๋ค.
*๊ท์ (Regularization)๋,
- ๊ณผ์ ํฉ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํจ๋ํฐ.
- ํ๊ท๋ชจ๋ธ์์๋ ๋น์ฉํจ์(ํน์ ๋ชฉ์ ํจ์๋ผ๊ณ ํํํ๊ธฐ๋ ํ๋ค.)์ ๊ท์ ๋ฅผ ๊ฐํ๋ค.
- ๋ฒกํฐ์ ํฌ๊ธฐ ํน์ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ๋ ๊ฒ์ ๋ปํ๋ norm์ ๊ท์ ํญ์ผ๋ก ๋ํด์ค๋ค.
์ด๋, norm์ ๋ฐ๋ผ L1, L2๊ท์ ๊ฐ ๋๋๋๋ฐ,
norm์ด ์ ๋๊ฐ์ ํฉ์ธ ๊ฒ์ L1, ์ ๊ณฑํฉ์ธ ๊ฒ์ L2 ๊ท์ ๋ผ๊ณ ํ๋ค.
์ฐธ๊ณ ๋ก ์ด๋ฌํ ๊ท์ ์ ๋ชจ๋ธ์ ํ๊ท๋ถ์ ๋ฟ๋ง ์๋๋ผ ๋ฅ๋ฌ๋ ๋ฑ ํ๊ท๋ฌธ์ ์ ์ด์ฉ๋๋ ๋ค๋ฅธ ์๊ณ ๋ฆฌ์ฆ์๋ ์ฐ์ธ๋ค.
- ๋ผ์ํ๊ท (L1 ๊ท์ )
์ ์์์ t๋ ๋ฐ์ดํฐ์ ์, k๋ ๊ณ์์ ์(๋ ๋ฆฝ๋ณ์์ ์ ํน์ ์ฐจ์)๋ฅผ ์๋ฏธํ๊ณ , ๋๋ค๋ ๊ท์ ์ ๋(ํ์ต๋ฅ )์ด๋ค.
๋ผ์ํ๊ท๋ ํ๊ท๊ณ์ ์ถ์ ์ ์์ด์ ๋น์ฉํจ์์ ๊ณ์์ ์ ๋๊ฐ์ ํฉ์ ๋ํด์ฃผ๋ ๊ฒ์ด๋ค.
์ด๋ ๊ณ์๋ฅผ ์ถ์ ํ๋ ๋ฐ ์์ด์ ๊ณ์์ ์ ๋๊ฐ์ ํฉ์ด ์ต์๊ฐ ๋์ด์ผ ํ๋ค๋ ์กฐ๊ฑด์ด ์ถ๊ฐ๋ ๊ฒ์ ์๋ฏธํ๋ค.
์ ๋๊ฐ์ ํฉ์ด ์ต์๊ฐ ๋๊ธฐ ์ํด์๋ 0์ด๋ 0์ ๊ฐ๊น์์ผ ํ๊ธฐ ๋๋ฌธ์,
์ด๋ค ๊ณ์๋ 0์ด ๋ ์๋ ์๋ค.(์ด๋ค ๋ณ์๊ฐ ์ ๊ฑฐ๋๋ค.)
์ด์ ์ํฅ๋ ฅ์ด ์ฝํ ๋ณ์๋ ์์ ์ ๊ฑฐ๋๊ณ , ๋ชจ๋ธ์ด ์ ์๋ฏธํ ๋ณ์๋ค์ ์ํด ์์ฝ๋๋ค.
์ด๋ ๋ชจ๋ธ์ ์ค๋ช ๋ ฅ์ ๋์ธ๋ค๋ ์ฅ์ ์ด ์๋ค.
-๋ฆฟ์งํ๊ท (L2 ๊ท์ )
์ ์์์ t๋ ๋ฐ์ดํฐ์ ์, k๋ ๊ณ์์ ์(๋ ๋ฆฝ๋ณ์์ ์ ํน์ ์ฐจ์)๋ฅผ ์๋ฏธํ๊ณ , ๋๋ค๋ ๊ท์ ์ ๋(ํ์ต๋ฅ )์ด๋ค.
๋ฆฟ์งํ๊ท๋ ํ๊ท๊ณ์ ์ถ์ ์ ์์ด์ ๋น์ฉํจ์์ ๊ณ์์ ์ ๊ณฑ์ ํฉ์ ๋ํด์ฃผ๋ ๊ฒ์ด๋ค.
์ด๋ ๊ณ์๋ฅผ ์ถ์ ํ๋ ๋ฐ ์์ด์ ๊ณ์์ ์ ๊ณฑํฉ์ด ์ต์๊ฐ ๋์ด์ผ ํ๋ค๋ ์กฐ๊ฑด์ด ์ถ๊ฐ๋ ๊ฒ์ ์๋ฏธํ๋ค.
์ฌ๊ธฐ์ ๋ผ์์์ ์ฐจ์ด์ ์ด ์๋๋ฐ, ์ ๊ณฑํฉ์ ์๋ฌด๋ฆฌ ์ต์๊ฐ ๋์ด๋ 0์ด ๋ ์ ์๋ค.
์ด์ ๋ชจ๋ ๋ณ์๊ฐ ์ ๊ฑฐ๋์ง ์๊ธฐ ๋๋ฌธ์, ๊ธฐ์กด ๋ฐ์ดํฐ์ ํน์ฑ์ ์ต๋ํ ์ด๋ฆฐ๋ค.
์ผ๋ฐ์ ์ผ๋ก ๋ฆฟ์ง๋ชจ๋ธ์ ๋ณ์๋ฅผ ์์ ์ ๊ฑฐํ๋ ๋ผ์๋ณด๋ค ๋ ์ ์ฐํ๊ธฐ ๋๋ฌธ์, ํญ์ ์ ๊ทํ๊ฐ ์ผ์ด๋๋ค.
๋ํ, ๋ณ์๊ฐ ๊ทธ๋๋ก ๋จ์์๊ธฐ ๋๋ฌธ์, ๋ค์ค๊ณต์ ์ฑ์ด ์กด์ฌํ๋ ๋ชจ๋ธ์๋ ์ข์ ์ฑ๋ฅ์ ๋ฐํํ๋ค.
- ์๋ผ์คํฑ ๋ท (L1 + L2)
์ ์์์ t๋ ๋ฐ์ดํฐ์ ์, k๋ ๊ณ์์ ์(๋ ๋ฆฝ๋ณ์์ ์ ํน์ ์ฐจ์)๋ฅผ ์๋ฏธํ๊ณ , ๋๋ค๋ ๊ท์ ์ ๋(ํ์ต๋ฅ )์ด๋ค.
์๋ผ์คํฑ ๋ท์ L1๊ณผ L2 ๊ท์ ๋ฅผ ๋์์ ์ ์ฉํ๋ ๊ฒ์ธ๋ฐ, ๋ ๊ท์ ์ ์ฅ์ ์ ๋ชจ๋ ํ์ฉํ๊ณ ์ ํ ๋ ์ด์ฉํ๋ค.
๊ทธ๋ฌ๋ ์ด๋, ํญ์ ํจ๊ณผ๊ฐ ๋ณด์ฅ๋ ๊ฒ์ ์๋์ง๋ง, ํฐ ๋ฐ์ดํฐ ์ ์์ ํจ๊ณผ๊ฐ ์๊ณ ,
์์ ๋ฐ์ดํฐ ์ ์์๋ ๋ผ์, ๋ฆฟ์ง๋ณด๋ค ๊ทธ ํจ๊ณผ๊ฐ ๋ฏธ๋นํ ํธ์ด๋ค.
'๐ง๐ปโ๐ซ Ideas > ๋จธ์ ๋ฌ๋' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์์๋ธ ๊ธฐ๋ฒ #๋๋ค ํฌ๋ ์คํธ #XG๋ถ์คํธ (0) | 2023.02.03 |
---|---|
์์ฌ๊ฒฐ์ ๋๋ฌด(Decision Tree) [Supervised Learning] (0) | 2023.02.02 |
ํ๊ท๋ถ์(Regression Analysis) [Supervised Learning] (0) | 2023.01.19 |