λ¦Ώμ§(Ridge)νκ·, λΌμ(Lasso)νκ· λͺ¨λΈ (+Elastic net)
λ¦Ώμ§(Ridge)νκ·μ λΌμ(Lasso)νκ· λͺ¨λΈμ μ κ·νλ₯Ό μν κ·μ λ₯Ό κ°ν λͺ¨λΈμ΄λ€.
λ¨Έμ λ¬λμμ μ κ·νλ, μ£Όλ‘ κ³Όλμ ν©(νΉμ κ³Όμμ ν©)λμ΄μμ§ μμ "μΌλ°ν"λ λͺ¨λΈλ‘ μ‘°μ νλ κ²μ μλ―Ένλ€.
κ°μ λ§₯λ½μμ, νκ·λͺ¨νμ κ·μ λ₯Ό κ°νμ¬ μ κ·νν λͺ¨λΈμ΄ λ°λ‘ λ¦Ώμ§μ λΌμ λͺ¨λΈμ΄λΌκ³ ν μ μλ€.
κ³Όμ ν© λ¬Έμ λ λλΆλΆμ λ¨Έμ λ¬λ μκ³ λ¦¬μ¦μμ κ°μ₯ κ²½κ³νλ λΆμμ©μ΄λ€.
κ³Όμ ν©(Overfitting) λ¬Έμ λ μ°λ¦¬κ° νμ΅μν¨ λ°μ΄ν°μ μ§λμΉκ² μ ν©λμ΄ λνλλ λ¬Έμ μ΄λ€.
μ‘°κΈ λ νμ΄μ μ΄μΌκΈ° νλ©΄, μ°λ¦¬κ° λ§λ νμ΅ νκ²½μμλ μ°μν μ±λ₯μ 보μ΄μ§λ§ νμ€ μΈκ³μ μ μ©νλ©΄ κ·Έ μ±λ₯μ΄ λ¨μ΄μ§λ λ¬Έμ μΈ κ²μ΄λ€.
νμ΅ νκ²½μμλ§ μ±λ₯μ΄ μ’λ€λ κ²μ νΉνλ λΉμ¦λμ€ λΆμΌμμ μ΄λ ν μλ―Έλ κ°μ§ λͺ»νκΈ° λλ¬Έμ,
λΆμκ°λ€μ λ¨Έμ λ¬λ μκ³ λ¦¬μ¦μ λ€λ£° λ μ΄ λ¬Έμ λ₯Ό νμ κ²½κ³ν΄μΌλ§ νλ€.
λ¦Ώμ§(Ridge)νκ· / λΌμ(Lasso)νκ· λͺ¨λΈ
νκ·λͺ¨λΈμ κ³Όμ ν© λ¬Έμ λ₯Ό κ·μ (ν¨λν°)λ₯Ό ν΅ν΄ 보μν λͺ¨λΈμ΄λ€.
*κ·μ (Regularization)λ,
- κ³Όμ ν© λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν ν¨λν°.
- νκ·λͺ¨λΈμμλ λΉμ©ν¨μ(νΉμ λͺ©μ ν¨μλΌκ³ νννκΈ°λ νλ€.)μ κ·μ λ₯Ό κ°νλ€.
- 벑ν°μ ν¬κΈ° νΉμ 거리λ₯Ό μΈ‘μ νλ κ²μ λ»νλ normμ κ·μ νμΌλ‘ λν΄μ€λ€.
μ΄λ, normμ λ°λΌ L1, L2κ·μ κ° λλλλ°,
normμ΄ μ λκ°μ ν©μΈ κ²μ L1, μ κ³±ν©μΈ κ²μ L2 κ·μ λΌκ³ νλ€.
μ°Έκ³ λ‘ μ΄λ¬ν κ·μ μ λͺ¨λΈμ νκ·λΆμ λΏλ§ μλλΌ λ₯λ¬λ λ± νκ·λ¬Έμ μ μ΄μ©λλ λ€λ₯Έ μκ³ λ¦¬μ¦μλ μ°μΈλ€.
- λΌμνκ· (L1 κ·μ )
μ μμμ tλ λ°μ΄ν°μ μ, kλ κ³μμ μ(λ 립λ³μμ μ νΉμ μ°¨μ)λ₯Ό μλ―Ένκ³ , λλ€λ κ·μ μ λ(νμ΅λ₯ )μ΄λ€.
λΌμνκ·λ νκ·κ³μ μΆμ μ μμ΄μ λΉμ©ν¨μμ κ³μμ μ λκ°μ ν©μ λν΄μ£Όλ κ²μ΄λ€.
μ΄λ κ³μλ₯Ό μΆμ νλ λ° μμ΄μ κ³μμ μ λκ°μ ν©μ΄ μ΅μκ° λμ΄μΌ νλ€λ μ‘°κ±΄μ΄ μΆκ°λ κ²μ μλ―Ένλ€.
μ λκ°μ ν©μ΄ μ΅μκ° λκΈ° μν΄μλ 0μ΄λ 0μ κ°κΉμμΌ νκΈ° λλ¬Έμ,
μ΄λ€ κ³μλ 0μ΄ λ μλ μλ€.(μ΄λ€ λ³μκ° μ κ±°λλ€.)
μ΄μ μν₯λ ₯μ΄ μ½ν λ³μλ μμ μ κ±°λκ³ , λͺ¨λΈμ΄ μ μλ―Έν λ³μλ€μ μν΄ μμ½λλ€.
μ΄λ λͺ¨λΈμ μ€λͺ λ ₯μ λμΈλ€λ μ₯μ μ΄ μλ€.
-λ¦Ώμ§νκ· (L2 κ·μ )
μ μμμ tλ λ°μ΄ν°μ μ, kλ κ³μμ μ(λ 립λ³μμ μ νΉμ μ°¨μ)λ₯Ό μλ―Ένκ³ , λλ€λ κ·μ μ λ(νμ΅λ₯ )μ΄λ€.
λ¦Ώμ§νκ·λ νκ·κ³μ μΆμ μ μμ΄μ λΉμ©ν¨μμ κ³μμ μ κ³±μ ν©μ λν΄μ£Όλ κ²μ΄λ€.
μ΄λ κ³μλ₯Ό μΆμ νλ λ° μμ΄μ κ³μμ μ κ³±ν©μ΄ μ΅μκ° λμ΄μΌ νλ€λ μ‘°κ±΄μ΄ μΆκ°λ κ²μ μλ―Ένλ€.
μ¬κΈ°μ λΌμμμ μ°¨μ΄μ μ΄ μλλ°, μ κ³±ν©μ μ무리 μ΅μκ° λμ΄λ 0μ΄ λ μ μλ€.
μ΄μ λͺ¨λ λ³μκ° μ κ±°λμ§ μκΈ° λλ¬Έμ, κΈ°μ‘΄ λ°μ΄ν°μ νΉμ±μ μ΅λν μ΄λ¦°λ€.
μΌλ°μ μΌλ‘ λ¦Ώμ§λͺ¨λΈμ λ³μλ₯Ό μμ μ κ±°νλ λΌμλ³΄λ€ λ μ μ°νκΈ° λλ¬Έμ, νμ μ κ·νκ° μΌμ΄λλ€.
λν, λ³μκ° κ·Έλλ‘ λ¨μμκΈ° λλ¬Έμ, λ€μ€κ³΅μ μ±μ΄ μ‘΄μ¬νλ λͺ¨λΈμλ μ’μ μ±λ₯μ λ°ννλ€.
- μλΌμ€ν± λ· (L1 + L2)
μ μμμ tλ λ°μ΄ν°μ μ, kλ κ³μμ μ(λ 립λ³μμ μ νΉμ μ°¨μ)λ₯Ό μλ―Ένκ³ , λλ€λ κ·μ μ λ(νμ΅λ₯ )μ΄λ€.
μλΌμ€ν± λ·μ L1κ³Ό L2 κ·μ λ₯Ό λμμ μ μ©νλ κ²μΈλ°, λ κ·μ μ μ₯μ μ λͺ¨λ νμ©νκ³ μ ν λ μ΄μ©νλ€.
κ·Έλ¬λ μ΄λ, νμ ν¨κ³Όκ° 보μ₯λ κ²μ μλμ§λ§, ν° λ°μ΄ν° μ μμ ν¨κ³Όκ° μκ³ ,
μμ λ°μ΄ν° μ μμλ λΌμ, λ¦Ώμ§λ³΄λ€ κ·Έ ν¨κ³Όκ° λ―ΈλΉν νΈμ΄λ€.