2023. 1. 19. 23:35γπ§π»π« Ideas/λ¨Έμ λ¬λ
AI, λ°μ΄ν° λΆμμ λ°λ°νμΈ λ¨Έμ λ¬λ(κΈ°κ³νμ΅)μλ ν¬κ² μΈ κ°μ§ κ°λκ° μλ€.
- μ§λνμ΅ (νκ², μ λ΅μ ν¨κ» νμ΅μμΌ νκ²μ μμΈ‘νλ€.)
- λΉμ§λνμ΅ (νκ², μ λ΅μμ΄ νμ΅μμΌ λ°μ΄ν°μ νΉμ±μ νμ νλ€.)
- κ°ννμ΅ (μ£Όμ΄μ§ μνμ λν 보μμ ν΅ν΄ μ΅μ μ νλμ νμ΅μν¨λ€.)
νκ·λΆμ - μ§λνμ΅
νκ·λΆμμ λνμ μΈ μ§λνμ΅ μκ³ λ¦¬μ¦μΌλ‘ ν΅κ³νμ κ½μ΄λΌκ³ λ λΆλ¦°λ€.
ν΅κ³νμμ λ°μ ν νκ·λΆμμ κ²°κ³Όκ°μ μμΈ‘νκ³ κ·Έ κ°μ λ―ΈμΉλ λ³μλ€μ μν₯λ ₯μ μμ보λ λ° μ°μΈλ€.
μ¬λ¬ μ°κ΅¬μ νλ¬ΈλΆμΌκ° κ΅λ₯ μμμ λ§μ μμ©μ΄ λ±μ₯νμ§λ§ κ·Έ μ¬μκ³Ό λͺ©μ μ μ΄μ λμΌνλ€.
νκ·λΆμμ λΉμ¦λμ€μ μ¬λ¬ λλ©μΈ(κΈμ΅, λ§μΌν λ±)μμ λ§€μ° μ μ©νκ² μ΄μ©λλ€.
νκ·λΆμμ ν΅ν νκ·λͺ¨νμ κ·Έ μμ©μ΄ λ§€μ° λ€μν΄μ μ¬λ¬ λ¬Έμ μ μ μ©ν μ μλλ°,
λνμ μΌλ‘ κ°κ²©, μμλ, λ§μ‘±λ λ±μ μμΉλ₯Ό μμΈ‘νλ νκ·λ¬Έμ λ₯Ό ν΄κ²°νκ³ , κ·Έ μμΉμ λ―ΈμΉλ λ³μλ€μ μν₯λ ₯μ νμΈν μ μλ€.
λν, μ νμ΄ μλ μ¬λ¬ μμ©λͺ¨λΈμ ν΅ν΄ μμ‘΄/μ΄ν, λμΆ μν/λΉμν, μΊ νμΈμ λ°μ/ 무λ°μ λ± μ΄ν λΆλ₯λ¬Έμ λ μ ν μ νκ³Ό κ°μ λ€ν λΆλ₯λ¬Έμ μλ κ°μ μν μ μνν μ μλ€.
μ΄μ²λΌ νκ·λΆμμ ν΅κ³νμμ μΆλ°ν "λ°μ΄ν°λ§μ΄λ"μ λ§€μ° μ μ©νκ² μ΄μ©λ μκ³ λ¦¬μ¦μ΄λ©°, κ·Έ μ±λ₯μ νκ°νκ³ λ³΄μνλ μ¬λ¬ μ루μ λ€ λν λ§μ΄ μ μλμ΄μκΈ° λλ¬Έμ λΉκ΅μ μμ μ μΌλ‘ λ리 μ΄μ©λλ λΆμλ°©λ²μ΄λ€.
"νκ·"λΌλ λ¨μ΄κ° μ΄λ μ§μ μΌλ‘ λλμκ°λ κ²μ μλ―Ένλ―, μ΄κΈ°μ ν΅κ³νμμ μ°κ΅¬λ νκ· λΆμμ κ³Όκ±°μ ν¨ν΄μ νμ΅νμ¬ κ·Έ "νκ· μΌλ‘μ νκ·μ "μ μ°Ύλ κ²μ΄ κΆκ·Ήμ μΈ λͺ©νλΌκ³ ν μ μμλ€.
νκ·λΆμμ μλ¬Όνμ νλμμ€ κ³¨ν΄μ΄ μλ²μ§μ ν€μ μλ€μ ν€μ κ΄κ³λ₯Ό μ€λͺ νλ λ° μ²μμΌλ‘ μ μνλ€κ³ μλ €μ Έ μλ€.
κ·Έκ° μ£Όλͺ©ν κ²μ νκ² κ°λ€μ΄ νκ· μμ ν¬κ² λ²μ΄λμ§ μλλ€λ κ²μ΄μλλ° μ΄λ¬ν μΈ‘λ©΄μμ "νκ· μΌλ‘μ νκ·"κ° λ±μ₯ν κ²μ΄λ€.
μ€λλ μλ ν¨ν΄μ νμ΅νμ¬ μ΄λ€ μμΈ‘μΉλ₯Ό λ΄λλ μ μμ κ·Έ μ¬μμ΄ κ°μ§λ§, λ§μ μμ©λ€κ³Ό λ€μν μ¬λ‘κ° μΆμ λμ΄ "νκ· μΌλ‘μ νκ·"μ λ³Έμλ―Έλ λ§μ΄ ν΄μλμλ€.
λμ μ νκ·λΆμμ΄ κ°μ§ λͺ©νμ μ¬μμ κ³μ μ΄μ΄μ Έ μκΈ° λλ¬Έμ μ¬μ ν κ³Όκ±°μ ν¨ν΄μ νμ΅νμ¬ μ΄λ€ κ°μ μμΈ‘νλ λ¬Έμ λ₯Ό "νκ·λ¬Έμ "λΌκ³ λΆλ₯΄λ κ²μ΄ μΌλ°μ μ΄λ€.
κ·Έλ°λ° μλκ° νλ₯΄κ³ λ¨Έμ λ¬λ λΆμΌμ μ°κ΅¬κ° μΆμ λλ©° μ΄λ¬ν "νκ·λ¬Έμ "λ₯Ό ν΄κ²°νλ λ°©λ²μΌλ‘ νκ·λ무, μΈκ³΅μ κ²½λ§ λ± λ€μν μκ³ λ¦¬μ¦λ€μ΄ μ μλμλ€.
μ΄μ νκ·λ¬Έμ λ₯Ό ν΄κ²°νλ μκ³ λ¦¬μ¦μ λ€μνλμμ§λ§, ν΅μ νκ·λΆμμ΄λΌκ³ νλ©΄ ν΅κ³νμμ μ μλλλ‘ νκ·κ³μλ₯Ό κ³μ°νμ¬ μΆμ νλ μ ν΅μ μΈ μκ³ λ¦¬μ¦μ μλ―Ένλ κ²μ΄ μΌλ°μ μ΄λ€.
μ리μ μΌλ‘ νκ·λΆμμ "ν μ€μ μμ μ°Ύλ κ²"μ΄λΌκ³ λ§ν μ μλ€.
κ·Έ μμ, μ κ·Έλ¦Όμμ λ³Έλ€λ©΄, λ°μ΄ν°λ€μ κ΄ν΅νλ(μ μ€λͺ νλ) νλμ μ§μ μ΄λΌλ μλ―Έ λν κ°μ§λ€.
μ΄μ μ κ·Έλ¦Όμμμ νκ·μ§μ , λ μ ννκ²λ λ³μκ° νλμΈ λ¨μμ ννκ·μ§μ μ κΈ°μΈκΈ°λ κ·Έ λ³μ(x λ³λ)μ μν₯λ ₯μΌλ‘ μ΄ν΄ν μ μλ€.
μλ₯Ό λ€μ΄, μλ€μ ν€κ° μ’ μλ³μ(y), μλ²μ§μ ν€κ° λ 립λ³μ(x)μΌ λ, λμΆν νκ·μμ΄ y = 2/3x + 70μ΄λΌλ©΄, μλ²μ§μ ν€λ μλ€μ ν€μ 2/3 λ§νΌ μν₯μ λΌμΉκ³ μλ κ²μ΄λ€.
μ΄λ νκ·κ³μμΈ 2/3κ³Ό +70μ ꡬνλ λ°©λ²μΌλ‘λ μ£Όλ‘ μ΅μμμΉλ², μμ΄λ‘ "least squared method"λΌκ³ λΆλ₯΄λ κ³μ°μμ΄ μ΄μ©λλ€. μ΄λ μ€μ°¨λ₯Ό μ΅μννλ νκ·κ³μλ₯Ό κ·Όμ¬μ μΌλ‘ ꡬνλ λ°©λ²μ΄λΌκ³ μ΄ν΄νλ©΄ λλ€.
λ¨Έμ λ¬λμμμ νκ·λΆμ
λ¨Έμ λ¬λμμμ νκ·λΆμ μκ³ λ¦¬μ¦μ μ΅μμμΉλ²κ³Ό r-squared λ± ν΅κ³μ μΈ κ³μ°κ³Ό λ€λ₯΄μ§ μλ€. μ΄μ, μ€μ°¨λ₯Ό μ΅μννλ νκ·κ³μλ₯Ό μΆμ νκ³ μ΄λ₯Ό νκ°νμ¬ μ΄λ ν κ°μ μμΈ‘ν΄λ΄λ λͺ©μ λν λμΌνλ€.
κ·Έλ°λ° ν΅κ³νμ μ€νμν©κ³Όλ λ¬λ¦¬ μ€μνμ λ§μ λ¬Έμ λ€μ μν₯μ λ―ΈμΉλ λ³μλ€μ΄ νλμΈ κ²½μ°λ κ±°μ μκ³ , μ νκ΄κ³κ° μλ λ¬Έμ λ€ λν μ‘΄μ¬νλ€. μ΄μ λ‘μ§μ€ν± νκ·λΆμ, λ€ννκ· λ±μ μμ© λͺ¨λΈμ΄ λ±μ₯νμκ³ , νΉν μ€μνμμμ μμ©μ μ€μμνλ λ¨Έμ λ¬λμμλ μν©μ λ§κ² μ¬λ¬ μμ© λͺ¨λΈμ μ΄μ©νλ κ²μ΄ μΌλ°μ μ΄λ€.
λν ν΅κ³νκ³Ό, λ¨Έμ λ¬λμ μ°κ΅¬νλ Computer Science(μ΄ν cs) μ¬μ΄μλ νκ·κ³μμ λͺ¨λΈμ νκ°νλ κ²μμ μ½κ°μ μ€ν μ€ μ°¨μ΄κ° μλ€.
ν΅κ³νμμλ νκ·κ³μμ λͺ¨λΈμ μ ν¨μ±μ κ°κ° t-testμ, f-testλ‘ νκ°νλλ°, ν΅κ³νμμλ μ΄λ¬ν λΆν¬λ₯Ό μ λ’°νκ³ μ΄μ λ§κ² κ°μ€μ κ²μ¦νλ κ²μ΄ μ£Όλ μ°κ΅¬λ°©ν₯μ΄κΈ° λλ¬Έμ΄λ€.
κ·Έλ¬λ, νμ€μ λ€μν λ°μ΄ν°μ νκ·λΆμ μκ³ λ¦¬μ¦μ μ μ©ν΄λ³΄λ©΄, μ€μ λ‘ μ΄λ¬ν λΆν¬κ²μ μ λͺ¨λ μΆ©μ‘±νλ λͺ¨λΈμ μ°ΎκΈ°κ° λ§€μ° μ΄λ ΅λ€. μ΄μ cs μ°κ΅¬μλ€κ³Ό νμ μμλ μ£Όλ‘ μ λ’°ν μ μκ³ , μμ΄ λ§μ test λ°μ΄ν°λ₯Ό ν΅ν΄ κ·Έ μ νλλ₯Ό νμΈνμ¬ λͺ¨λΈμ μ ν¨μ±μ κ²μ¦νλ λ°©λ²μ μ£Όλ‘ μ΄μ©νλ€.
νκ·λͺ¨λΈμ μ’ λ₯μ μ°μ
μμ μΈκΈνλ κ²μ²λΌ, νκ·λΆμμμλ κ·Έ μμμ΄μλ μ°μν λ³μλ₯Ό ν΅ν μ ννκ·λΆμ λΏλ§ μλλΌ λ€μν λ³μννλ₯Ό λ€λ£¨κ³ μ€μνμ μ ν©ν μ μλ μμ©λ€μ΄ λ§μ΄ μ°κ΅¬λμλ€.
λνμ μΈ 5κ°μ§μ νκ·λΆμλͺ¨λΈμ λ€μκ³Ό κ°λ€.
κ° λͺ¨λΈμμλ 곡ν΅μ μΌλ‘ λ 립λ³μ(μ€λͺ λ³μ)κ° νλμΌ λ λ¨μνκ·λͺ¨ν, λ μ΄μμΌλ λ€μ€νκ·λͺ¨νμ΄λΌκ³ λΆλ₯Έλ€.
μ ννκ·λͺ¨λΈ
μ°μν λ 립λ³μλ‘ μ°μν μ’ μλ³μλ₯Ό μΆμ ν λ, (νκ·λ¬Έμ )
μμ)
- μ£Όκ°, μ ν κ°κ²© νκ°
- μμλ μμΈ‘
- λ§μ‘±λ μμΈ‘
- κΈ°λμμ΅ μμΈ‘
------
λ‘μ§μ€ν± νκ·λͺ¨λΈ
μ°μν λ 립λ³μλ‘ λ²μ£Όν μ’ μλ³μλ₯Ό νλ₯ λ‘μ¨ μΆμ ν λ, (λΆλ₯λ¬Έμ )
μμ)
- μμ‘΄/μ΄ν νλ₯ μμΈ‘
- λμΆ μν/ λΉμν νλ₯ μμΈ‘
- λ§μΌν μΊ νμΈμ λ°μ/ 무λ°μ νλ₯ μμΈ‘
- ꡬ맀 / λΉκ΅¬λ§€ νλ₯ μμΈ‘
-----
λ€ννκ·λͺ¨λΈ
λ°μ΄ν°κ° μ ν μ§μ μ΄ μλ λΉμ ν 곑μ μ λ μ ν©ν λ,
μμ)
λ°μ΄ν°κ° μ΄λ¬ν ννλ₯Ό λ³΄μΌ λ, νκ·μμ λ€νμμΌλ‘ λ§λ€μ΄ μ€μ°¨(μ κ³Ό μ μ 거리)λ₯Ό μ€μ΄λλ‘ νλ€.
-----
λ¦Ώμ§(Ridge)νκ· / λΌμ(Lasso)νκ· λͺ¨λΈ
νκ·λͺ¨λΈμ κ³Όμ ν© λ¬Έμ λ₯Ό κ·μ (ν¨λν°)λ₯Ό ν΅ν΄ 보μν λͺ¨λΈ
*κ³Όμ ν© λ¬Έμ : λͺ¨λΈμ΄ νμ΅ λ°μ΄ν°μ μ§λμΉκ² μ ν©λμ΄ μ€μνκ³Ό κ°μ μΌλ°νλ νκ²½μμ μ±λ₯μ΄ λ¨μ΄μ§λ λ¬Έμ .
*κ·μ (Regularization) :
κ³Όμ ν© λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν ν¨λν°. νκ·λͺ¨λΈμμλ λΉμ©ν¨μμ κ·μ λ₯Ό κ°νλ€.
벑ν°μ ν¬κΈ°λ₯Ό μΈ‘μ νλ normμ κ·μ νμΌλ‘ λν΄μ€λ€.
-λΌμνκ·
μ λκ°μ ν©μ normμΌλ‘ νλ L1 κ·μ λ₯Ό μΆκ°νμ¬ νκ·κ³μ μΆμ
-λ¦Ώμ§νκ·
μ κ³±ν©μ normμΌλ‘ νλ L2 κ·μ λ₯Ό μΆκ°νμ¬ νκ·κ³μ μΆμ
* μμΈν λ΄μ©μ λ€μ λ§ν¬ μ°Έμ‘°
https://seollane22.tistory.com/10
λ¦Ώμ§(Ridge)νκ·, λΌμ(Lasso)νκ· λͺ¨λΈ
λ¦Ώμ§(Ridge)νκ·μ λΌμ(Lasso)νκ· λͺ¨λΈμ μ κ·νλ₯Ό μν κ·μ λ₯Ό κ°ν λͺ¨λΈμ΄λ€. λ¨Έμ λ¬λμμ μ κ·νλ, μ£Όλ‘ κ³Όλμ ν©(νΉμ κ³Όμμ ν©)λμ΄μμ§ μμ "μΌλ°ν"λ λͺ¨λΈλ‘ μ‘°μ νλ κ²μ μλ―Ένλ€.
seollane22.tistory.com
'π§π»βπ« Ideas > λ¨Έμ λ¬λ' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
μμλΈ κΈ°λ² #λλ€ ν¬λ μ€νΈ #XGλΆμ€νΈ (0) | 2023.02.03 |
---|---|
μμ¬κ²°μ λ무(Decision Tree) [Supervised Learning] (0) | 2023.02.02 |
λ¦Ώμ§(Ridge)νκ·, λΌμ(Lasso)νκ· λͺ¨λΈ (+Elastic net) (0) | 2023.01.19 |