[R] ์„ ํ˜•ํšŒ๊ท€, ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€ [Regression Analysis]

2023. 1. 25. 09:37ใ†๐Ÿง‘๐Ÿป‍๐Ÿ’ป With Data/๋ฐ์ดํ„ฐ ๋ถ„์„

ํšŒ๊ท€๋ถ„์„์€ ํ†ต๊ณ„ํ•™์—์„œ ์‹œ์ž‘๋˜์–ด ์—ฐ๊ตฌ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, ํ†ต๊ณ„์  ๋ถ„์„์— ํŠนํ™”๋œ R์„ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด ๋” ํšจ๊ณผ์ ์ผ ์ˆ˜ ์žˆ๋‹ค.

R์—์„œ๋Š” ํŒŒ์ด์ฌ๊ณผ ๋‹ฌ๋ฆฌ ๊ธฐ๋ณธ ๋‚ด์žฅํ•จ์ˆ˜๋กœ ํšŒ๊ท€๋ถ„์„์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๊ณ , ์—ฌ๋Ÿฌ ํ†ต๊ณ„์  ๊ฒ€์ •์ด๋‚˜ ๊ฐ€์ •์„ ํ™•์ธํ•˜๋Š” ๋ฐ์—๋„ ๋งค์šฐ ์œ ๋ฆฌํ•˜๋‹ค.

๋˜ํ•œ ๊ด€๋ จ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ๋ณ€์ˆ˜์„ ํƒ๋ฒ•์„ ์ž๋™์œผ๋กœ ์ˆ˜ํ–‰ํ•ด์ฃผ๋Š” ๋“ฑ R์€ ํšŒ๊ท€๋ถ„์„์„ ๋‹ค๊ฐ๋„๋กœ ์ˆ˜ํ–‰ํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ๋งค์šฐ ์ข‹์€ ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค.

์ด์— R์„ ํ†ตํ•œ ํ†ต๊ณ„์  ์Šคํƒ ์Šค๋กœ ๋น„์ฆˆ๋‹ˆ์Šค ๋„๋ฉ”์ธ์—์„œ ํšŒ๊ท€๋ถ„์„์ด ์–ด๋– ํ•œ ์—ญํ• ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ์ง€, ๊ทธ ๊ณผ์ •์„ ์‚ดํŽด๋ณด๊ณ ์ž ํ•œ๋‹ค.

 

์šฐ์„  ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ›์•„์˜จ๋‹ค.

 

library(dplyr)
df = read.csv("purch_behavior.csv") #์ด ๋ฐ์ดํ„ฐ๋Š” ๋งˆ์ผ€ํŒ… ํ™œ๋™์„ ์œ„ํ•ด ์ „๋žต์ ์œผ๋กœ ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ์ด๋‹ค.

 

df %>%
  glimpse()

 

๋จผ์ € ๋ฐ์ดํ„ฐ๋ฅผ ์‚ดํŽด๋ณด๋ฉฐ ์ „์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ์ง€์ ์„ ํƒ์ƒ‰ํ•œ๋‹ค.

์‚ดํŽด๋ณด๋‹ˆ ๋ช‡๋ช‡ ๋ณ€์ˆ˜๋“ค์˜ ํ˜•ํƒœ๋ฅผ ๋ฐ”๊ฟ”์ค„ ํ•„์š”๊ฐ€ ์žˆ์Œ์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.

# purchase(๋งˆ์ผ€ํŒ… ๊ธฐ๊ฐ„ ๋‚ด ๊ตฌ๋งค์—ฌ๋ถ€) + married(๊ฒฐํ˜ผ์—ฌ๋ถ€) + loyalty_card(๋กœ์–„ํ‹ฐ ์นด๋“œ ์œ ๋ฌด), int -> factor(๋ฒ”์ฃผํ˜•)

์„ ํ˜•ํšŒ๊ท€๋ถ„์„์—์„œ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๋ฅผ ์ด์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” "๋”๋ฏธํ™”"๋ฅผ ํ†ตํ•ด ์ˆ˜์น˜ํ˜• ๋ณ€์ˆ˜๋กœ ์ทจ๊ธ‰ํ•ด์•ผ ํ•œ๋‹ค. (reference = 0, ๋ถ„์„๋Œ€์ƒ = 1)

์ฐธ๊ณ ๋กœ R์—์„œ ํšŒ๊ท€๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ํ•จ์ˆ˜๋“ค์€ ์ž๋™์œผ๋กœ ๋”๋ฏธํ™”, ์ˆ˜์น˜ํ™” ๋ณ€ํ™˜์„ ํ•ด์ค€๋‹ค.

 

ํšŒ๊ท€๋ถ„์„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋‹ค๋ฅธ ๋ถ„์„์— ์žˆ์–ด์„œ, ์—ฌ๋Ÿฌ ์•„์ด๋””์–ด๋ฅผ ํ†ตํ•ด ๋‹ค๋ฅธ ๋ณ€์ˆ˜๋ฅผ ์กฐํ•ฉํ•ด์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

 

df$married = as.factor(df$married)
df$loyalty_card = as.factor(df$loyalty_card)
df$purchase = as.factor(df$purchase)

 

 

๋ณ€์ˆ˜๋ฅผ ์„ ํƒํ•˜๋Š” ๋ฐฉ๋ฒ•์—๋Š” ์—ฌ๋Ÿฌ ์ ‘๊ทผ์ด ์žˆ๋‹ค.

๋‹จ๊ณ„์  ์„ ํƒ๋ฒ•, ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€ ๋ณ€์ˆ˜, VIF(๋ถ„์‚ฐํŒฝ์ฐฝ์ง€์ˆ˜)๊ฐ€ ๋‚ฎ์€ ๋ณ€์ˆ˜๋ฅผ ์„ ํƒํ•˜๋Š” ๋“ฑ ์—ฌ๋Ÿฌ ํ†ต๊ณ„์  ์†”๋ฃจ์…˜์ด ์กด์žฌํ•œ๋‹ค.

๊ทธ๋Ÿฐ๋ฐ, ๋ถ„์„๊ฐ€๊ฐ€ ๊ณ ์•ˆํ•œ ํ๋ฆ„์ด ๋…ผ๋ฆฌ์ ์ด๋ผ๋ฉด, ๊ทธ๋Ÿฌํ•œ ๋ฐ”ํ…€์—…(๋ฐ์ดํ„ฐ์—์„œ ๋„๋ฉ”์ธ์œผ๋กœ)์ด ์•„๋‹Œ ํƒ‘๋‹ค์šด(๋„๋ฉ”์ธ์—์„œ ๋ฐ์ดํ„ฐ๋กœ) ์ ‘๊ทผ๋ฐฉ์‹์ด ์œ ํšจํ•  ๋•Œ์—๋„ ์žˆ๋‹ค.

์ฆ‰, ํƒ‘๋‹ค์šด ๋ฐฉ์‹์€ ๋จผ์ € ๊ด€์‹ฌ์ด ๊ฐ€๋Š” ๋ณ€์ˆ˜๋“ค๊ณผ ๊ทธ ๊ด€๊ณ„๋ฅผ ๊ฐ€์ •ํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ์‚ดํŽด ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ๋ณด๋Š” ๊ฒƒ์ด๋‹ค.

 

 

์„ ํ˜•ํšŒ๊ท€๋ชจํ˜•


์ฝ”๋“œ:  lm(์ข…์†๋ณ€์ˆ˜ ~ ๋…๋ฆฝ๋ณ€์ˆ˜, data = )

์ฐธ๊ณ ๋กœ, lm(์ข…์†๋ณ€์ˆ˜ ~. ,data = ) ์ด๋ ‡๊ฒŒ .์„ ๋„ฃ์œผ๋ฉด ํƒ€๊ฒŸ(์ข…์†๋ณ€์ˆ˜)์„ ์ œ์™ธํ•œ ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ๋…๋ฆฝ๋ณ€์ˆ˜๋กœ ๋„ฃ๋Š”๋‹ค.

ํ•„์ž๋Š” ๋ณ€์ˆ˜๋“ค ์ค‘ "์ƒํƒœ๋ณ€์ˆ˜"๋“ค๊ณผ(๊ฒฐํ˜ผ์—ฌ๋ถ€, ๋กœ์–„ํ‹ฐ ์นด๋“œ, ์ˆ˜์ต) "ํ–‰๋™๋ณ€์ˆ˜"(purchase, recency_days)๊ฐ€ ์ฃผ๋ฌธ ์ˆ˜์— ์–ผ๋งˆ๋‚˜, ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š” ์ง€๋ฅผ ํ™•์ธํ•˜๊ณ ์ž ํ•˜์˜€๋‹ค.

 

lm1 = lm(number_of_orders ~ married + loyalty_card + purchase + income, data = df)
summary(lm1)

________________________

 

๋ชจ๋ธ์„ ๋งŒ๋“ค์—ˆ๋‹ค๋ฉด ๋‹ค์Œ์œผ๋กœ ํ•ด์•ผํ•  ๊ฒƒ์€ ๊ทธ ๋ณ€์ˆ˜์˜ ์œ ํšจ์„ฑ์„ ๊ฒ€์ฆํ•˜๋Š” ์ผ์ด๋‹ค.

์ด๋Š” ํ†ต๊ณ„์  ๊ฐ€์„ค๊ฒ€์ •์„ ๊ฑฐ์ณ์•ผ ํ•˜๋Š”๋ฐ, ์œ„ ๊ฒฐ๊ณผ๋Š” ๊ทธ ๊ณผ์ •์„ ๋งค์šฐ ๊ฐ„ํŽธํ•˜๊ฒŒ ํ•ด์ค€๋‹ค.

์œ„์—์„œ Pr์€ t-test์—์„œ ์œ ์˜์ˆ˜์ค€๊ณผ ๋น„๊ต๋Œ€์ƒ์ด ๋˜๋Š” p-value์ด๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋ณ€์ˆ˜์˜ ์œ ํšจ์„ฑ์„ ๊ฒ€์ •ํ•œ๋‹ค.

ํ†ต์ƒ์ ์ธ ์œ ์˜์ˆ˜์ค€์€ 0.05(์œ„ ๊ฒฐ๊ณผ์—์„œ *)๋กœ, Pr์ด ์ด๋ณด๋‹ค ์ž‘๋‹ค๋ฉด ์ด ๋ณ€์ˆ˜๋Š” 95% ์‹ ๋ขฐ์ˆ˜์ค€์—์„œ ์œ ํšจํ•˜๋‹ค๋Š” ๊ฒฐ๋ก ์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ๋‹ค.

 

์œ„ ๋ชจ๋ธ์—์„œ ์œ ์˜๋ฏธํ•œ ๋ณ€์ˆ˜๋ฅผ ํ•ด์„ํ•ด๋ณด๋ฉด, ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์— ๋ฐ˜์‘ํ•˜๋Š” ๊ณ ๊ฐ์ด, ๋ฐ˜์‘ํ•˜์ง€ ์•Š๋Š” ๊ณ ๊ฐ์— ๋น„ํ•ด ์ฃผ๋ฌธ ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค๋Š” ๊ฒƒ๊ณผ(๋‹จ์œ„๋‹น 9.8), ๊ณ ๊ฐ์˜ ์ˆ˜์ž…์ด ๋†’์„์ˆ˜๋ก ๊ทธ ๊ณ ๊ฐ์˜ ์ฃผ๋ฌธ ์ˆ˜ ๋˜ํ•œ ์ฆ๊ฐ€ํ•œ๋‹ค๋Š” ๊ฒƒ์ด(๋‹จ์œ„๋‹น 0.017) 95%์—์„œ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•˜๋‹ค๋Š” ๊ฒฐ๋ก ์ด ๋‚˜์˜จ๋‹ค.

 

๋ฌผ๋ก , ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์ด ๋” ์„ค๋“๋ ฅ์„ ๊ฐ€์ง€๊ธฐ ์œ„ํ•ด์„œ๋Š” "๋ชจ๋ธ ์ „์ฒด์˜ ์œ ํšจ์„ฑ"๊ณผ ์ด ๋ชจ๋ธ์˜ "ํ†ต๊ณ„์  ๊ฐ€์ •"์„ ํ™•์ธํ•ด์•ผ๋งŒ ํ•œ๋‹ค.

์ด ๋ชจ๋ธ์˜ ์œ ํšจ์„ฑ์€ ์œ„ ๊ฒฐ๊ณผ์˜ ํ•˜๋‹จ์—์„œ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ f-test์˜ p-value๊ฐ€ ๊ทธ ์œ ์˜์ˆ˜์ค€์—์„œ ๋น„๊ต๊ฐ€ ๋˜๊ณ , ๋ชจ๋ธ์˜ ์„ค๋ช…๋ ฅ์€ R-squared๋ฅผ ํ†ตํ•ด ๋‚˜ํƒ€๋‚œ๋‹ค. ์œ„ ๋ชจ๋ธ์€ p-value๊ฐ€ 0.05๋ณด๋‹ค ํ•œ์ฐธ ์ž‘์•„, ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ ๋ชจ๋ธ์ด์ง€๋งŒ ๊ทธ ์„ค๋ช…๋ ฅ์ด ์•ฝ 11%์— ๊ทธ์นœ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ ์ด ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ถฉ๋ถ„ํžˆ ์„ค๋ช…ํ•˜๊ณ  ์žˆ์ง€๋Š” ์•Š๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

 

๋˜ํ•œ, ํšŒ๊ท€๋ถ„์„์€ ์ž”์ฐจ์˜ ์ •๊ทœ์„ฑ(์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๊ณ  ๊ฐ€์ •), ๋“ฑ๋ถ„์‚ฐ์„ฑ(๋ถ„์‚ฐ์ด ์–ด๋Š ์ง€์ ์—์„œ๋‚˜ ๊ฐ™๋‹ค๋Š” ๊ฐ€์ •), ๋…๋ฆฝ์„ฑ(์–ด๋Š ์ง€์ ์—์„œ๋‚˜ ๋…๋ฆฝ์ ์ด๋‹ค.) ๊ฐ€์ • ํ•˜์— ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ๊ฒ€์ •ํ•œ๋‹ค. ์ด์—, ์–ด๋–ค ํšŒ๊ท€๋ชจ๋ธ์ด ์œ ํšจ์„ฑ์„ ๊ฐ–๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ด๋ฅผ ๋ชจ๋‘ ํ™•์ธํ•ด์•ผ ํ•œ๋‹ค.

 

R์—์„œ๋Š” plot()์„ ํ†ตํ•ด ์ด๋“ค์„ ๊ฐ„๋‹จํžˆ ํ™•์ธํ•ด ๋ณผ ์ˆ˜ ์žˆ๊ณ , ์—ฌ๋Ÿฌ ํ•„์š”ํ•œ ๊ฒ€์ •๋“ค๋„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ์ œ๊ณตํ•œ๋‹ค.

plot(lm1) #plot(๋ชจ๋ธ) 

 

#์ •๊ทœ์„ฑ ๊ฒ€์ •

qqnorm(lm1$residuals) #normal Q-Q plot
shapiro.test(lm1$residuals)
hist(lm1$residuals)

 

#๋…๋ฆฝ์„ฑ๊ฒ€์ •

install.packages("lmtest")
library(lmtest)
dwtest(lm1) #๋ชจ๋ธ์„ ์ธ์ž๋กœ ๋ฐ›๋Š”๋‹ค.

________________________

 

๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ชจํ˜•

 

 

๋‹ค์‹œ ๋ถ„์„์œผ๋กœ ๋Œ์•„์™€ ์œ„ ์„ ํ˜•ํšŒ๊ท€๋ชจ๋ธ์„ ์ž์„ธํžˆ ๋ณด๋ฉด, ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์— ๋ฐ˜์‘ํ•˜๋Š” ๊ณ ๊ฐ์ด ๋ฐ˜์‘ํ•˜์ง€ ์•Š๋Š” ๊ณ ๊ฐ์— ๋น„ํ•ด ์ฃผ๋ฌธ ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์—ˆ๋‹ค.(๋‹จ์œ„๋‹น 9.8)

์ฆ‰, purchase ๋ณ€์ˆ˜(๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์— ์˜ํ•œ ๊ตฌ๋งค์—ฌ๋ถ€)๊ฐ€ ์ฃผ๋ฌธ ์ˆ˜์— ์˜ํ–ฅ์„ ๊ฐ•ํ•˜๊ฒŒ ๋ฏธ์น˜๊ณ  ์žˆ๋Š”, ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•œ ๋ณ€์ˆ˜์ธ ๊ฒƒ์ด๋‹ค.

์ด์—, purchase๋ฅผ ๊ทน๋Œ€ํ™” ํ•œ๋‹ค๋ฉด ์ฃผ๋ฌธ ์ˆ˜ ๋˜ํ•œ ์˜ค๋ฅผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋Š”๋ฐ, ์ด๋ฅผ ์œ„ํ•ด ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.

 

purchase๋Š” R์—์„œ factorํ˜•, ์ฆ‰, ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜์ด๋ฏ€๋กœ, ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๋ฅผ ํƒ€๊ฒŸ(์ข…์†๋ณ€์ˆ˜)์œผ๋กœ ํ•œ ํšŒ๊ท€๋ชจ๋ธ์ธ ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ชจ๋ธ์ด ์ ์ ˆํ•œ ๋ถ„์„ ๋ฐฉ๋ฒ•์ด๋‹ค. ๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ์ฝ”๋“œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. 

#์ฝ”๋“œ:  glm(์ข…์†๋ณ€์ˆ˜ ~ ๋…๋ฆฝ๋ณ€์ˆ˜, family = binomial, data = )

 

glm1 = glm(purchase ~ married + loyalty_card + number_of_orders + recency_days + income, family =binomial() , data = df)
summary(glm1)

 

 

์•ž์„œ ํšŒ๊ท€๋ชจ๋ธ๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ๋…๋ฆฝ๋ณ€์ˆ˜๋“ค์€ ์ƒํƒœ๋ณ€์ˆ˜์™€ ํ–‰๋™๋ณ€์ˆ˜๋ฅผ ์กฐํ•ฉํ•ด์„œ ๋„ฃ์„ ์ˆ˜ ์žˆ๋‹ค.

p-value๋ฅผ ๋ณด๋ฉด, ๋ชจ๋“  ๋ณ€์ˆ˜์˜ p-value๊ฐ€ ์œ ์˜์ˆ˜์ค€ 0.05๋ณด๋‹ค ์ž‘์•„ ๋ชจ๋“  ๋ณ€์ˆ˜๊ฐ€ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜๋ฏธํ•˜๋‹ค๋Š” ๊ฒฐ๋ก ์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ๋‹ค.

๋กœ์ง€์Šคํ‹ฑํšŒ๊ท€๋ชจ๋ธ์€ ๋กœ์ง“ํ™”๋˜์–ด์žˆ๋Š” ๊ฐ’์œผ๋กœ ๋ฐ˜ํ™˜์„ ํ•ด์ฃผ๋Š”๋ฐ, ์ด๋ฅผ ํ•ด์„ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ž์—ฐ์ˆ˜ ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•œ๋‹ค.

 

exp(glm1$coefficients)

 

์ด ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด, ์ƒ๋Œ€์ ์œผ๋กœ ํฐ ์˜ํ–ฅ๋ ฅ์„ ๊ฐ€์ง€๋Š” ๋‘ ๋ณ€์ˆ˜์ธ married1๊ณผ loyalty_card1์„ ์ฃผ๋ชฉํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

์ด๋ฅผ ์Šน์‚ฐ๋น„(odds ratio)๋กœ ํ•ด์„ํ•˜๋ฉด, ๊ธฐํ˜ผ์ž๋Š” ๋ฏธํ˜ผ์ž์— ๋น„ํ•ด ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์„ ํ†ตํ•œ ๊ตฌ๋งคํ™•๋ฅ ์„ 2.2๋ฐฐ ์ฆ๊ฐ€์‹œํ‚ค๋ฉฐ, ๋กœ์–„ํ‹ฐ ์นด๋“œ๋ฅผ ๊ฐ€์ง„ ์‚ฌ๋žŒ์€ ๊ฐ€์ง€์ง€ ์•Š์€ ์‚ฌ๋žŒ์— ๋น„ํ•ด 2.44๋ฐฐ ์ฆ๊ฐ€์‹œํ‚จ๋‹ค.  

 

์ฆ‰, ์—ฌ๊ธฐ์„œ ๋งˆ์ผ€ํŒ… ์‹œ์‚ฌ์ ์„ ๋ฝ‘์•„๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด, ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์˜ ๊ตฌ๋งคํšจ๊ณผ๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ์–ด๋–ค ์ง€์ ์„ ๊ณต๋žตํ•ด์•ผํ•  ์ง€ ๊ทธ ์ง€์ ์„ ๋ฝ‘์•„๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

ํ•ด๋‹น ๊ตฌ๋งค ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ฅธ ๋ถ„์„๊ฒฐ๊ณผ๋Š” ๊ธฐํ˜ผ์ž์™€ ๋กœ์–„ํ‹ฐ ์นด๋“œ๋ฅผ ๊ฐ€์ง„ ์ด๋“ค์ด ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ ์ดํ›„ ๊ตฌ๋งคํ•  ํ™•๋ฅ ์„ ๋” ๋†’์ด๊ณ  ์žˆ๋‹ค.

๋”ฐ๋ผ์„œ, ๋งˆ์ผ€ํŒ…์˜ ๊ตฌ๋งค์ „ํ™˜์œจ์„ ๋†’์ด๊ณ  ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ฃผ๋ฌธ๊ฑด์ˆ˜์™€ ์ˆ˜์ต์„ ๋†’์ด๊ธฐ ์œ„ํ•ด์„œ๋Š”, ๊ธฐํ˜ผ์ž๋ฅผ ํƒ€๊ฒŸ์œผ๋กœ ํ•œ ๋งˆ์ผ€ํŒ… ํ™œ๋™์ด๋‚˜ ๋กœ์–„ํ‹ฐ ์นด๋“œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์ถฉ์„ฑ๊ณ ๊ฐ์„ ์œ„ํ•œ ๋งˆ์ผ€ํŒ… ํ™œ๋™์„ ์ „๊ฐœํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒฐ๋ก ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

์ด์ฒ˜๋Ÿผ ๋ถ„์„์˜ ํ๋ฆ„์„ ์žก๋Š” ๊ฒƒ์€ ํšŒ๊ท€๋ถ„์„ ๋‚ด ์ผ๋ จ์˜ ๊ณผ์ •์—์„œ ์•„์ด๋””์–ด๋ฅผ ์–ป์„ ์ˆ˜๋„ ์žˆ๋‹ค.

์ค‘์š”ํ•œ ๊ฒƒ์€ ๋ถ„์„๊ฐ€์˜ ํ๋ฆ„์€ ๋…ผ๋ฆฌ์ ์ด์–ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๊ณ , ํ†ต๊ณ„์ ์œผ๋กœ ๊ทธ ๊ทผ๊ฑฐ๊ฐ€ ํ™•๋ณด๋˜์–ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. 

 

*์ฐธ๊ณ 

 

https://seollane22.tistory.com/9

 

ํšŒ๊ท€ ๋ถ„์„(Regression Analysis) [Supervised Learning]

AI, ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๋ฐ‘๋ฐ”ํƒ•์ธ ๋จธ์‹ ๋Ÿฌ๋‹(๊ธฐ๊ณ„ํ•™์Šต)์—๋Š” ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ๊ฐˆ๋ž˜๊ฐ€ ์žˆ๋‹ค. - ์ง€๋„ํ•™์Šต (ํƒ€๊ฒŸ, ์ •๋‹ต์„ ํ•จ๊ป˜ ํ•™์Šต์‹œ์ผœ ํƒ€๊ฒŸ์„ ์˜ˆ์ธกํ•œ๋‹ค.) - ๋น„์ง€๋„ํ•™์Šต (ํƒ€๊ฒŸ, ์ •๋‹ต์—†์ด ํ•™์Šต์‹œ์ผœ ๋ฐ์ดํ„ฐ์˜ ํŠน

seollane22.tistory.com