2023. 2. 1. 17:20ใ๐ง๐ป๐ป With Data/๋ฐ์ดํฐ ๋ถ์
์ฝ์ค ๋น๋ก ์ํ ๋ชจํ์ R์์ ๊ตฌํํด๋ณด์.
library(survival)
library(survminer)
์์กด๋ถ์์ ํจ์๋ค์ด ๋ด๊ธด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๋ถ๋ฌ์จ๋ค.
๋ฐ์ดํฐ๋ ์ด์ ํฌ์คํธ์ธ ์นดํ๋-๋ง์ด์ด์์ ์ฐ์ธ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋๋ก ์ด์ฉํ์๋ค.
# ์ฐ์ต ๋ฐ์ดํฐ์ธ survivalDataExercise.csv๋ฅผ ์ด์ฉํ์๋ค. (๋๊ธ ์ฃผ์๋ฉด ๊ณต์ ํด๋๋ฆฌ๊ฒ ์ต๋๋ค.)
๋ชจ๋ธ๋ง
cx.model = coxph(Surv(daysSinceFirstPurch, event) ~ gender+voucher+returned,data=surv)
#์๊ฐ์ ๋ฐ๋ฅธ ์ด๋ฒคํธ ~ (์ฑ๋ณ+์ฟ ํฐ์ฌ์ฉ์ฌ๋ถ+ํ๋ถ์ฌ๋ถ)
summary(cx.model)
์ ์ฝ๋๋ ์ฝ์ค ๋น๋ก ์ํ ๋ชจํ์ ๋ง๋๋ ์ฝ๋์ด๋ค.
์ข ์๋ณ์๋ ์๊ฐ์ ๋ฐ๋ฅธ ์ด๋ฒคํธ๊ฐ ๋ค์ด๊ฐ๊ณ , ๋ ๋ฆฝ๋ณ์์ ํ์ธํ๊ณ ์ถ์ ํน์ฑ๋ค์ ์ถ๊ฐํ๋ค.
Pr์ ํตํด ํต๊ณ์ ์ ์์ฑ์ ๊ฒ์ ํ๋ p-value๋ฅผ ํ์ธํ ์ ์๋ค.
์์ ๊ฒฐ๊ณผ๋ฌผ์ ๋ณด๋ฉด gendermale, voucher1, returned1์ p-value๊ฐ ๋ชจ๋ ์ ์์์ค๋ณด๋ค ํ์ฐธ ์์, ๊ทธ ์ํฅ๋ ฅ์ด ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ๋ค๋ ์ฌ์ค์ ์ ์ ์๋ค.
exp(coef)๋ฅผ ํตํด ๊ทธ ์ํฅ๋ ฅ์ ํด์ํด๋ณผ ์ ์๋๋ฐ, ์ด๋ ๊ทธ "์ํ๋น"๋ก์ ์๊ฐ์ ๋ฐ๋ผ ๋ณํ์ง ์๋ ์ํ์ ๋์ด๋ค.
hazard Ratio
- ์ฌ์ฑ์ ๋ํ ๋จ์ฑ์ ์ํ๋น (๋จ์ฑ / ์ฌ์ฑ) = 0.55
- ์ฟ ํฐ ์ฌ์ฉ์ ๋ํ ์ํ๋น (์ฟ ํฐo / ์ฟ ํฐx) = 1.41
- ํ๋ถ ์ฌ๋ถ์ ๋ํ ์ํ๋น (ํ๋ถo / ํ๋ถx) = 1.74
์ฌ์ฑ๊ณ ๊ฐ์ด ๋จ์ฑ๊ณ ๊ฐ์ ๋นํด, ์ฟ ํฐ์ ์ด์ฉํ ๊ณ ๊ฐ, ํ๋ถํ ๊ณ ๊ฐ์ด ๋ ๋น ๋ฅด๊ฒ ์ดํํ๋ค.
๊ทธ ์ํฅ๋ ฅ์ ๊ฐ๊ฐ 0.45, 0.41, 0.74 ์ ๋์ด๋ค.
ggforest(cx.model) #์๊ฐํ
๋น๋ก ์ํ ๊ฐ์ ๊ฒํ
cox.zph(cx.model) #์๊ฐ๊ณผ ์์ฐจ ๊ฐ์ ๋ ๋ฆฝ์ฑ ๊ฒ์
p < 0.05 (์ ์์์ค)์ด๋ฉด, ์๊ฐ์ ๋ฐ๋ผ ๋ ๋ฆฝ์ ์ด๋ผ๋ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ค.
์ด์, gender ๋ณ์๋ p๊ฐ์ด ์ ์์์ค๋ณด๋ค ์์, ๊ทธ ์ํ๋น๊ฐ ์๊ฐ์ ๋ ๋ฆฝ์ ์ด์ง ์๊ณ ์คํ๋ ค ์๊ฐ์ ์ํฅ์ ๋ฐ๊ณ ์๋ค๊ณ ๋ณผ ์ ์๋ค.
์ฆ, ์ด๋ ์๊ฐ์ด ๊ทธ ์ํ๋น์ ์ํฅ์ ์ฃผ๊ณ ์์์ ์์ฌํ๋ ๊ฒ์ด๋ค.
๋๋ฌธ์ gender ๋ณ์๋ ๊ทธ ์ํ๋น๊ฐ ์๊ฐ์ ๋ฐ๋ผ ์ผ์ ํ๋ค๋ ๊ฐ์ ์ ์ถฉ์กฑํ๋ค๊ณ ๋ณผ ์ ์๋ค.
์ด์, ๊ตํธ์์ฉ์ ์ถ๊ฐํ์ฌ ๋ชจ๋ธ์ ์๋ก ๋ง๋ค๊ฑฐ๋ ์ธตํ์์ ์ ํตํด gender(๋จ/์ฌ)๋ฅผ ๋ถ๋ฆฌํ์ฌ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ด ์ ์ ํ๋ค.
cx.model2 = coxph(Surv(daysSinceFirstPurch, event) ~ voucher+returned+gender*daysSinceFirstPurch,data=surv) summary(cx.model2) #์๊ฐ๊ณผ์ ๊ตํธ์์ฉ
or
co1 = coxph(Surv(daysSinceFirstPurch, event) ~ voucher+returned, data=surv[surv$gender== "female",])
co2 = coxph(Surv(daysSinceFirstPurch, event) ~ voucher+returned, data=surv[surv$gender== "male",])
#๋ฐ์ดํฐ ์ ๋ถ๋ฆฌ
๋ฐ์ดํฐ ์ ์ ๋ํ ์ค๋ช + ์นดํ๋ ๋ง์ด์ด ์ฐธ์กฐ
https://seollane22.tistory.com/5
๊ฐ๋
https://seollane22.tistory.com/13
'๐ง๐ปโ๐ป With Data > ๋ฐ์ดํฐ ๋ถ์' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[PYTHON] ์์ฌ๊ฒฐ์ ๋๋ฌด (Decision Tree) (0) | 2023.02.07 |
---|---|
[R] ์ ํํ๊ท, ๋ก์ง์คํฑํ๊ท [Regression Analysis] (2) | 2023.01.25 |
[R] ์นดํ๋ ๋ง์ด์ด(kaplan-meier) [Survival Analysis] (2) | 2023.01.10 |