분류 전체보기(23)
-
소비자를 고객으로 #Marketing #2
오늘날 소비자들은 인터넷, sns 등 여러 채널을 통해 수많은 정보를 접하고 있습니다. 시장이 공급하는 수많은 대체재들과 각종 정보들은 소비자들로 하여금 선택의 폭을 넓히고 다양한 기회를 얻도록 하고 있는 것이죠. 특히나 온라인 환경으로 확대된 시장은 소비자들의 전환비용을 낮추어 언제든 다른 제품, 다른 서비스로 전환하는 것을 유도하고 있습니다. 오프라인과 달리 온라인에서는 클릭 한 번으로 수많은 광고와 여러 정보를 동시에 접할 수 있기 때문입니다. 즉, 시장에 진입하는 기업들에게 이러한 시장은 기회인 동시에 위기가 될 수 있습니다. 소비자들은 언제든 쉽게 우리를 접할 수 있지만, 그만큼 쉽게 떠날 수 있음을 인지해야 합니다. 이러한 환경에서는 소비자들을 고객으로 만들기 위한 마케팅 노력이 더더욱 중요할..
2023.02.28 -
[PYTHON] 의사결정나무 (Decision Tree)
의사결정나무는 분류와 회귀 문제에 모두 적용이 가능한 알고리즘으로, 결과도출과정과 그 결과를 해석하기에 매우 유리한 알고리즘이다. 파이썬의 의사결정나무 알고리즘은 사이킷런 라이브러리를 이용한다. 분석에 쓰인 데이터는 캐글에서 가져온 ibm hr분석(퇴사여부 분류) 데이터이다. (https://www.kaggle.com/datasets/pavansubhasht/ibm-hr-analytics-attrition-dataset?datasetId=1067&searchQuery=deci) 전처리 과정에서 가장 중요한 것은 자료형 확인, 결측치 확인, 데이터 분포 확인 등이 있다. 위 데이터는 특히 자료형에 유의해야 한다. 데이터 설명을 참조하면 얼핏 수치형으로 보이는 변수들이 사실은 명목형 변수를 나타내고 있음을 ..
2023.02.07 -
깃허브(github) 참조!
자세한 코드와 분석 흐름은 깃허브를 참조해주세요! https://github.com/Reign2121 Reign2121 - Overview Researcher / Analyst. Reign2121 has 9 repositories available. Follow their code on GitHub. github.com
2023.02.06 -
앙상블 기법 #랜덤 포레스트 #XG부스트
앙상블 기법이란, 더 높은 성능을 위해 여러 모델( = 분류기)을 만들고 조합하여 결과를 도출하는 기법을 말한다. 이 기법의 아이디어는, 분류든 회귀든 어떤 문제를 해결함에 있어서 하나의 알고리즘, 모델을 완벽히 다듬는 것보다 여러 모델을 조합하는 것이 더 뛰어난 성능을 보일 수 있다는 것이다. 앙상블 기법의 아이디어는 위 그림에서 여러 명의 일반인을 조합하는 것을 의미한다. 그림에서처럼 한 명의 전문가와 여러 명의 일반인의 성능의 비교는 딱 잘라서 "누가 더 좋다"라고 말하기 어렵지만, 앙상블 기법을 통한 모델은 일반적으로 단일 모델모다 더 우월한 성능을 보여주는 것이 사실이다. 정리하자면, 앙상블 기법은 "약한 분류기"여러 개를 조합하여 하나의 "강한 분류기"로 만드는 기법이다. 딥러닝의 응용이 활성..
2023.02.03 -
의사결정나무(Decision Tree) [Supervised Learning]
AI, 데이터 분석의 밑바탕인 머신러닝(기계학습)에는 크게 세 가지 갈래가 있다. - 지도학습 (타겟, 정답을 함께 학습시켜 타겟을 예측한다.) - 비지도학습 (타겟, 정답없이 학습시켜 데이터의 특성을 파악한다.) - 강화학습 (주어진 상태에 대한 보상을 통해 최적의 행동을 학습시킨다.) 의사결정나무 - 지도학습 의사결정나무는 분류, 회귀 문제에 모두 적용이 가능한 지도학습 알고리즘이다. (분류 문제: 분류 나무, 회귀 문제: 회귀 나무) 이는 비교적 간단하고 쉬운 알고리즘으로 오늘날까지 현업에서 가장 많이 이용되는 알고리즘 중 하나이다. 이름에서도 알 수 있듯이, 이 모형은 의사결정 과정을 단계별로 도식화한 나무 형태를 가진다. 이 모형에서 각 단계를 "노드"라고 하는데, 이 알고리즘은 상위노드에서 하..
2023.02.02 -
[R] Cox PH model [Survival Analysis]
콕스 비례 위험 모형을 R에서 구현해보자. library(survival) library(survminer) 생존분석의 함수들이 담긴 라이브러리를 불러온다. 데이터는 이전 포스트인 카플란-마이어에서 쓰인 데이터를 그대로 이용하였다. # 연습 데이터인 survivalDataExercise.csv를 이용하였다. (댓글 주시면 공유해드리겠습니다.) 모델링 cx.model = coxph(Surv(daysSinceFirstPurch, event) ~ gender+voucher+returned,data=surv) #시간에 따른 이벤트 ~ (성별+쿠폰사용여부+환불여부) summary(cx.model) 위 코드는 콕스 비례 위험 모형을 만드는 코드이다. 종속변수는 시간에 따른 이벤트가 들어가고, 독립변수에 확인하고 싶..
2023.02.01