의사결정나무(2)
-
[PYTHON] 의사결정나무 (Decision Tree)
의사결정나무는 분류와 회귀 문제에 모두 적용이 가능한 알고리즘으로, 결과도출과정과 그 결과를 해석하기에 매우 유리한 알고리즘이다. 파이썬의 의사결정나무 알고리즘은 사이킷런 라이브러리를 이용한다. 분석에 쓰인 데이터는 캐글에서 가져온 ibm hr분석(퇴사여부 분류) 데이터이다. (https://www.kaggle.com/datasets/pavansubhasht/ibm-hr-analytics-attrition-dataset?datasetId=1067&searchQuery=deci) 전처리 과정에서 가장 중요한 것은 자료형 확인, 결측치 확인, 데이터 분포 확인 등이 있다. 위 데이터는 특히 자료형에 유의해야 한다. 데이터 설명을 참조하면 얼핏 수치형으로 보이는 변수들이 사실은 명목형 변수를 나타내고 있음을 ..
2023.02.07 -
의사결정나무(Decision Tree) [Supervised Learning]
AI, 데이터 분석의 밑바탕인 머신러닝(기계학습)에는 크게 세 가지 갈래가 있다. - 지도학습 (타겟, 정답을 함께 학습시켜 타겟을 예측한다.) - 비지도학습 (타겟, 정답없이 학습시켜 데이터의 특성을 파악한다.) - 강화학습 (주어진 상태에 대한 보상을 통해 최적의 행동을 학습시킨다.) 의사결정나무 - 지도학습 의사결정나무는 분류, 회귀 문제에 모두 적용이 가능한 지도학습 알고리즘이다. (분류 문제: 분류 나무, 회귀 문제: 회귀 나무) 이는 비교적 간단하고 쉬운 알고리즘으로 오늘날까지 현업에서 가장 많이 이용되는 알고리즘 중 하나이다. 이름에서도 알 수 있듯이, 이 모형은 의사결정 과정을 단계별로 도식화한 나무 형태를 가진다. 이 모형에서 각 단계를 "노드"라고 하는데, 이 알고리즘은 상위노드에서 하..
2023.02.02