25.05.19 코딩 공부 시작

코딩 척척석박사 분들 피드백 환영합니다.

공대생이 코딩에서 살아남기

xgboost 3

5강. 회귀, 분류 모델링 심화 및 코드(07.01) ☆☆

의사결정나무란?(Decision Tree, DT)전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법(장점) 쉽고 해석 가능, 다중분류/회귀 모두 적용 가능, 스케일링 불필요(단점) 과적합 발생, 불안정성sklearn.tree.DecisionTreeClassifiersklearn.tree.DecisionTreeRegressor[기본용어 설명]루트 노드(Root Node): 의사결정나무의 시작점. 최초의 분할조건리프 노드(Leaf Node): 루트 노드로부터 파생된 중간 혹은 최종 노드분류기준(criteria): sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로, 남성인 경우 우측 노드로 분류불순도(impurity)불순도 측정 방법 중 하나 인 지니 계수는 0과..

[머신러닝 주요기법] 2회차 (07.01)

의사결정나무(Decision Tree)란?의사결정 과정을 트리 구조로 나타낸 알고리즘불순도(Impurity)를 최소화하는 분할점 찾기[특징]해석 가능성: 결정 과정을 쉽게 설명할 수 있음비선형 관계: 복잡한 패턴도 포착 가능특성 선택: 중요한 변수를 자동으로 선별데이터 전처리: 스케일링이나 정규화 불필요[원리]1단계: 불순도 측정(지니 불순도)데이터가 얼마나 섞여 있는지 측정낮을수록 좋음2단계: 정보 획득(Information Gain) 계산분할 전후 불순도 감소량 측정높을수록 좋음3단계: 트리 구축 과정(탐욕적 알고리즘)최고 정보 획득 찾기: 모든 가능한 분할 중 정보 획득이 최대인 것 선택재귀적 분할: 각 자식 노드에서 1단계 반복종료 조건: 더 이상 분할할 수 없거나 조건을 만족할 때까지[코드]fr..

특강/머신러닝 2025.07.01