목록AI/ML (3)
얼레벌레
랜덤 포레스트(Random Forest) : 결정 트리의 앙상블 앙상블 학습 ⇨ 여러개의 예측기로부터 예측을 수집하여 보다 더 나은 모델을 구축하기 위한 학습 알고리즘 앙상블 학습은 예측기들끼리 가능한 서로 독립적일 때 가장 좋은 성능 발휘 어떻게 앙상블 학습 ?? 1. 각기 다른 훈련 알고리즘 사용하기 일반적으로 투표기반 분류기가 개별 분류기보다 성능이 더 좋다. 직접 투표 분류기 : 다수결 투표로 정해지는 분류기 ⇨ voting = 'hard' 간접 투표 분류기 : 각각 분류기의 에측을 평균 내어 확률이 가장 높은 클래스를 예측하는 분류기 ⇨ voting = 'soft' ** 간접 투표 분류기는 모든 분류기가 확률을 예측할 수 있는 경우에 사용 가능. 확률이 높은 예측기에 가중치를 두어서 직접투표방식..
Decision Tree ? 데이터를 나무 구조로 도표화하여 분류 및 회귀를 수행하는 머신러닝 알고리즘 * 일종의 스무고개 * 특정 기준에 대한 정답/오답에 따라 대상의 범위를 좁혀나감 * 분류(DecisionTreeClassifier)와 회귀(DecisionTreeRegressor)가 모두 가능 + 다중출력 작업까지 * 데이터 전처리 불필요 -> scaling 불필요 1️⃣ 간단한 시각화 from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier import numpy as np import pandas as pd iris = load_iris() # 붓꽃데이터 로드 iris.keys() # iris 데이터..