파이썬/머신러닝2 머신러닝 기초 - 버섯 데이터 분류 실습 목표 버섯의 특징을 활용해 독/식용/ 분류해보자 과대적합 제어하는 속성을 변경해보자 특성선택(특성중요도) 확인하기 필요한 라이브러리 불러오기 데이터 불러오기 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier # 열 생략 안하도록 설정 pd.set_option('display.max_columns',None) data = pd.read_csv('./data/mushroom.csv') data.head() # 데이터 크기 확인 data.shape → 행 8124개, 열 23개 (특성 22개 + 답 1개) 로 이루어진 것을 확인할 수 있다. # .. 2022. 5. 17. 머신러닝 기초 - 사이킷런(sklearn)을 이용해서 붓꽃 종류 분류하기 목표 python의 scikit-learn 라이브러리를 이용해서 붓꽃의 종류를 분류해보자 knn 모의 이웃 숫자를 조절해보자 - 자주 쓰는 라이브러리를 임포트 하고 sklearn에 기본 탑재된 붓꽃 데이터를 가져온다 sklearn을 통해 가져온 붓꽃의 데이터는 번치 객체이다. - 번치(bunch) 객체란? 데이터가 묶음으로 들어있음 - keys() : 어떤 데이터가 들어있는지 확인해보자. iris_data에는 'data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename' 위와 같은 정보가 한번에 들어있다. - data : 붓꽃 데이터를 봐보자. - feature_names : 붓꽃의 특성 이름과 순서를 확인해보자. 꽃받침의 .. 2022. 5. 12. 이전 1 다음