개발/파이썬 머신러닝 완벽가이드 정리

학습데이터 테스트 데이터

----___<<<<< 2020. 1. 22. 18:25

머신러닝 알고리즘을 구현할 때, 학습에 필요한 데이터들이 있습니다.

 

머신러닝에서는 컴퓨터에게 무엇인가를 가르쳐줘야하는데, 가르쳐주는 데이터가 필요합니다.

 

예를 들면, 컴퓨터에게 이렇게 생긴 애가 고양이다 라고 알려주려면

 

고양이 사진을 엄청나게 보여주고 이 것이 고양이다 라고 알려줘야합니다.

 

이 것을 학습용 데이터라고 하는데, 컴퓨터를 학습시킬 데이터를 주고, 일부는 테스트 데이터로 분리해서

 

학습용 데이터로 학습한 컴퓨터가 테스트 데이터를 보고 제대로 고양이로 인식할 수 있는지를 테스트해봐야 합니다.

 

X_train, X_test, y_train, y_test = train_test_split(data, target, test_size,reandom_state)

 

X_train.y_train 은 학습용 데이터

X_test, y_test는 테스트용 데이터

 

애를 가지고 predict를 해보면, 정확도를 알 수 있습니다.

'개발 > 파이썬 머신러닝 완벽가이드 정리' 카테고리의 다른 글

하이퍼파라미터, GridSearchCV  (0) 2020.01.22
교차검증  (0) 2020.01.22
머신러닝이란  (0) 2020.01.22
판다스 pandas  (0) 2020.01.22
넘파이 Numpy  (0) 2020.01.22