머신러닝 알고리즘을 구현할 때, 학습에 필요한 데이터들이 있습니다.
머신러닝에서는 컴퓨터에게 무엇인가를 가르쳐줘야하는데, 가르쳐주는 데이터가 필요합니다.
예를 들면, 컴퓨터에게 이렇게 생긴 애가 고양이다 라고 알려주려면
고양이 사진을 엄청나게 보여주고 이 것이 고양이다 라고 알려줘야합니다.
이 것을 학습용 데이터라고 하는데, 컴퓨터를 학습시킬 데이터를 주고, 일부는 테스트 데이터로 분리해서
학습용 데이터로 학습한 컴퓨터가 테스트 데이터를 보고 제대로 고양이로 인식할 수 있는지를 테스트해봐야 합니다.
X_train, X_test, y_train, y_test = train_test_split(data, target, test_size,reandom_state)
X_train.y_train 은 학습용 데이터
X_test, y_test는 테스트용 데이터
애를 가지고 predict를 해보면, 정확도를 알 수 있습니다.
'개발 > 파이썬 머신러닝 완벽가이드 정리' 카테고리의 다른 글
하이퍼파라미터, GridSearchCV (0) | 2020.01.22 |
---|---|
교차검증 (0) | 2020.01.22 |
머신러닝이란 (0) | 2020.01.22 |
판다스 pandas (0) | 2020.01.22 |
넘파이 Numpy (0) | 2020.01.22 |