데이터 분석을 하다보면 자주 나오는 것 중에 하나가 ROC curve입니다.
이게 뭔지 알아보면
저희는 confusion matrix 라는 애를 알아야하는데 얘가 나타내주는 것이 뭐냐하면
예를 들면 암을 예측하는 모델이 있다고 할 때
실제 데이터가 암인데 모델이
1. 암이 맞다 (TP - true positive)
2. 암이 아니다 (FP - false negative)
라고 2가지로 예측할 수 있습니다.
자, 그렇다면 얘를 그래프로 나타내보면
이런식으로 나타낼 수 있는데, TPR 부분이 1이고, FPR이 0인 부분이 가장 이상적입니다.
이 때문에, 머신러닝 모델의 정확도를 평가할 때 ROC 커브를 사용합니다.
참고
'개발 > Kaggle' 카테고리의 다른 글
StandardScaler (0) | 2020.07.20 |
---|---|
SVM (0) | 2020.07.20 |
KNN (0) | 2020.07.09 |
Stacking 실습 (0) | 2020.06.07 |
보팅(Voting)이란 (0) | 2020.06.07 |