개발/Kaggle

ROC curve

개복치 개발자 2020. 9. 13. 21:27

 데이터 분석을 하다보면 자주 나오는 것 중에 하나가 ROC curve입니다.

 

 이게 뭔지 알아보면

 

 저희는 confusion matrix 라는 애를 알아야하는데 얘가 나타내주는 것이 뭐냐하면

 

https://commons.wikimedia.org/wiki/File:ConfusionMatrixRedBlue.png

 

 예를 들면 암을 예측하는 모델이 있다고 할 때 

 

 실제 데이터가 암인데 모델이

 

 1. 암이 맞다 (TP - true positive)

 2. 암이 아니다 (FP - false negative)

 

 라고 2가지로 예측할 수 있습니다.

 

 자, 그렇다면 얘를 그래프로 나타내보면 

 

 

 이런식으로 나타낼 수 있는데, TPR 부분이 1이고, FPR이 0인 부분이 가장 이상적입니다.

 

 이 때문에, 머신러닝 모델의 정확도를 평가할 때 ROC 커브를 사용합니다.

 

 

 

 

 

 

 

 

참고

[1] - www.youtube.com/watch?v=nMAtFhamoRY

'개발 > Kaggle' 카테고리의 다른 글

StandardScaler  (0) 2020.07.20
SVM  (0) 2020.07.20
KNN  (0) 2020.07.09
Stacking 실습  (0) 2020.06.07
보팅(Voting)이란  (0) 2020.06.07