보르헤스의 지도
모형의 성능 평가 본문
성능 평가
정인식률(correct recognition rate) = c/N
기각률(reject rate) = r/N
오류율(error rate) = e/N
혼동 행렬(confusion matrix)
| 분류 결과 | ||
W1 | W2 | ||
참 부류 | W1 | n11(TP) | n12(FN) |
W2 | n21(FP) | n22(TN) |
거짓 긍정률(FPR, fall out) = FP/(FP+TN)
거짓 부정률(FNR) = FN/(FN+TP)
정확률(precision, PPV) = TP/(TP+FP)
재현률(recall, sensitivity, TPR) = TP/(TP+FN)
ROC curve
TPR과 FPR로 나타내는 곡선. random일 경우 기울기 1인 직선의 형태로 나타나며 AUC (Area under curve)도 0.5가 되며 1에 가까울수록 모형의 성능이 좋다.
'데이터 과학' 카테고리의 다른 글
[R] 두 개의 리스트 비교하기 (0) | 2016.09.08 |
---|---|
T-test (0) | 2016.02.02 |
바이어스-분산 딜레마 (0) | 2016.02.02 |