- True/False : 실제 데이터의 결과 (공격인 데이터/공격이 아닌 데이터)
- Positive/Negative : 내가(모델이) 예측한 답안
(조금 더 쉽게 이해하기 : https://seleuchel.tistory.com/189)
[정답여부 : 틀림] : false
[내 의견 : 내 모델이or 내가 한 답변] : positive or negative
false positive : 거짓 양성 (오탐)
답이 음성인 문제를 양성으로 표현
=> 나는 맞다고 생각했지만 틀림.. (사실 음성이었다)
false negative : 거짓음성 (미탐)
답이 양성인 문제를 음성으로 표현
=> 나는 틀렸다고 생각했지만, 틀림.. (사실 양성이었다)
TN : 부정으로 예측해서 맞음 (실제 부정임)
TP : 긍정으로 예측해서 맞음 (실제 긍정임)
FN : 부정으로 예측해서 틀림 (실제 긍정임)
FP : 긍정으로 예측해서 틀림 (실제 부정임)
- 정확도(Accuracy) : 얼마나 실제 결과와 예측 결과가 잘 맞는지
"내가 예측한 것이 정확하다!"
( TN + TF ) / 전체 데이터 수
: (긍정이라고 해서 맞은 것 + 부정이라고 해서 맞은 것) / (전체 예측에 사용한 총 데이터 수) - 정밀도(Precision) : 내가 긍정으로 예측한 경우 중 실제로 긍정인 비율. 예측값이 얼마나 정확한가
"나의 양성 예측이 이렇게 잘 맞는다!" "긍정적인 것만 생각하자구"
TP / (TP + FP)
: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것) - 재현율(Recall) : True인 것 중에서 True라고 예측한 것의 비율
"전체 True 데이터 중에서 내가 이렇게 True 데이터를 잘 맞힌다!" "답이 True인지만 생각하자구"
TP / (TP + FN)
: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 부정이라고 해서 틀린 것 [그러니까, 실제로는 True 였던 거임]) - f1 score : f1 Score는 정밀도와 재현율의 조화평균 (주로 분류 클래스 간의 데이터가 불균형이 심각할때 사용)
"데이터 라벨이 불균형 구조일 때, 모델의 성능을 정확하게 평가할 수 있어!"
2 x (정밀도 x 재현율) / (정밀도 + 재현율)
: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것): 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것)