인공지능 성능 평가 지표 정리

(조금 더 쉽게 이해하기 : https://seleuchel.tistory.com/189)

[정답여부 : 틀림] : false

[내 의견 : 내 모델이or 내가 한 답변] : positive or negative

false positive : 거짓 양성 (오탐)

답이 음성인 문제를 양성으로 표현

=> 나는 맞다고 생각했지만 틀림.. (사실 음성이었다)

false negative : 거짓음성 (미탐)

답이 양성인 문제를 음성으로 표현

=> 나는 틀렸다고 생각했지만, 틀림.. (사실 양성이었다)

TN : 부정으로 예측해서 맞음 (실제 부정임)
TP : 긍정으로 예측해서 맞음 (실제 긍정임)
FN : 부정으로 예측해서 틀림 (실제 긍정임)
FP : 긍정으로 예측해서 틀림 (실제 부정임)

정확도(Accuracy) : 얼마나 실제 결과와 예측 결과가 잘 맞는지
"내가 예측한 것이 정확하다!"
( TN + TF ) / 전체 데이터 수
: (긍정이라고 해서 맞은 것 + 부정이라고 해서 맞은 것) / (전체 예측에 사용한 총 데이터 수)
정밀도(Precision) : 내가 긍정으로 예측한 경우 중 실제로 긍정인 비율. 예측값이 얼마나 정확한가
"나의 양성 예측이 이렇게 잘 맞는다!" "긍정적인 것만 생각하자구"
TP / (TP + FP)
: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것)
재현율(Recall) : True인 것 중에서 True라고 예측한 것의 비율
"전체 True 데이터 중에서 내가 이렇게 True 데이터를 잘 맞힌다!" "답이 True인지만 생각하자구"
TP / (TP + FN)
: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 부정이라고 해서 틀린 것 [그러니까, 실제로는 True 였던 거임])
f1 score : f1 Score는 정밀도와 재현율의 조화평균 (주로 분류 클래스 간의 데이터가 불균형이 심각할때 사용)
"데이터 라벨이 불균형 구조일 때, 모델의 성능을 정확하게 평가할 수 있어!"
2 x (정밀도 x 재현율) / (정밀도 + 재현율)

: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것): 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것)

티스토리툴바