본문 바로가기
  • Trace
Deep,Machine Learning

인공지능 성능 평가 지표 정리

by seleuchel 2022. 4. 8.
  • True/False : 실제 데이터의 결과 (공격인 데이터/공격이 아닌 데이터)
  • Positive/Negative : 내가(모델이) 예측한 답안

 


(조금 더 쉽게 이해하기 : https://seleuchel.tistory.com/189)

[정답여부 : 틀림] : false

[내 의견 : 내 모델이or 내가 한 답변] : positive or negative

 

false positive : 거짓 양성 (오탐)

답이 음성인 문제를 양성으로 표현

=> 나는 맞다고 생각했지만 틀림.. (사실 음성이었다)

 

false negative : 거짓음성 (미탐)

답이 양성인 문제를 음성으로 표현

=> 나는 틀렸다고 생각했지만, 틀림.. (사실 양성이었다)


TN : 부정으로 예측해서 맞음 (실제 부정임)
TP : 긍정으로 예측해서 맞음 (실제 긍정임)
FN : 부정으로 예측해서 틀림 (실제 긍정임)
FP : 긍정으로 예측해서 틀림 (실제 부정임)


  • 정확도(Accuracy) : 얼마나 실제 결과와 예측 결과가 잘 맞는지
    "내가 예측한 것이 정확하다!"
    ( TN + TF ) / 전체 데이터 수
    : (긍정이라고 해서 맞은 것 + 부정이라고 해서 맞은 것) / (전체 예측에 사용한 총 데이터 수)
  • 정밀도(Precision) : 내가 긍정으로 예측한 경우 중 실제로 긍정인 비율. 예측값이 얼마나 정확한가
    "나의 양성 예측이 이렇게 잘 맞는다!" "긍정적인 것만 생각하자구"
    TP / (TP + FP)
    : 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것)
  • 재현율(Recall) : True인 것 중에서 True라고 예측한 것의 비율
    "전체 True 데이터 중에서 내가 이렇게 True 데이터를 잘 맞힌다!" "답이 True인지만 생각하자구"
    TP / (TP + FN)
    : 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 부정이라고 해서 틀린 것 [그러니까, 실제로는 True 였던 거임])
  • f1 score : f1 Score는 정밀도와 재현율의 조화평균 (주로 분류 클래스 간의 데이터가 불균형이 심각할때 사용)
    "데이터 라벨이 불균형 구조일 때, 모델의 성능을 정확하게 평가할 수 있어!"
    2 x (정밀도 x 재현율) / (정밀도 + 재현율)

: 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것): 긍정이라고 해서 맞은 것 / (긍정이라고 해서 맞은 것 + 긍정이라고 해서 틀린 것)

참고자료

https://velog.io/@ljs7463/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80%EC%A0%95%EB%B0%80%EB%8F%84%EC%9E%AC%ED%98%84%EC%9C%A8f1-score%EB%93%B1

https://sumniya.tistory.com/26