Micro 평균(Micro-average) vs Macro 평균(Macro-average)

카테고리 없음

Alex Han 2024. 11. 16. 19:27

1. Micro 평균

• 전체 데이터 기준으로 성과를 계산.

• 각 클래스의 TP(True Positive), FP(False Positive), FN(False Negative)를 모두 합산한 후 계산.

• 클래스의 비율에 영향을 받는다.

즉, 데이터가 많은 클래스가 더 큰 비중을 차지하게 된다.

• 모든 데이터에 대해 전반적으로 얼마나 잘 맞췄는지 평가.

• 클래스 간 비중이 크게 다른 경우, 데이터가 많은 클래스의 성과가 더 중요해진다.

• 각 클래스별로 성과를 계산한 뒤, 평균을 냄.

• 모든 클래스를 동등하게 취급.

• 데이터가 적은 클래스도 동등한 비중으로 반영된다.

• 클래스가 적게 포함되거나 불균형해도 모든 클래스가 똑같이 중요하게 평가됨.

• 클래스별 성과를 골고루 확인할 수 있음.

• Micro 평균: “대규모 파티에서 손님 전체의 평균 만족도를 계산하는 것.”

많은 손님이 좋아하면 결과가 좋게 나옴.

• Macro 평균: “각 테이블 손님들의 평균 만족도를 계산한 뒤 다시 평균을 내는 것.”

적은 손님이 있는 테이블도 동일한 중요도로 평가됨.

• 전체적으로 모델이 얼마나 잘 작동하는지 평가하고 싶을 때.

• 데이터 불균형이 큰 문제로 느껴지지 않을 때.

• 데이터가 불균형할 때, 적은 데이터의 성과도 중요하게 평가하고 싶을 때.

• 각 클래스의 성과를 동등하게 보고 싶을 때.