카테고리 없음
Micro 평균(Micro-average) vs Macro 평균(Macro-average)
Alex Han
2024. 11. 16. 19:27
반응형
1. Micro 평균
• 전체 데이터 기준으로 성과를 계산.
• 각 클래스의 TP(True Positive), FP(False Positive), FN(False Negative)를 모두 합산한 후 계산.
• 클래스의 비율에 영향을 받는다.
즉, 데이터가 많은 클래스가 더 큰 비중을 차지하게 된다.
특징:
• 모든 데이터에 대해 전반적으로 얼마나 잘 맞췄는지 평가.
• 클래스 간 비중이 크게 다른 경우, 데이터가 많은 클래스의 성과가 더 중요해진다.
2. Macro 평균
• 각 클래스별로 성과를 계산한 뒤, 평균을 냄.
• 모든 클래스를 동등하게 취급.
• 데이터가 적은 클래스도 동등한 비중으로 반영된다.
특징:
• 클래스가 적게 포함되거나 불균형해도 모든 클래스가 똑같이 중요하게 평가됨.
• 클래스별 성과를 골고루 확인할 수 있음.
3. 비교
구분 | 계산 기준 | 특징 |
Micro 평균 | 전체 데이터(TP, FP, FN 합산 기준) | 클래스 비율 불균형에 민감. 큰 클래스의 영향을 받음 |
Macro 평균 | 클래스별로 성과를 계산한 뒤 평균 | 클래스 비율 불균형에 강함. 적은 클래스도 동일 비중 |
4. 쉽게 비유
• Micro 평균: “대규모 파티에서 손님 전체의 평균 만족도를 계산하는 것.”
많은 손님이 좋아하면 결과가 좋게 나옴.
• Macro 평균: “각 테이블 손님들의 평균 만족도를 계산한 뒤 다시 평균을 내는 것.”
적은 손님이 있는 테이블도 동일한 중요도로 평가됨.
5. 언제 사용하면 좋을까?
Micro 평균:
• 전체적으로 모델이 얼마나 잘 작동하는지 평가하고 싶을 때.
• 데이터 불균형이 큰 문제로 느껴지지 않을 때.
Macro 평균:
• 데이터가 불균형할 때, 적은 데이터의 성과도 중요하게 평가하고 싶을 때.
• 각 클래스의 성과를 동등하게 보고 싶을 때.
반응형