카테고리 없음

Micro 평균(Micro-average) vs Macro 평균(Macro-average)

Alex Han 2024. 11. 16. 19:27
반응형

1. Micro 평균

전체 데이터 기준으로 성과를 계산.

각 클래스의 TP(True Positive), FP(False Positive), FN(False Negative)를 모두 합산한 후 계산.

클래스의 비율에 영향을 받는다.

 

즉, 데이터가 많은 클래스가 더 큰 비중을 차지하게 된다.

 

특징:

모든 데이터에 대해 전반적으로 얼마나 잘 맞췄는지 평가.

클래스 간 비중이 크게 다른 경우, 데이터가 많은 클래스의 성과가 더 중요해진다.

 

2. Macro 평균

각 클래스별로 성과를 계산한 뒤, 평균을 냄.

모든 클래스를 동등하게 취급.

데이터가 적은 클래스도 동등한 비중으로 반영된다.

 

특징:

클래스가 적게 포함되거나 불균형해도 모든 클래스가 똑같이 중요하게 평가됨.

클래스별 성과를 골고루 확인할 수 있음.

 


3. 비교

구분 계산 기준 특징
Micro 평균 전체 데이터(TP, FP, FN 합산 기준) 클래스 비율 불균형에 민감. 큰 클래스의 영향을 받음
Macro 평균 클래스별로 성과를 계산한 뒤 평균 클래스 비율 불균형에 강함. 적은 클래스도 동일 비중

 


4. 쉽게 비유

Micro 평균: “대규모 파티에서 손님 전체의 평균 만족도를 계산하는 것.”

많은 손님이 좋아하면 결과가 좋게 나옴.

 

Macro 평균: “각 테이블 손님들의 평균 만족도를 계산한 뒤 다시 평균을 내는 것.”

적은 손님이 있는 테이블도 동일한 중요도로 평가됨.

 


5. 언제 사용하면 좋을까?

 

Micro 평균:

전체적으로 모델이 얼마나 잘 작동하는지 평가하고 싶을 때.

데이터 불균형이 큰 문제로 느껴지지 않을 때.

 

Macro 평균:

데이터가 불균형할 때, 적은 데이터의 성과도 중요하게 평가하고 싶을 때.

각 클래스의 성과를 동등하게 보고 싶을 때.

반응형