728x90
SMOTE
-
AI/ML 기반 데이터 분석 시리즈 12화 - 클래스 불균형 문제 해결 전략: 실전 중심 접근기술과 산업/AI 2025. 6. 5. 18:27
데이터 분석을 조금만 해본 사람이라면 한 번쯤은 반드시 부딪히게 되는 문제,바로 클래스 불균형(Class Imbalance) 입니다. 아무리 정밀한 모델을 써도, 아무리 튜닝을 정성 들여 해도,**“전체 정확도는 높지만 정작 중요한 클래스를 잘 못 맞춘다”**는 경험,있으시죠? 이게 바로 클래스 불균형이 가져오는 현실적인 위협입니다. 이번 글에서는 이 문제를 실무에서 분석가들이 실제로 어떻게 풀어가야 하는지 정리해봅니다.SMOTE, 언더샘플링, 클래스 가중치, 임계값 조정 등 다양한 기법을 단순 정리 수준이 아니라 상황별 판단 기준과 함께 풀어보겠습니다. 1. 클래스 불균형이 왜 문제일까? 클래스 불균형이란 라벨의 분포가 한쪽으로 치우친 상황을 말합니다.예를 들어 고객 이탈 예측 문제에서 ‘잔존 고객’..