-
ML 일반화, 과대적합, 과소적합ML&DL&AI 2023. 8. 8. 13:30728x90
- Machine Learning 모델 개략도
1. 일반화, 과대 적합, 과소 적합
- 모델의 신뢰도를 측정하고 성능을 확인하기 위한 개념
- ex) 공에 대해서 설명하기
- 일반화(Generalization)
- 일반화 성능이 최대화되는 모델이 찾는 것이 목표이다.
- 훈련 세트로 학습한 모델이 테스트 데이터가 주어져도 정확히 예측할 거라 기대 훈련 세트에서 테스트 세트로 일반화가 되었다고 함
- 과대적합(Overfitting)
- 너무 상세하고 복잡한 모델링을 하여 훈련데이터에만 과도하게 정확히 동작하는 모델
- 훈련 세트에 너무 맞추어져 있어 테스트의 성능 저하
- ex) 공에 대한 설명 - 그중에서 축구공만 설명
- 둥글게 생겼다.
- 오각형에 여러개 붙어있다.
- 검은새고가 흰색으로 구성된다.
- 반짝반짝 광이 난다.
- 과소적합(Underfitting)
- 모델링을 너무 간단하게 하여 성능이 제대로 나오지 않는 모델
- 훈련 세트를 충분히 반영하지 못해 훈련 세트, 테스트 세트에서 모두 성능이 저하
- ex) 공에 대한 설명
- 둥글게 생겼다
2. 모델의 복잡도
- 모델의 복잡도 해결
- 일반적으로 데이터 양이 많으면 일반화에 도움이 됨
- 주어진 훈련데이터의 다양성 보장되어야 함
- 다양한 데이터포인트를 골고루 나타내기
- 편중된 데이터를 많이 모으는 것은 도움이 되지 않음
- 규제(Regularization)를 통해 모델의 복잡도를 적정선으로 설정
728x90