ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ML 일반화, 과대적합, 과소적합
    ML&DL&AI 2023. 8. 8. 13:30
    728x90

    - Machine Learning 모델 개략도

     

     

    1. 일반화, 과대 적합, 과소 적합

    • 모델의 신뢰도를 측정하고 성능을 확인하기 위한 개념
    • ex) 공에 대해서 설명하기

     

     

    - 일반화(Generalization)

    • 일반화 성능이 최대화되는 모델이 찾는 것이 목표이다.
    • 훈련 세트로 학습한 모델이 테스트 데이터가 주어져도 정확히 예측할 거라 기대 훈련 세트에서 테스트 세트로 일반화가 되었다고 함

     

     

    - 과대적합(Overfitting)

    • 너무 상세하고 복잡한 모델링을 하여 훈련데이터에만 과도하게 정확히 동작하는 모델
    • 훈련 세트에 너무 맞추어져 있어 테스트의 성능 저하
    • ex) 공에 대한 설명 - 그중에서 축구공만 설명
      • 둥글게 생겼다.
      • 오각형에 여러개 붙어있다.
      • 검은새고가 흰색으로 구성된다.
      • 반짝반짝 광이 난다.

     

     

    - 과소적합(Underfitting)

    • 모델링을 너무 간단하게 하여 성능이 제대로 나오지 않는 모델
    • 훈련 세트를 충분히 반영하지 못해 훈련 세트, 테스트 세트에서 모두 성능이 저하
    • ex) 공에 대한 설명
      • 둥글게 생겼다

     

     

     

    2. 모델의 복잡도

     

    - 모델의 복잡도 해결

    • 일반적으로 데이터 양이 많으면 일반화에 도움이 됨
    • 주어진 훈련데이터의 다양성 보장되어야 함
    • 다양한 데이터포인트를 골고루 나타내기
    • 편중된 데이터를 많이 모으는 것은 도움이 되지 않음
    • 규제(Regularization)를 통해 모델의 복잡도를 적정선으로 설정
    728x90
Designed by Tistory.