ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 확률 분포의 추정
    ML&DL&AI/통계 2024. 6. 13. 14:09
    728x90

    확률분포의 추정

    확률 분포의 추정은 우리가 가진 데이터로부터 확률 분포를 추정하는 기술을 의미를 합니다.

    이는 주어진 데이터가 특정 확률 분포를 따르는지 확인하고, 해당 분포의 파라미터를 추정하는 과정입니다.

    우리는 결과적으로 데이터의 확률 분포를 알고 싶으며, 우리가 가지고 있는 데이터는 이러한 확률 분포를 추정하기 위한 도구로 사용할 수 있다..

     

    데이터의 형태와 분포 추정

    기본적으로 데이터의 형태를 보고 원하는 분포를 추정할 수 있습니다.

    • 베르누이 분포: 데이터가 0 혹은 1의 형태를 가질 때.
    • 정규 분포: 데이터가 크기 제한이 없는 실수 형태를 가질 때.
    • 카테고리 분포: 데이터가 특정 카테고리 값을 가질 때.

     

    확률 분포 추정 방법

    주어진 데이터를 이용해 확률 분포를 계산하는 대표적인 두 가지 방법이 있습니다

    1. 모멘트 방법 (Method of Moments):
      • 모멘트 방법은 표본의 모멘트를 이용하여 확률 분포의 모수를 추정하는 방법입니다.
      • 예를 들어, 정규 분포의 경우 표본 평균과 표본 분산을 사용하여 정규 분포의 평균과 분산을 추정할 수 있습니다.
    2. 최대 가능도 추정 (Maximum Likelihood Estimation, MLE):
      • 최대 가능도 추정은 주어진 데이터가 관찰될 가능성을 최대화하는 분포의 모수를 추정하는 방법입니다.
      • 이 방법은 데이터가 특정 분포를 따를 때, 그 분포의 모수를 찾기 위해 사용됩니다.
      • 예를 들어, 정규 분포의 경우 데이터의 가능도 함수를 최대화하는 평균과 분산을 찾습니다.

     

    모멘트 = 적률

    모멘트는 확률 분포의 특징 값을 나타내는 수치로, 특정 확률 변수의 분포 형태를 설명하는 데 사용됩니다.

    특히, n차 모멘트는 다음과 같이 정의됩니다.

     

     

    모멘트의 역할

    • 1차 모멘트 (평균): 데이터의 중심 경향(평균)을 나타냅니다.
    • 2차 모멘트 (분산): 데이터의 변동성(분산)을 나타냅니다.
    • 3차 모멘트: 데이터의 비대칭성(왜도)을 나타냅니다.
    • 4차 모멘트: 데이터의 뾰족함(첨도)을 나타냅니다.

     

     

    728x90

    'ML&DL&AI > 통계' 카테고리의 다른 글

    편향과 오차  (0) 2024.06.13
    최대 가능도 추정  (0) 2024.06.13
    공분산과 상관계수  (1) 2024.06.13
    분산과 표준편차  (0) 2024.06.12
    평균과 기대값  (0) 2024.06.12
Designed by Tistory.