Distribution(2) - 연속확률분포(Gamma, Beta, Dirichlet)
이번 포스팅에서는 앞서 다룬 이산확률분포에 이어 연속확률분포에서 익숙하지 않은 분포 세 가지에 대해 다루겠습니다.
1. 감마분포(Gamma distribution)
여기서 감마 함수(Gamma function)에 대해 정의가 필요한데, 감마함수는 아래와 같이 씁니다.
그리고 이는 부분적분으로 다음과 같이 표현할 수 있고,
이는 α가 양의 정수일 경우에는 다음 과 같이 쓸 수 있습니다.
α는 shape parameter, β는 scale parameter라고 부르는데, 이 두 parameter가 감마분포에 어떤 영향을 주는지 보기 위해 두parameter의 변화에 따른 감마분포의 그래프를 살펴보겠습니다.
순서대로 보겠습니다. β에 따른 그래프의 형태를 보기 위해 α를 3으로 고정했습니다. β가 커질수록 그래프는 더 퍼지는 형태를 띠게 됩니다. 다음은 α에 따른 그래프의 형태를 보기 위해 β를 4로 고정했습니다. α가 커질수록 bell shape에 가까운 모양이 됩니다.
1.1 감마분포와 지수분포(Exponential distribution)
α=1일 때, λ=1/β인 지수분포를 따르게됩니다. 지수분포(Exponential distribution)는 하나의 사건이 발생할 때까지의 시간을 확률변수 X로 했을 때의 분포입니다. 이산확률분포의 기하분포가 1번의 success가 발생할 때까지의 시행횟수에 대한 분포이므로 이와 비슷한 컨셉으로 생각하시면 될 것 같네요. 즉, 감마분포는 지수분포를 일반화한 것이라고 생각할 수 있습니다.
1.2 감마분포와 카이제곱분포(Chi-square distribution)
α=r/2이고, β=2일 때, parameter가 r인 카이제곱 분포(Chi-squre distribution)를 따르게 됩니다. 카이제곱분포는 1) 모분산을 구할 때, 2) 적합도 검정(goodness of fit) 3) 독립성/동질성 검정 등 범주형 자료분석에서 쓰이는 분포입니다.
2. 베타분포(Beta distribution)
3. 디리클레분포(Dirichlet distribution)
Reference
[1] https://datascienceschool.net/view-notebook/e6c0d4ff9f4c403c8587c7d394bc930a/
[2] http://www.ktword.co.kr/abbr_view.php?m_temp1=4413
[3] http://issactoast.com/95
[4] http://freshrimpsushi.tistory.com/133
[5] https://datascienceschool.net/view-notebook/70a372b9c14a4e8d9d49737f0b5a3c97/
[6] https://medium.com/@kim_hjun/beta-%EB%B6%84%ED%8F%AC-728d7453dc33
[7] https://datascienceschool.net/view-notebook/e0508d3b7dd6427eba2d35e1f629d3de/