ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [베이지안 통계] 5-1. 마르코프 연쇄 몬테카를로(MCMC)
    Data miner/Bayesian Statistic 2020. 9. 17. 22:31
    728x90

    파라미터 θ의 값이 하나가 아니라면? 파라미터 θ의 값에 대한 사전 확신을 사후 확신과 동일하게 켤레분포로 표현할 수 없을 경우에는? 이런 경우, 마르코프 연쇄 몬테칼를로 알고리즘(MCMC, Markov Chain Monte Carl Algorithm)으로 문제를 접근한다. 이 알고리즘은 크게 두 가지 가정에 기반한다. 1) 사전 분포를 구할 수 있다. 파라미터 값θ에 대한 p(θ)을 컴퓨터 계산으로 구할 수 있다. 2) 가능도 함수값 p(D|θ)도 구할 수 있다고 본다. 다만, 추정해야 하는 파라미터가 많아질 경우 베이즈 규칙의 분모 부분, 증거(evidence)-p(D)-를 구하기가 어렵다. 이에, 사전분포와 가능도함수의 곱을 통해 얻어진 값이 베이즈 규칙의 사후 분포와 비례한다는 점을 이용하여, 정규화 상수(Normalization factor)로 나눠지지 않은 이 사후분포로부터 적절하게 데이터를 샘플링하여, 사후분포를 추론한다. 

    이 맥락에서 사후분포는 모집단의 분포라고 볼 수 있다. 모집단의 특성을 대표할 수 있는 표본을 적절하게 추출해야 한다. 모집단의 특성을 잘 반영할 수 있는 데이터를 추출하는 방법, 샘플링 기법(sampling) 중에 하나가 MCMC다. 이름의 "몬테 카를로(Monte Carlo)"부분은 샘플링 목적에서 나온 표현이며, 이는 수적인 결과를 얻기 위해 반복적인 무작위 샘플링에 의존한다는 뜻이다.  "마코프 체인(Markov Chain)" 부분은 우리가 이러한 샘플을 얻는 방법에서 유래하며, 새로운 샘플을 뽑을 때 이전 상태에 의존한다는 뜻이다. 

    MCMC의 가장 단순한 예시가 메트로폴리스 알고리즘이다. (메트로폴리스 알고리즘으로 MCMC를 가까스로 이해했다. 문제 설정이 재미있는 알고리즘이다.) 어떤 유력한 정치인이 선거 캠패인 유세를 하게 된다고 가정하자. 나는 이 유력 캠페인에 소속되어 있는 보좌관이다. 정치인이 방문하고자 하는 지역은 섬으로 이뤄져 있으며, 일직선으로 섬들이 동일한 간격으로 나열되어 있다. 나는 보좌관으로서 정치인이 섬에 거주하는 인구 수만큼 전체 인구 수에 상대적으로 비례하여 머물도록 해야 한다. 나는 보좌관으로서, 일직선 섬들에 대한 인구 분포를 알게 되면 선거 유세하는 데 있어서 최적의 상황이다. 하지만, 제한된 경제적인 자원과 시간으로 인해서 우리 선거 캠프는 현재 시점에 주변 이웃 섬(왼쪽 혹은 오른쪽 섬)의 인구 수만 조사할 수 있다. 여기에서, 중요한 건 우리가 알고 싶어하는 궁극적인 목표 분포, 'P(θ)= 각 섬에 거주하는 인구의 분포'는 알 수 없다. 하지만, 현재의 섬에서 주변 이웃섬의 인구를 조사하여, 이웃섬에 있거나 현재 섬에 머물지에 대한 확률 분포를 통해서, 전체 인구의 수에 근접하는 분포를 구할 수 있다. 아래의 그림의 반복적인 과정을 통해, 우리는 정치인이 특정 섬에 머무를 확률분포를 얻게 되며, 이는 궁극적으로 목표분포인 각 섬의 인구 분포와 비례한다. 

    *제안확률: 가능한 제안 이동 범위으로 이동할 확률
     베이즈규칙과 메트로폴리스 알고리즘

     

    위의 알고리즘이 작동하는 이유는 다음의 수식으로 설명할 수 있다. 인접한 위치를 이동할 확률의 상대적인 값이 최종적으로는 사상대적인 목표분포값(현재섬의 인구 수와 이웃섬의 인구수의 상대적인 비율값)과 정확히 일치한다.  

    또한, 위의 알고리즘이 작동하는 방식은 데이터의 무작위성(randomness)에 기반한다. 현재 섬에서 오른쪽 섬으로 이동할 지 왼쪽 섬으로 이동할 지도 0.5의 확률의 무작위성의 기반하고, 만약 후보 섬의 인구가 현재 섬보다 적을 때 후보섬으로 이동할 지에 대한 결정도 무작위성에 기반한다. 초반에는 분포의 모양이 조사를 시작한 섬의 위치에 따라서 달라질 수 있지만, 충분히 이러한 시행을 반복했을 때에는 궁극적으로는 목표 분포의 모양과 비슷한 형태를 띈다. 

     

    출처 ; 
    John K. Kruschke, <<Doing Bayesian Data Analysis, 2nd Edition>>
    연세대학교 김철응 교수님 <베이지안 통계> 강의 내용


    추가 참고했으면 하는 내용 ; 
    https://towardsdatascience.com/bayesian-inference-problem-mcmc-and-variational-inference-25a8aa9bce29
     

    Bayesian inference problem, MCMC and variational inference

    Overview of the Bayesian inference problem in statistics.

    towardsdatascience.com

    https://web.stanford.edu/class/archive/cs/cs109/cs109.1192/reader/11%20Parameter%20Estimation.pdf

     

     

     

     

     

Designed by Tistory.