-
[베이지안 통계] 1. 베이지안이 정의하는 통계란?Data miner/Bayesian Statistic 2018. 9. 11. 14:06728x90
- 확률(Probability)는 표본공간(sample space)에서 각 경우의 수에 0과 1사이의 값들의 값을 부여하는 것을 의미한다.
- 확률에 대한 정의는 너무 간단해 그 자체로 증명이 불가능하기 때문에 정의가 불완전하며, 이를 바라보는 다양한 관점이 있다.
- 베이지안(Baysian)이 바라보는 확률의 개념은 흔히 사건에 대한 빈도수 기준으로 통계를 바라보는 빈도론자(Frequentist)와 비교가 된다. 고등학교 때 배웠던 통계에 대한 관점이 빈도론자의 입장이라고 보면 된다. 경우에 따라서는 사람들은 자료의 형태에 따라서 융통성있게 통계를 바라보는 관점을 다양하게 바꾸기도 하는데 이런 사람들은 통계학적인 관점에서의 기회주의자(Opportunist)로 보면 된다.
- 베이지안과 빈도론자가 바라보는 확률에 대한 큰 차이는 함수의 특정한 성질을 나타내는 매개변수, 파라미터(parameter)를 바라보는 시각이 다르다는 데에서 출발한다. 먼저 빈도론자의 경우 파라미터가 고정된 상수값을 가진다고 보며, 베이지안은 파라미터 자체도 확률변수(random variable)의 성질을 가지고 있다고 본다. 확률변수라는 것은 분포를 가지고 있다는 것을 뜻한다. 베이지안은 확률분포가 이산균등분포, 푸아송분포, 베르누이 분포, 기하 분포 등 다양한 분포를 가지고 있듯이 어떤 특정 값을 도출하는데 있어서 값을 상상하는 사람들의 다양한 시각을 반영하고자 한다.
- 이렇게 확률을 바라본다는 자체가 신선하게 느껴졌다. 어떤 이상적인 모수값이 정해져 있다고 생각하지 않고 분포를 가진 확률변수로 인식한다는 점이 이전에 내가 알고 있었던 얕은 통계학적인 지식을 전복한다는 느낌이 들었다.
- 다만 베이즈 통계'학'에서는 사람들이 특정값을 바라보는데 있어서 다양하게 생각한다는 점을 반영하나, 자료를 이용하는 과정에 대해서는 일관성을 유지하고자 한다.
- 정리하자면, 확률을 주관적으로 바라보는 원리에서는 크게 2가지가 있다.1. 모든 사건에 대한 확률은 개개인이 사건을 바라보는 믿음에 따라 달려 있다. 어떤 특정한 고정된 이상값이 아니다.2. 파라미터값을 사전 정보 값을 알 수 없을 경우에는 그 값은 랜덤하다고 본다.파라미터값에 대한 어떤 정보값을 활용할 수 있을 경우에는, Prior distribution을 파라미터값에 반영한다.출처; 연세대학교 김철응 교수님 <베이지안 통계> 강의 내용'Data miner > Bayesian Statistic' 카테고리의 다른 글
[베이지안 통계] 5-1. 마르코프 연쇄 몬테카를로(MCMC) (2) 2020.09.17 [베이지안 통계] 4. 베타분포와 베이지안 추론 (1) 2020.09.04 [베이지안 통계] 3. 베르누이 분포와 베이지안 추론 (0) 2020.09.03 [베이지안 통계] 2. 베이즈 규칙을 파라미터와 데이터에 적용하기 (0) 2020.09.03