앎을 경계하기

Machine Learning/Statistics

통계학 도감 정리 - 확률분포 1. 확률과 확률분포

양갱맨 2022. 3. 15. 15:53

이제 확률에 대해 본격적으로 정리한다.

용어 정리가 잘 되어있지 않으면 나중에 구간추정 등에서 헷갈리는 문제가 생긴다.


> 사상 (mapping) 

실험과 같은 행위를 시행이라고 하는데, 이 시행에 의해 생긴 결과를 사상이라고 한다.

주사위 던지기 시행을 하면 '나온 눈'이 사상에 해당된다.


> 확률 (probability)

어떤 사상이 어느 정도로 일어나기 쉬운지를 수치화한 것이다.

모든 사상에 대한 확률의 합은 1이다. 1 = 100%


> 확률변수 (random variable)

시행했을 때 결과를 알 수 있는 변수를 확률 변수라고 한다.

확률 변수가 가질 수 있는 값이 1, 2, 3 이런식으로 값의 수가 유한한 것이산확률변수라고 한다.

만약 무한하게 연속적으로 가질 수 있는 값, 몸무게나 키 등이라면 연속확률변수라고 한다.


> 확률분포 (probability distribution)

확률변수가 취하는 값과 그 값이 실현하는 확률의 관계

즉, 확률분포를 봤을 때 확률변수의 어떤 값이 일어나기 쉬운지, 어려운지 알 수 있다.

만약 개수처럼 이산적이라면 이산형 확률분포를 사용하고 연속적인 값이면 연속형 확률분포를 사용한다.

 

* 이산 확률 분포 - 이산균등분포, 이항분포, 포아송분포 등

* 연속 확률 분포 - 연속균등분포, 정규분포, 표준정규분포, 카이제곱분포, F분포, t분포 등


> 모집단 (population)

연구하고자 하는 대상 전체

모집단의 평균 - 모평균(μ) / 모집단의 분산 - 모분산(σ^2)

모평균, 모분산을 합쳐 모수(parameter)라고 한다.