이제 확률에 대해 본격적으로 정리한다.
용어 정리가 잘 되어있지 않으면 나중에 구간추정 등에서 헷갈리는 문제가 생긴다.
> 사상 (mapping)
실험과 같은 행위를 시행이라고 하는데, 이 시행에 의해 생긴 결과를 사상이라고 한다.
주사위 던지기 시행을 하면 '나온 눈'이 사상에 해당된다.
> 확률 (probability)
어떤 사상이 어느 정도로 일어나기 쉬운지를 수치화한 것이다.
모든 사상에 대한 확률의 합은 1이다. 1 = 100%
> 확률변수 (random variable)
시행했을 때 결과를 알 수 있는 변수를 확률 변수라고 한다.
확률 변수가 가질 수 있는 값이 1, 2, 3 이런식으로 값의 수가 유한한 것을 이산확률변수라고 한다.
만약 무한하게 연속적으로 가질 수 있는 값, 몸무게나 키 등이라면 연속확률변수라고 한다.
> 확률분포 (probability distribution)
확률변수가 취하는 값과 그 값이 실현하는 확률의 관계
즉, 확률분포를 봤을 때 확률변수의 어떤 값이 일어나기 쉬운지, 어려운지 알 수 있다.
만약 개수처럼 이산적이라면 이산형 확률분포를 사용하고 연속적인 값이면 연속형 확률분포를 사용한다.
* 이산 확률 분포 - 이산균등분포, 이항분포, 포아송분포 등
* 연속 확률 분포 - 연속균등분포, 정규분포, 표준정규분포, 카이제곱분포, F분포, t분포 등
> 모집단 (population)
연구하고자 하는 대상 전체
모집단의 평균 - 모평균(μ) / 모집단의 분산 - 모분산(σ^2)
모평균, 모분산을 합쳐 모수(parameter)라고 한다.
'Machine Learning > Statistics' 카테고리의 다른 글
통계학 도감 정리 - 확률분포 3. 이항분포 binomial distribution (0) | 2022.03.15 |
---|---|
통계학 도감 정리 - 확률분포 2. 균등분포 uniform distribution (0) | 2022.03.15 |
통계학 도감 정리 - 기술통계학 3. 상관계수 (0) | 2022.03.15 |
통계학 도감 정리 - 기술통계학 2. 데이터의 분산 (0) | 2022.03.15 |
통계학 도감 정리 - 기술 통계학 1. 평균 (0) | 2022.03.14 |