> F분포
F값은 2개의 x의 제곱값의 비로 정의된다.
이 비의 분포를 F 분포라고 한다.
두 개의 X제곱값을 사용하기 때문에 자유도는 2개가 된다.
m1은 분자의 자유도, m2는 분모의 자유도이고 아래와 같이 표현한다.
> t분포
모분산을 알 수 없고, 표본의 크기가 작을 때 z분포(정규분포)를 사용하여 검정하면 결과가 틀릴 수 있다.
이런 경우, 스튜던트화 변량이 따르는 t분포를 사용한다.
t분포는 자유도에 따라 분포 형태가 달라진다.
t(자유도) 로 표현한다.
모분산을 모르는 것은 모표준편차도 알 수 없다는 것이다.
이럴 때 정규분포 대신 사용하는데 식은 다음과 같다.
S는 원래 모표준편차 값이 되어야하는데, 값을 모르기 때문에 t분포의 표본표준편차(s)를 사용한다.
표본 크기가 커질수록 정규분포와 일치하게 된다.
30 이상이면 거의 일치한다.
'Machine Learning > Statistics' 카테고리의 다른 글
탐색적 데이터 분석 (EDA) - 변이 추정 (1) | 2024.01.07 |
---|---|
탐색적 데이터 분석 (EDA) - 데이터 종류와 대푯값 (1) | 2024.01.02 |
통계학 도감 정리 - 확률분포 5. 포아송 분포 poisson distribution, 카이제곱 분포 chi-squared distribution (0) | 2022.03.15 |
통계학 도감 정리 - 확률분포 4. 정규분포 normal distribution (0) | 2022.03.15 |
통계학 도감 정리 - 확률분포 3. 이항분포 binomial distribution (0) | 2022.03.15 |