변이 : 데이터 값이 얼마나 퍼져있는지 알 수 있는 척도
변이 추정 하는 방법
- 편차 : 데이터가 중앙값을 주변으로 얼마나 퍼져 있는지에 대한 값
- 평균절대편차 : 편차의 대푯값을 추정하는 법
단순히 편차를 평균을 내면 편차의 합이 항상 0이 되기 때문에 사용할 수 없게 된다.
- 평균절대편차 : 편차의 대푯값을 추정하는 법
- 분산 : 제곱편차의 평균
- 표준편차 : 분산의 제곱근
- 표준편차는 원래 데이터와 스케일이 같아서 해석이 쉽다.
- 수식이 복잡해도 수학적으로 제곱한 값이 절댓값보다 통계 모델 다루기 편리하다는 이론을 근거로 평균절대편차보다 표준편차를 더 선호한다.
- 중위절대편차 : 분산, 표준편차, 평균절대편차는 특잇값, 극단값이 민감하다. 로버스트한 값을 얻기위해서 중위절대편차를 사용한다.
- 백분위수를 사용한 추정
- 사분위범위(IQR) : 25번째 백분위수와 75번째 백분위수 차이를 통해 변위측정한다.
'Machine Learning > Statistics' 카테고리의 다른 글
탐색적 데이터 분석 (EDA) - 데이터 종류와 대푯값 (1) | 2024.01.02 |
---|---|
통계학 도감 정리 - 확률분포 6. F 분포, t 분포 (0) | 2022.03.26 |
통계학 도감 정리 - 확률분포 5. 포아송 분포 poisson distribution, 카이제곱 분포 chi-squared distribution (0) | 2022.03.15 |
통계학 도감 정리 - 확률분포 4. 정규분포 normal distribution (0) | 2022.03.15 |
통계학 도감 정리 - 확률분포 3. 이항분포 binomial distribution (0) | 2022.03.15 |