욱이의 냉철한 공부

[통계기초] 통계분석 : 가설검정 : 비모수검정 본문

데이터과학/개념 : Statistics

[통계기초] 통계분석 : 가설검정 : 비모수검정

냉철한 욱 2020. 4. 19. 16:01

* 자료출저 및 참고강의

패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의


* 목차

통계분석 : 가설검정 : 비모수검정

1. 비모수 검정 (Non-parametric hypothesis test)

2. 비모수 검정 : 부호검정 (부호)

3. 비모수 검정 : Mann-Whitney U 검정 (순위)

4. 비모수 검정 : Wilcoxon 검정 (부호+순위)

5. 비모수 검정 : Shapiro-Wilk 검정 (정상성)


1. 비모수 검정 (Non-parametric hypothesis test)

- 비모수인 경우

모집단의 확률분포에 대한 전제가 없음.

표본으로 계산한 통계량이 모집단의 모수와 통계적 관계가 없음

ex) 표본 크기 매우 작음

2. 부호 검정 (Sign test)

1) 모집단 하나인 경우

- 개요

부호 검정은 '+'라는 사건이, '-'라는 사건보다 더 많은지 검정

ex) 어느 회사의 월간 수익률이 '+'인 경우가 '-'인 경우보다 많은지 검정

부호는 '+' 또는 '-' 둘 중에 하나이기 때문에 이분법적

즉 '+' 혹은 '-'의 확률(p)이 0.5이며

이것은 베르누이의 연속인 이항확률분포라고 할 수 있음. ~Binom(n,p)

그렇기 때문에 이항분포를 사용하여 가설검정 실시

- 가설 설립

H0(귀무가설) : p <= 0.5

H1(대립가설) : P > 0.5

- 예시 문제

p(Q=6) : 0.5 x 0.5 x 0.5 x 0.5 x 0.5

p(Q=5) : 0.5 x 0.5 x 0.5 x 0.5 x 0.5 x 6

유의수준 5% : 0.05(5%)

0.0156 < 유의수준 5% < 0.109375

2) 모집단 둘인 경우

- 개요

짝 지어진 두 개의 관측치 사이에 양의 편향성이 있는 검정

ex) 동일한 환자 대상으로 약 투여 전과 후 사이의 차이에 대한 검정

동일한 환자 대상으로 치료약 X와 Y사이의 차이에 대한 검정

- 가설 설립

두 개의 확률 변수 X, Y 가정하고, p = P(X>Y)라고 정의하고, 가설검정

- 예시 문제

3. Mann Whitney U 검정

- 개요

두 집단(X, Y)간의 서열(순위)척도 차이 여부 검정

- 전제

자료의 수치가 서열(순위)척도

=> 이럴 경우 평균, 분산 등을 직접 계산 못함

표본의 크기가 30미만이어서 정규성을 충족시키지 못하는 경우

- 가설 설립

H0(귀무가설) : A의 순위 평균은 B의 것과 같음.

H1(대립가설) : A의 순위 평균은 B의 것과 다름.

- 예시

남학생 시험점수 : 90, 80

여학생 시험점수 : 95, 75, 67

통합된 시험점수 : 95, 90, 80, 75, 67

순위 : 1, 2, 3, 4, 5

남학생의 순위 : 2, 3

여학생의 순위 : 1, 4, 5

차이 있는지 검정 => Mann Whitney U 검정

3. Wilcoxon 검정

- 개요

부호화된 순위 검정(signed rank test)라고도 함.

순위, 부호(+,-)를 동시에 고려

- 가설 설립

짝이 지어진 두 집단(X, Y) 간의 차이 여부 검정

H0(귀무가설) : A와 B사이에는 차이가 없음

H1(대립가설) : A와 B사이에는 차이가 있음

- 예시

4. Shapiro-Wilk 검정

- 개요

표본의 '정상성(정규분포 따르는지 여부)' 검정

QQ plot보다 더 선호

- 가설 설립

H0(귀무가설) : 표본은 정규분포를 따르는 모집단에서 추출

H1(대립가설) : 표본은 정규분포를 따르지 않는 모집단에서 추출