욱이의 냉철한 공부

[통계기초] 통계분석 : 가설검정 : 모집단 하나 본문

데이터과학/개념 : Statistics

[통계기초] 통계분석 : 가설검정 : 모집단 하나

냉철한 욱 2020. 4. 18. 02:46

* 자료출저 및 참고강의

패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의

명지대 산업경영공학과 통계학개론 강의

 


* 목차

통계분석 : 가설검정

1. 가설검정 개념

2. 가설검정 : 모집단 하나일 경우 (평균차이)

3. 가설검정 : 모집단 하나일 경우 (비율차이)

4. 가설검정 : 모집단 하나일 경우 (분산차이)


1. 가설검정 개념

- 가설검정

1) 가설 (hypothesis)

주어진 사실 혹은 조사하고자 하는 사실이 어떠하다는 주장이나 추측

귀무가설 (null hypothesis) : H0

대립가설 (anti-hypothesis) : H1

2) 검정 (testing)

조사를 하기 위해 귀무가설과 대립가설을 세운 다음 어떤 가설이 맞는지를 판단해야 함

양측검정 (two-sided test) : 조사하고자 하는 대립가설, 즉 '사실이 아니다'라는 것을 검정하여 귀무가설을 기각하고 대립가설을 채택하고자 하는 것.

단측검정 (one-sided test) : 조사의 목적에 따라 대립가설을 한쪽만 살펴보는 것

3) 가설검정

모집단의 모수에 대해서 기존 통설을 가설로 하고, 표본을 추출하여 얻은 통계량으로 가설의 진위를 판단

한 차례 표본 추출 만으로 검정 (testing)

ex)

대한민국 성인 남성의 독서량은 1년에 10권

대한민국 직장인의 1년 노동시간은 2900시간이다.

- 가설검정의 의미

가설검증은 재판과 비유될 수 있다.

1) 재판

증거를 제시하기 전까지는 피고의 무죄를 전제

피고의 무죄는 증명할 필요 없음.

증명의 대상은 피고의 "유죄" 여부

판사는 "증거"에 의거해 판결을 내림.

2) 가설검정

귀무가설 (null hypothesis) : H0

모집단의 모수에 대한 통설 또는 주장 -> 피고의 무죄

대립가설 (anti-hypothesis) : H1

대립적인 주장 -> 피고의 "유죄"

- 가설검정의 요소

1) 귀무가설 (null hypothesis) : H0

2) 대립가설 (anti-hypothesis) : H1

3) 검정통계량

모수를 추정하기 위하여 표본에서 계산한 값 -> "증거"

4) p값 (유의확률)

귀무가설이 맞는다는 전제하에 계측된 검정통계량이 발생했을 확률 -> "증거"

p값이 크면 귀무가설이 맞다는 전제가 강해짐.

5) α (유의수준)

귀무가설이 사실이더라도 기각될 수 있는 최대 확률

p값에 대한 "임계치"의 역할을 함 : 판결 수준

보통 5% (0.05)를 사용

6) 1- α

사실인 귀무가설이 채택될 확률

7) 검정력(power of hypothesis testing)

허위인 귀무가설이 기각되고 대립가설이 채택될 확률

- 가설검정 순서

1) 가설수립

2) 유의수준 결정

3) 기각역 설정

4) 통계량 계산

5) 의사결정

- 가설검정 방법에 따른 순서 : 검정통계량

1) 귀무가설과 대립가설 설정

2) 검정통계량의 확률분포 결정, 검정통계량 계산

3) 유의수준 α에 해당하는 채택역과 기각역 확인

     α는 보통 0.05(5%) 또는 0.01(1%)

4) 검정통계량이 채택역이면 -> 귀무가설 유지 및 채택

     검정통계량이 채택역이 아니면 -> 귀무가설 기각 후, 대립가설 채택

- 가설검정 방법에 따른 순서 : p값

1) 귀무가설과 대립가설 설정

2) 검정통계량의 확률분포 결정, 검정통계량 계산

3) 유의수준 α(임계치) 설정

α는 보통 0.05(5%) 또는 0.01(1%)

4) p값 계산

(p값 > α) -> 귀무가설 유지 및 채택

(p값 < α) -> 귀무가설 기각 후, 대립가설 채택

- 가설검정 오류의 유형

오류 : 모수를 추정한 결과가 실제와는 다른 결론에 도달하는 것

2. 가설검정 : 모집단이 하나일 경우 (평균 차이)

- 가설검정 종류

1) 가설검정 종류

양측검정 (two-sided test)

우측검정 (Right-sided test)

좌측검정 (Left-sided test)

2) 모분산 사실여부에 따른 가설검정

모분산을 아는경우 : z통계량

모분산을 모르는 경우 : t통계량

z검정과 t검정의 관계

- 가설검정 : 우측검정 (Right-sided test)

0) 가설수립

H0 : 𝜇 <= 𝜇0

H1 : 𝜇 > 𝜇0

1) 가설검정 방법 : 검정통계량

2) 가설검정 방법 : p값

검정통계량 이용하여 p값을 구한 후 α와 비교해서

p값 > α 이면 H0 유지

p값 <= α 이면 H0 기각, H1 채택

(p값 = P(Z<통계량))

 

- 가설검정 : 좌측검정 (Left-sided test)

H0 : 𝜇 >= 𝜇0

H1 : 𝜇 < 𝜇0

1) 가설검정 방법 : 검정통계량

2) 가설검정 방법 : p값

p값 <= α 이면 H0 기각, H1 채택

(p값 = P(Z<통계량))

검정통계량 이용하여 p값을 구한 후 α와 비교해서

p값 > α 이면 H0 유지

- 가설검정 : 양측검정 (Two-sided test)

0) 가설수립

H0 : 𝜇 = 𝜇0

H1 : 𝜇 != 𝜇0

1) 가설검정 방법 : 검정통계량

2) 가설검정 방법 : p값

검정통계량의 절대값 이용하여 p값을 구한 후 α와 비교해서

p값 > α 이면 H0 유지

p값 <= α 이면 H0 기각, H1 채택

(p값 = 2* P(Z>|통계량|))

3. 가설검정 : 모집단이 하나일 경우 (비율 차이)

0) 가설수립

표본에수 구한 비율을 p, 모집단에서의 비율을 p0라 하면,

H0 : p = p0

H1 : P != P0 (양측검정)

H1 : p < p0 혹은 p > p0 (단측검정)

1) 가설검정 방법 : 검정통계량

4. 가설검정 : 모집단이 하나일 경우 (분산 차이)

0) 가설수립

평균에 대해 어느 정도의 산포가 나타나는지를 살펴보는 가설검증이다.

H0 : σ2 = σ02

H1 : σ2 != σ02 (양측검정)

H1 : σ2 < σ02 혹은 σ2 > σ02 (단측검정)

1) 가설검정 방법 : 검정통계량