일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- R시각화
- NLP
- 데이터시각화
- word2vec
- ggplot
- 하둡
- r
- HIVE
- SQL
- 머신러닝
- Hadoop
- lstm
- 데이터분석
- 데이터처리
- 빅데이터
- AI
- CNN
- R프로그래밍
- 데이터
- pandas
- 빅데이터처리
- 주가예측
- 기계학습
- 그래프시각화
- 딥러닝
- 자연어처리
- R그래프
- 그래프
- Deeplearning
- Python
- Today
- Total
욱이의 냉철한 공부
[통계기초] 통계분석 : 가설검정 : 비모수검정 본문
* 자료출저 및 참고강의
패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의
* 목차
통계분석 : 가설검정 : 비모수검정
1. 비모수 검정 (Non-parametric hypothesis test)
2. 비모수 검정 : 부호검정 (부호)
3. 비모수 검정 : Mann-Whitney U 검정 (순위)
4. 비모수 검정 : Wilcoxon 검정 (부호+순위)
5. 비모수 검정 : Shapiro-Wilk 검정 (정상성)
1. 비모수 검정 (Non-parametric hypothesis test)
- 비모수인 경우
모집단의 확률분포에 대한 전제가 없음.
표본으로 계산한 통계량이 모집단의 모수와 통계적 관계가 없음
ex) 표본 크기 매우 작음
2. 부호 검정 (Sign test)
1) 모집단 하나인 경우
- 개요
부호 검정은 '+'라는 사건이, '-'라는 사건보다 더 많은지 검정
ex) 어느 회사의 월간 수익률이 '+'인 경우가 '-'인 경우보다 많은지 검정
부호는 '+' 또는 '-' 둘 중에 하나이기 때문에 이분법적
즉 '+' 혹은 '-'의 확률(p)이 0.5이며
이것은 베르누이의 연속인 이항확률분포라고 할 수 있음. ~Binom(n,p)
그렇기 때문에 이항분포를 사용하여 가설검정 실시
- 가설 설립
H0(귀무가설) : p <= 0.5
H1(대립가설) : P > 0.5
- 예시 문제
p(Q=6) : 0.5 x 0.5 x 0.5 x 0.5 x 0.5
p(Q=5) : 0.5 x 0.5 x 0.5 x 0.5 x 0.5 x 6
유의수준 5% : 0.05(5%)
0.0156 < 유의수준 5% < 0.109375
2) 모집단 둘인 경우
- 개요
짝 지어진 두 개의 관측치 사이에 양의 편향성이 있는 검정
ex) 동일한 환자 대상으로 약 투여 전과 후 사이의 차이에 대한 검정
동일한 환자 대상으로 치료약 X와 Y사이의 차이에 대한 검정
- 가설 설립
두 개의 확률 변수 X, Y 가정하고, p = P(X>Y)라고 정의하고, 가설검정
- 예시 문제
3. Mann Whitney U 검정
- 개요
두 집단(X, Y)간의 서열(순위)척도 차이 여부 검정
- 전제
자료의 수치가 서열(순위)척도
=> 이럴 경우 평균, 분산 등을 직접 계산 못함
표본의 크기가 30미만이어서 정규성을 충족시키지 못하는 경우
- 가설 설립
H0(귀무가설) : A의 순위 평균은 B의 것과 같음.
H1(대립가설) : A의 순위 평균은 B의 것과 다름.
- 예시
남학생 시험점수 : 90, 80
여학생 시험점수 : 95, 75, 67
통합된 시험점수 : 95, 90, 80, 75, 67
순위 : 1, 2, 3, 4, 5
남학생의 순위 : 2, 3
여학생의 순위 : 1, 4, 5
차이 있는지 검정 => Mann Whitney U 검정
3. Wilcoxon 검정
- 개요
부호화된 순위 검정(signed rank test)라고도 함.
순위, 부호(+,-)를 동시에 고려
- 가설 설립
짝이 지어진 두 집단(X, Y) 간의 차이 여부 검정
H0(귀무가설) : A와 B사이에는 차이가 없음
H1(대립가설) : A와 B사이에는 차이가 있음
- 예시
4. Shapiro-Wilk 검정
- 개요
표본의 '정상성(정규분포 따르는지 여부)' 검정
QQ plot보다 더 선호
- 가설 설립
H0(귀무가설) : 표본은 정규분포를 따르는 모집단에서 추출
H1(대립가설) : 표본은 정규분포를 따르지 않는 모집단에서 추출
'데이터과학 > 개념 : Statistics' 카테고리의 다른 글
[통계모델링] 선형회귀분석 : 모형 진단, 모평 평가, 모형 선택 (0) | 2020.04.19 |
---|---|
[통계기초] 통계분석 : 가설검정 : 비모수검정 (0) | 2020.04.19 |
[통계기초] 통계분석 : 가설검정 : 카이제곱(적합도, 독립성, 분산, 분산비) (0) | 2020.04.18 |
[통계기초] 통계분석 : 가설검정 : 모집단 둘 (0) | 2020.04.18 |
[통계기초] 통계분석 : 가설검정 : 모집단 하나 (0) | 2020.04.18 |