일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Hadoop
- 기계학습
- r
- 데이터처리
- R그래프
- word2vec
- 머신러닝
- HIVE
- R시각화
- 하둡
- 데이터분석
- 그래프시각화
- 주가예측
- 빅데이터
- 딥러닝
- 그래프
- Python
- Deeplearning
- lstm
- 데이터시각화
- pandas
- R프로그래밍
- 자연어처리
- ggplot
- CNN
- SQL
- 데이터
- NLP
- 빅데이터처리
- AI
- Today
- Total
욱이의 냉철한 공부
[통계기초] 통계분석 : 가설검정 : 모집단 둘 본문
* 자료출저 및 참고강의
패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의
명지대 산업경영공학과 이병기 교수님 품질관리 강의
* 목차
통계분석 : 가설검정
1. 가설검정 종류 (모집단 개수에 따라)
2. 가설검정 : 모집단 둘 일 경우 (평균차이, 대응표본)
3. 가설검정 : 모집단 둘 일 경우 (평균차이, 독립표본)
4. 가설검정 : 모집단 둘 일 경우 (비율차이)
5. 가설검정 : 모집단 둘 일 경우 (분산차이)
1. 가설검정 종류 (모집단 개수에 따라)
- 모집단 하나인 경우 : z검정 or t검정
- 모집단 둘 일 경우 (평균차이, 대응표본)(서로 1대1로 연결되어 있음) : t 검정
- 모집단 둘 일 경우 (평균차이, 독립표본) : z검정 or t검정
- 모집단 둘 일 경우 (분산차이) : F 확률분포 검증
- 모집단 둘 일 경우 (비율차이)
- 모집단이 셋 이상이 있는 경우 : ANOVA 검정
2. 모집단 둘 일 경우 (평균차이, 대응표본)(서로 1대1로 연결되어 있음) : t 검정
- 검정방법
1) 우측검정
H0 : 𝜇1 - 𝜇2 <= 0, 𝜇1 <= 𝜇2
H1 : 𝜇1 - 𝜇2 > 0, 𝜇1 > 𝜇2
2) 좌측검정
H0 : 𝜇1 - 𝜇2 >= 0, 𝜇1 >= 𝜇2
H1 : 𝜇1 - 𝜇2 < 0, 𝜇1 < 𝜇2
3) 양측검정
H0 : 𝜇1 - 𝜇2 = 0, 𝜇1 = 𝜇2
H1 : 𝜇1 - 𝜇2 != 0, 𝜇1 != 𝜇2
- 대응표본
- 대응표본 예시
최근 A 제약회사에서는 체중감량 효과가 있는 건강식품을 개발하는데 성공했다.
이 건강식품이 정말 체중감량 효과가 있는지 신청자 100인을 표본으로 하여
'복용 전/복용 후'의 체중 변화를 조사해 정말 체중감량 효과가 있는지 확인해 보았다.
|
복용 전 |
복용 후 |
1 |
75 |
73 |
2 |
74 |
74 |
3 |
75 |
76 |
4 |
75 |
71 |
5 |
83 |
76 |
6 |
77 |
68 |
7 |
82 |
75 |
8 |
62 |
61 |
9 |
77 |
68 |
... |
... |
... |
100 |
92 |
56 |
- 표본통계량과 표준오차
- 가설검정 : t분포
3. 모집단 둘 일 경우 (평균차이, 독립표본) : z검정 or t검정
- 독립표본
=> 표본 a와 b의 분포는 분산이 같은 경우와 분산이 다른 경우로 나누어 생각
- 독립표본 구분 (표본의 개수와 분산의 동일성 여부에 따라)
1) 표본의 개수가 충분하면 (대략 n > 30)
모분산을 아는지 여부와는 상관 없음. (모르면 표본분산으로 대체)
분산의 동일성 여부 고려 필요 없음
=> z 통계량 사용 : Z-test 실시
2) 표본의 개수가 충분하지 않고 (n < 30),
두 모집단의 모분산은 모르지만 서로 동일하다는 가정 세움 : "합동분산"
=> t 통계량 : t-test 실시
3) 표본의 개수가 충분하지 않고 (n < 30),
두 모집단의 모분산은 모르지만 서로 다르다는 가정 세움 : "이분산"
=> t 통계량 : t-test 실시
4. 모집단 둘 일 경우 (비율차이)
추후 삽입
5. 모집단 둘 일 경우 (분산차이) : F 확률분포 검증(분산비)
- 가설수립
H0 : 모분산 사이에는 차이가 없음
H1 : 모분산 사이에는 차이가 있음
- 가설검정 방법 : 검정통계량
F분포 함수 활용
'데이터과학 > 개념 : Statistics' 카테고리의 다른 글
[통계기초] 통계분석 : 가설검정 : 비모수검정 (0) | 2020.04.19 |
---|---|
[통계기초] 통계분석 : 가설검정 : 카이제곱(적합도, 독립성, 분산, 분산비) (0) | 2020.04.18 |
[통계기초] 통계분석 : 가설검정 : 모집단 하나 (0) | 2020.04.18 |
[통계기초] 통계분석 : 상관성 분석 (0) | 2020.04.18 |
[통계기초] 통계분석 : 통계적 추정 : 점추정, 구간추정 (0) | 2020.04.18 |