Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 빅데이터처리
- NLP
- R그래프
- AI
- 주가예측
- 데이터처리
- 머신러닝
- Python
- 딥러닝
- 기계학습
- Deeplearning
- 그래프
- 데이터분석
- R프로그래밍
- Hadoop
- 빅데이터
- pandas
- 데이터시각화
- word2vec
- lstm
- R시각화
- ggplot
- 자연어처리
- 그래프시각화
- SQL
- HIVE
- r
- 하둡
- CNN
- 데이터
Archives
- Today
- Total
욱이의 냉철한 공부
[통계기초] 통계분석 : 상관성 분석 본문
* 자료출저 및 참고강의
패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 정리.
* 목차
상관성 분석
1. 피어슨 상관계수
2. 스피어맨 상관계수
3. 켄달 상관계수
1. 상관성 분석 : 피어슨 상관계수 (Pearson's correlation coefficient)
- 피어슨 상관계수 개요
"일상적인 상관계수"이고 다음과 같은 수식으로 계산
피어슨 상관계수의 값은 -1과 1사이의 수치.
피어슨 상관계수는 선형관계의 방향과 강도를 표현
Cor(X,Y) > 0 : X와 Y사이에 양의 선형관계
Cor(X,Y) < 0 : X와 Y사이에 음의 선형관계
Cor(X,Y) = 0 : X와 Y사이에 선형관계가 없음
- 피어슨 표본 상관계수의 정규분포화
표본 상관계수 r이 정규분포를 따르지 않음.
=> 변환된 수치 필요 : "피셔의 z변환"
- 피어슨 상관계수의 신뢰구간
2. 상관성 분석 : 스피어맨 상관계수 (Spearman's correlation coefficient)
- 스피어맨 상관계수 개요
X와 Y변수의 순위(rank) 사이의 상관성을 표현
데이터에 순위만 정할 수 있다면 수치형 변수가 아니어도 적용 가능.
스피어맨 상관계수의 값도 -1과 1사이의 수치
스피어맨 상관계수는 단조로움(monotonicity)의 관계를 표현.
3. 상관성 분석 : 캔달 순위 상관계수 (Kendall's rank correlation coefficient)
- 캔달 순위 상관계수
=> (x,y) 형태로 이루어진 데이터가 있을때 i번째와 j번째 비교
부합 : (xi < xj and yi < yj) 또는 (xi > xj and yi > yj)
비부합 : (xi < xj and yi > yj) 또는 (xi > xj and yi < yj)
=> 켄달 순위 상관계수 rk는 다음과 같이 구함
'데이터과학 > 개념 : Statistics' 카테고리의 다른 글
[통계기초] 통계분석 : 가설검정 : 모집단 둘 (0) | 2020.04.18 |
---|---|
[통계기초] 통계분석 : 가설검정 : 모집단 하나 (0) | 2020.04.18 |
[통계기초] 통계분석 : 통계적 추정 : 점추정, 구간추정 (0) | 2020.04.18 |
[통계기초] 통계분석 : 통계적 추정 : 기술통계, 기본개념 (0) | 2020.04.18 |
[통계기초] 확률변수와 확률분포함수 : 결합확률 (0) | 2020.04.18 |