목록데이터과학 (49)
욱이의 냉철한 공부
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 이병기 교수님 품질관리 강의 * 목차 통계분석 : 통계적 추정(점추정, 구간추정) 1. 통계적 추정의 원리 2. 추정량의 조건 3. 구간추정 4. 구간추정 : 모표준편차를 아는 경우 5. 구간추정 : 핵심적으로 이해할 부분 6. 구간추정 : 모표준편차를 모르는 경우 1. 통계적 추정의 원리 - 통계적 추정 용어 정의 1) 점추정(point estimation) 점추정은 모수를 특정한 수치로 표현하는 것 2) 구간추정(interval estimation) 구간추정은 모수를 최솟값과 최댓값의 범위로 추정하는 것 3) 추정치(estimate) 모수를 추정하기 위해 선택된 표본을..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 이병기 교수님 품질관리 강의 * 목차 통계분석 : 기본개념(기술통계, 통계적추론) 1. 모집단과 표본 2. 기술통계 3. 통계적추론 : 전수조사와 표본조사 4. 통계적추론 : 표본추출 방법 5. 통계적추론 : 표본분포 6. 통계적추론 : 중심극한정리 (CLT : Central Limit Theorem) 1. 모집단과 표본 - 모집단(population) 통계 분석 대상 전체 - 표본(sample) 모집단에서 추출한 일부 ex) 대한민국 20세 이상 남성의 체질량 지수 BMI 평균을 구하기 이를 위해서 500명의 표본을 뽑아 조사한다. 2. 기술통계 - 기술통계 통계..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 *목차 1. 이변량 결합확률분포 : 공분산, 상관계수 2. 독립성과 상관성 3. 공분산과 상관계수 4. 여러 확률변수의 합 : 이변량, 다변량 5. 현대포트폴리오 이론(MPT : Modern Portfolio Theory) 1. 이변량 결합확률분포 : 공분산, 상관계수 - 이변량 결합확률분포 두 개의 확률변수 X와 Y에 대한 확률 이변량 결합확률분포 : P(x, y) = P(X=x, Y=y) X = x AND Y = y일 확률 - 이변량 경합확률분포 : 공분산 (covariance) - 이변량 경합확률분포 : 상관계수 (correlation) 상관계수의 값은 -1과 1사이의 값. 상관계수는 선형관계의 방..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 박윤선 교수님 통계학개론 강의 *목차 1. 연속확률 2. 연속확률분포 : 연속균등분포(Uniform distribution) 3. 연속확률분포 : 정규확률분포 4. 연속확률분포 : 표준정규확률분포 5. 연속확률분포 : 지수 확률분포(Exponential) 6. 연속확률분포 : 카이제곱분포(Chi Square) 7. 연속확률분포 : 스튜던트 t 확률분포 (Student t) 8. 연속확률분포 : F 확률분포 1. 연속확률 - 연속확률변수 (continuous random variable) 셀 수 없는(무한대) 가지수의 값을 가지는 확률변수 어떤 실선 구간에 있는 점들에 대응하는..
* 논문 Predict Stock Price with Financial News Based on Recurrent Convolutional Neural Network, 2017 1. 입력 데이터 - 입력 데이터 대상 대만증시(1개) : Taiwan Stock Exchange(TWSE) 기업(4개) : TSMC, Hon Hai Precision Industry(Foxconn Technology Group), China Steel Corporation(CSC), Graffe King Bio => 각각 독립적인 모델링 설계 - 입력 데이터 종류 : 일 단위 일 단위의 거래데이터(종가)와 텍스트데이터(뉴스제목) 사용 - 입력 데이터 기간 1. 종가데이터 : 2007-06-21 ~ 2017-02-13, 2,397..
* 출저 본 개념정리는 제 담당교수님이신 연세대학교 정보대학원 김하영 교수님 수업과 Andrew 교수님의 Coursera 수업을 통해 얻은 정보를 통해 정리했습니다. 자료는 Andrew 교수님의 Coursera 수업자료입니다. * 목차 1. 인공지능, 기계학습(머신러닝), 딥러닝 2. 기계학습(머신러닝)의 종류 3. 기계학습(머신러닝)의 개요 4. 딥러닝의 개요 3. 딥러닝의 hidden layer의 효과 1. 인공지능, 머신러닝, 딥러닝 - 인공지능 (Artificial Intelligence) 1) 사람처럼 의사결정할 수 있는 지능이 있는 것 2) 기계에 지능이 있는 것처럼 만들어 주는 것 - 기계학습 (Machine Learning) 1) 일종의 소프트웨어 개발자 및 전문가가 일일이 정하지 않고..
* Word Representation 관점 (Word Embedding) 1. Discrete Representation : Local Representation 1) One - hot Vector - One - hot Vector 2) Count Based - Bag of Words (BoW) - Document-Term Matrix (DTM) - (TDM) - Term Frequency-Inverse Document Frequency (TF - IDF) - N-gram Language Model (N-gram) 2. Continuous Representation 1) Prediction Based (Distributed Representation) - Neural Network Language ..
* Word Representation 분류체계 1. Discrete Representation : Local Representation 1) One - hot Vector - One - hot Vector 2) Count Based - Bag of Words (BoW) - Document-Term Matrix (DTM) - (TDM) - Term Frequency-Inverse Document Frequency (TF - IDF) - N-gram Language Model (N-gram) 2. Continuous Representation 1) Prediction Based (Distributed Representation) - Neural Network Language Model (NNLM) or..