목록데이터과학 (49)
욱이의 냉철한 공부
* 자료출저 및 참고논문 - 논문 GloVe : 2014, Global Vectors for Word Representation * Word Representation 분류체계 1. Discrete Representation : Local Representation 1) One - hot Vector - One - hot Vector 2) Count Based - Bag of Words (BoW) - Document-Term Matrix (DTM) - (TDM) - Term Frequency-Inverse Document Frequency (TF - IDF) - N-gram Language Model (N-gram) 2. Continuous Representation 1) Prediction Base..
* 자료출저 및 참고논문 - 강의 Coursera, Andrew Ng 교수님 인터넷 강의 - 논문 Word2Vec: 2013, Effcient Estimation of Word Representations in Vector Space * Word Representation 관점 : Word Embedding 만들기 1. Discrete Representation : Local Representation 1) One - hot Vector - One - hot Vector 2) Count Based - Bag of Words (BoW) - Document-Term Matrix (DTM) - (TDM) - Term Frequency-Inverse Document Frequency (TF - IDF) - N-..
* 자료출저 및 참고논문 - 강의 Coursera, Andrew Ng 교수님 인터넷 강의 - 논문 NPLM : A Neural Probabilistic Language Model * Word Representation 분류체계 1. Discrete Representation : Local Representation 1) One - hot Vector - One - hot Vector 2) Count Based - Bag of Words (BoW) - Document-Term Matrix (DTM) - (TDM) - Term Frequency-Inverse Document Frequency (TF - IDF) - N-gram Language Model (N-gram) 2. Continuous Repre..
* 자료출저 및 참고논문 - 강의 Coursera Andrew Ng 교수님 인터넷 강의 - 논문 Lingusitic Regularities in Continuous Space Word Representations 목차 Introduction to Word Embedding 1. Word Representation(Sparse Representation, Local Representation) -> Word Embedding(Dense Representation, Distributed Representation) 2. Using Word embeddings 3. Properties of Word embeddings 4. Embedding matrix 1. Word Representation(Sp..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 박윤선 교수님 통계학개론 강의 * 목차 1. 확률변수 2. 확률분포함수(probability distribution function) 3. 모집단과 모수 4. 이산확률 5. 이산확률 : 베르누이 확률분포(Bernoulli) 6. 이산확률 : 이항확률분포(Binomial) 7. 이산확률 : 푸아송확률분포 (Possion) 1. 확률변수(random variable) - 확률변수(random variable) 실험의 결과에 수치를 대응시키는 변수를 확률변수라 하고 영문 대문자 X, Y, Z..로 나타낸다. 즉 확률변수는 표본공간(S)의 모든 단순사건에 수치를 대응시키는 함수 표본공간..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 박윤선 교수님 통계학개론 강의 * 목차 확률 : 개본개념 1. 확률 기본용어 2. 수학적 확률 정의 3. 통계적 확률 정의 4. 확률의 기본 특성 5. 확률의 덧셈 : 여사건확률 6. 확률의 곱셈 : 조건부확률 1. 확률 기본용어 - 시행, 실험(experiment) 가능한 모든 결과를 알 수 있는 관찰 또는 실험. 같은 조건 아래에서 반복할 수 있음. 그 결과가 우연에 의해서 결정됨. - 표본공간(sample space) 모든 단순사건들의 모임 - 단순사건, 근원사건(simple event) 실험으로부터 나오는 한 결과 확률이 적용되는 기본단위 실험이 시행 될 경우 오직..
* 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 정리. 명지대 산업경영공학과 김도현 교수님 데이터마이닝 강의 정리. * 목차 선형회귀 1) 회귀분석 개요 2) 선형대수학적 접근 - 선형회귀 3) 선형대수학적 접근 - 최소자승법(Ordinary Least Squares, OLS) 4) 선형대수학적 접근 - 가역행렬 도출 통계의 "가설검증, 유의성검증" , 데이터마이닝의 "예측도출" 접근은 나중에.. 여기서는 "최소자승법 계산"에 집중. 1) 회귀분석 개요 - 회귀분석 연구대상이 되는 시스템에 존재하는 변수들 사이의 함수적인 관계를 규명하기 위해 수학적인 모형을 상정하고, 이 모형을 수집된 자료로부터 추정하는 통계적 기법. - '회귀'라는 말 유래 영국의 유전학자 ..
* 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 정리. 명지대 산업경영공학과 김도현 교수님 데이터마이닝 강의 정리. * 목차 : 주성분 분석 1) 주성분 분석 개요 2) 주성분 분석 예시 3) 선형대수학적 접근 - 고유값 분해와 주성분 4) 선형대수학적 접근 - 특이값 분해와 주성분 5) 선형대주학적 접근 - 고유값 분해와 특이값 분해의 관계 1) 주성분 분석 개요 - 주성분 축을 회전하여 새로운 변수(PC1, PC2)를 생성 선형 결합에 의해 새로운 변수(PC1, PC2)는 서로 비상관 관계 이 새로운 변수(PC1, PC2)를 주성분(Principal Component)로 불림 PC1과 PC2는 서로 직교. - 주성분 분석 원변수(x1, x2)가 설명하는 분산을 가장 잘..