목록데이터과학 (49)
욱이의 냉철한 공부
* 출저 본 개념정리는 제 담당교수님이신 연세대학교 정보대학원 김하영 교수님 수업과 Andrew Ng 교수님의 Coursera 수업을 통해 얻은 정보를 통해 정리했습니다. 자료는 Andrew Ng 교수님의 Coursera 수업자료입니다. * 목차 1. Logistic Regression as a Neural Network 2. Logistic Regression 가중치 초기화 3. Logistic Regression 경사하강법 1. Logistic Regression - Logistic Regression 개요 선형 회귀에서 금액과 채무불이행을 직선의 방정식으로 표현한다는 가설 하에, 주어진 데이터로부터 가중치 W(weight)와 편향 b(bias)를 찾아 데이터를 가장 잘 표현하는 직선을 찾았다. 그런..
* 참고자료 및 강의 - cs231n 우리말 해석 강의 https://www.youtube.com/watch?v=y1dBz6QPxBc&list=PL1Kb3QTCLIVtyOuMgyVgT-OeW0PYXl3j5&index=6 - Coursera, Andrew Ng교수님 인터넷 강의 * 목차 1. 모델 발전 개요 2. 모델1 : LeNet-5 3. 모델2: AlexNet 4. 모델3 : ZFNet 5. 모델4 : VGG 6. 모델5 : GoogLeNet 7. 모델6 : ResNet 8. 모델7 : DenseNet 1. 모델 발전 개요 - 모델 목표 더 깊은 네트워크를 만들면서, 성능을 높여간다. - 모델 목표를 위해 중요한 것. HOW? 어떻게 학습능력을 높여서 더 깊은 네트워크를 학습했는가? -..
* 논문 Deep Learning for Stock Prediction Using Numerical and Textual Information, 2016 * 목차 1. 입력데이터 2. 출력데이터 3. 모델링 4. Trading simulation 5. contribution 6. 한계점 0. 방향성 Many of previous works used only one of textual, numerical, or image information for stock price prediction, and their model was trained with consideration about a single company. Nevertheless, it is desirable for the prediction m..
* 자료출저 및 참고강의 명지대 산업경영공학과 데이터마이닝 김도현 교수님 강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 * 목차 분류모델링 성능평가 1. 분류모형의 성능평가 2. 성능평가 : 혼동행렬(confusion matrix) : 오분류율, 정확도(Accuracy) 3. 성능평가 : 혼동행렬(confusion matrix) : 민감도(Sensitivity), 특이도(Specificity), 정밀도(Precision) 4. 성능평가 : ROC 곡선 5. 성능평가 : 두 예측모형의 비교검정(McNemar) 6. 베이즈정리 해석 1. 분류모형의 성능평가 - 분류모형의 성능평가 일반적으로 분류 및 예측기법은 다양한 방법이 존재함 그런데 같은 방법에서도 선택사항에 ..
* 자료출저 및 참고강의 명지대 산업경영공학과 데이터마이닝 김도현 교수님 강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 * 목차 로지스틱회귀분석 1. 로지스틱회귀분석 개요 2. 로지스틱회귀분석 원리 3. 로지스틱회귀분석 학습 4, 로지스틱회귀분석 예측 5. 로지스틱회귀모형 해석 6. 로지스틱회귀모형과 선형회귀모형 차이 1. 로지스틱회귀분석 개요 - 로지스틱회귀분석은 어디에 속하는가? * 통계에측모형 1) 수치예측 : 평가방법 : MSE, MAE, RMSE 2) 분류예측 : 평가방법 : Accuracy(정확도), Precision(정밀도), Recall(재현율, 민감도) => 로지스틱회귀모형은 분류예측이다. - 로지스틱회귀분석을 하는 목적 기존 선형회귀분석은 연속형 종속..
* 자료출저 및 참고강의 명지대 산업경영공학과 데이터마이닝 김도현 교수님 강의 * 목차 데이터마이닝 모델링 개요 1. 통계와 데이터마이닝 차이 2. 데이터마이닝 모델링 3. 데이터마이닝 모델링 종류 4. 데이터마이닝 모델링 분류 5. 데이터마이닝 변수 종류 6. 데이터마이닝 모델링 과적합 7. 머신러닝에서의 성능평가 개요 1. 통계와 데이터마이닝 차이 - 전통적인 통계 1) 모집단이 있고, 이를 추론하기 위해서 샘플링을 수행 2) 현실에 적용하기 힘든 가정(Assumption) => 모집단의 정규분포, 선형성, 등분산성 등 3) 제안된 가설에 대한 검증이 목적 - 데이터마이닝 1) 모집단을 가지고 있고, 그 안에 숨겨진 패턴과 규칙을 찾는 것이 목적 2) 데이터에 대한 가정이 없음 3) 즉..
* 자료출저 및 참고강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 명지대 산업경영공학과 데이터마이닝 김도현 교수님 강의 * 목차 통계모델링 1. 편향오류(과소적합), 분산오류(과적합) 2. 회귀종류 : Ridge 회귀 (L2 정규화) 3. 회귀종류 : Lasso 회귀 (L1 정규화) 4. 회귀종류 : 다항식 회귀 5. 회규종류 : 푸아송 회귀 1. 편향오류(과소적합), 분산오류(과적합) 모형이 편향적 즉 과하게 단순해서 발생하는 오류 2) 분산오류(variance error) : 과적합 오류(overfitting error) 모형이 과하게 복잡하여 발생하는 오류. 매개변수 최적화의 어려움으로 표출 training sample 오류는 작지만, testing sam..
* 자료출저 및 참고강의 명지대 산업경영공학과 데이터마이닝 김도현 교수님 강의 패스트캠퍼스 올인원 패키지(금융공학/퀀트) 장순용 강사님 인터넷 강의 * 목차 통계모델링 1. 선형회귀분석 개요 2. 선형회귀식 원리 3. 선형회귀식 해(OLS (Ordinary Least Squares soluntion)) 1. 선형회귀분석 개요 - 회귀분석 정의 연구대상이 되는 시스템에 존재하는 변수들 사이의 함수적인 관계를 규명하기 위해 수학적인 모형을 상정하고, 이 모형을 수집된 자료로부터 추정하는통계적 기법. - 회귀분석 개요 선형회귀는 대표적인 수치예측기법 한 개 이상의 독립변수(설명변수)가 있음 한 개의 종속변수 선형 관계를 전제 이외에도 여러가지 전제조건 있음. :잔차(오차)에 대한 가설 검정 필요..