일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 그래프
- 하둡
- r
- pandas
- R그래프
- CNN
- AI
- 머신러닝
- R프로그래밍
- ggplot
- word2vec
- 그래프시각화
- Deeplearning
- 빅데이터처리
- Python
- 데이터시각화
- 데이터
- 빅데이터
- R시각화
- NLP
- lstm
- 주가예측
- 딥러닝
- SQL
- 자연어처리
- 데이터분석
- Hadoop
- 기계학습
- 데이터처리
- HIVE
- Today
- Total
목록데이터전처리 (2)
욱이의 냉철한 공부
Series 1. pandas, numpy 라이브러리 추출하기. import pandas as pd import numpy as np 2. series 만들기, 속성 obj = pd.Series([4,7,-5,3]) obj.values : 시리즈의 값만을 array로 표현 obj.index : 인덱스 값만을 표현 obj.dtypes : int라는 것을 확인 -원하는 인덱스 대입할 수 있다. obj2 = pd.Series([4,7,-5,3],index=["d","b","a","c"]) - 딕션어리 형태로도 만들 수 있다. sdata = {"charles" : 35000, "kilho" : 71000, "hayoung" : 16000, "sangjae":5000} obj3 = pd.Series(sdata) ..
1. dplyr 패키지는 무엇인가? 1) plyr 패키지 데이터의 분할(split) – 적용(apply) -재조합(combine)하는 세 단계로 데이터를 처리하는 함수들을 제공하는 패키지이다. 대표함수 : adply(), ddply(), mdply() 2) dplyr 패키지 dataframe과 plyr이 합쳐진 이름으로 data.frame 전용 plyr 패키지이다. 대표함수 : filter(), select(), mutate(), summarise(), arrange() 3) dplyr 함수 구조 - 함수명() - filter(iris, Species=="virginica") - 첫 번째 인자는 dataframe - 두 번째 인자는 dataframe으로 무엇을 할 지를 표현(조건) - 반환값은 dataf..