일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터
- 하둡
- SQL
- pandas
- 주가예측
- 그래프시각화
- 데이터분석
- CNN
- 빅데이터처리
- Deeplearning
- R시각화
- HIVE
- 그래프
- lstm
- Python
- 데이터시각화
- AI
- 기계학습
- Hadoop
- 빅데이터
- 딥러닝
- NLP
- 자연어처리
- ggplot
- R그래프
- 데이터처리
- word2vec
- r
- R프로그래밍
- 머신러닝
- Today
- Total
목록데이터분석 (28)
욱이의 냉철한 공부

R에서 XML 패키지를 사용하면 웹에서 쉽게 그래프를 크롤링 할 수 있어요~! 크롤링 함수를 알아볼께요~! 1. 패키지 설치 - XML 패키지를 설치한다. 2. 도표(Table) 가져오기 - 본인은 스포츠 통계 사이트에 들어가서 빨간색 박스의 '프리미어리그 최근 경기 결과 도표' 를 크롤링 하겠다. - 해당링크 : http://www.betstudy.com/soccer-stats/c/england/premier-league/2017-2018/ - 도표가 있는 크롤링 할 사이트의 링크를 입력한다. - XML 패키지의 readHTMLTable() 함수에 주소링크를 입력한다. - length() 함수를 통해 몇 개의 테이블을 R로 가져왔는지 확인한다. - 빨간색 박스를 통해 원하는 표를 크롤링 했다는 것을 확..

=> geom_point()와 geom_smooth()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/75?category=810499 [R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기1 - geom_point(), geom_smooth() * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생 warm-uk.tistory.com => geom_bar()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/76?category=810499 ..

=> geom_bar()와 geom_smooth()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/75?category=810499 [R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기1 - geom_point(), geom_smooth() * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생 warm-uk.tistory.com * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수..

* 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생산연도 cyl 실린더 개수 trans 변속기 종류 drv 구동 방식 cty 도시 연비 hwy 고속도로 연비 fl 연료 종류 class 자동차 종류 1. ggplot 패키지 설치 및 데이터 셋 확인 - ggplot2패키지는 ggplot패키지의 업데이트된 버젼이다. - ggplot2패키지 내에 있는 mpg 데이터셋 객체를 불러와 데이터 프레임으로 만든다. - ggplot2::mpg는 ggplot2에 들어있는 mpg 데이터를 지칭하는 코드 - ::를 이용하면 특정 패키지에 들..

1. dplyr 패키지는 무엇인가? 1) plyr 패키지 데이터의 분할(split) – 적용(apply) -재조합(combine)하는 세 단계로 데이터를 처리하는 함수들을 제공하는 패키지이다. 대표함수 : adply(), ddply(), mdply() 2) dplyr 패키지 dataframe과 plyr이 합쳐진 이름으로 data.frame 전용 plyr 패키지이다. 대표함수 : filter(), select(), mutate(), summarise(), arrange() 3) dplyr 함수 구조 - 함수명() - filter(iris, Species=="virginica") - 첫 번째 인자는 dataframe - 두 번째 인자는 dataframe으로 무엇을 할 지를 표현(조건) - 반환값은 dataf..

ORACLE과 연동하기 전에 이해하고 해야 할 것이 있다. 1. rJava : 이 패키지로 자바에 있는 리소스를 가져 올 수 있다. 즉 rjdbc를 사용할 수 있다. 이러한 패키지를 사용하기 위해서는 jdk가 필요하다. 그래서 보통 R을 설치하기 전에 자바를 설치한다. 2. rjdbc : R하고 자바가 설치되어 있어야 사용할 수 있다. 모든 데이터베이스하고 연동하게 해준다. 3. ojdbc6.jar : jar 파일은 자바패키지 파일 덩어리이다. DB연동을 위해 ojdbc6.jar에 있는 패키지를 사용할 것이다. ojdbc6.jar 파일을 C드라이브에 위치시킨다. 1. 오라클DB 연결 - JDBC함수를 사용하여 자바패키지를 사용한다. - 자바패키지를 사용할 수 있는 jdbcDriver 객체로 오라클 sco..

여러 패키지 함수들, 그래프 함수 인자들 다 기억할 수 없어요. 저는 사용 할 시기가 되면 서적에서 봤던 거, 배웠던 거 정리한 것을 찾아서 활용해요. 가장 중요한 것은 함수들과 인자들을 외우는 것이 아니라, 어떻게 활용하는지 이해하는 것이 중요해요 ~!! 사용하고 싶은 함수들을 빨리 찾아서 빨리 사용하기 위해서이죠! 그중에서 그래프 함수들을 사용할 경우 저는 중요하게 생각하는 부분이 어떤 데이터 타입이 들어가는지에요~! 벡터형태, 테이블형태, 메트릭스형태, 데이터프레임형태가 함수의 x축 y축에 어떻게 맞춰서 들어가는 것에 대한 이해가 그래프 함수 활용의 출발이라고 생각해요 1. pie() - 파이그래프 인자 설명 main = "메인 제목" 그래프 제목 설정 angle, density, col pie 부..

여러 패키지 함수들, 그래프 함수 인자들 다 기억할 수 없어요. 저는 사용 할 시기가 되면 서적에서 봤던 거, 배웠던 거 정리한 것을 찾아서 활용해요. 가장 중요한 것은 함수들과 인자들을 외우는 것이 아니라, 어떻게 활용하는지 이해하는 것이 중요해요 ~!! 사용하고 싶은 함수들을 빨리 찾아서 빨리 사용하기 위해서이죠! 그중에서 그래프 함수들을 사용할 경우 저는 중요하게 생각하는 부분이 어떤 데이터 타입이 들어가는지에요~! 벡터형태, 테이블형태, 메트릭스형태, 데이터프레임형태가 함수의 x축 y축에 어떻게 맞춰서 들어가는 것에 대한 이해가 그래프 함수 활용의 출발이라고 생각해요 1. 그래프 인자 알아보기 인자 설명 main = "메인 제목" 그래프 제목 설정 sub = "서브 제목" 그래프 서브 제목 xla..