일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- r
- Python
- 빅데이터
- 데이터
- R시각화
- NLP
- pandas
- word2vec
- AI
- 하둡
- SQL
- 데이터분석
- 자연어처리
- CNN
- 주가예측
- Hadoop
- 빅데이터처리
- Deeplearning
- lstm
- 그래프시각화
- R프로그래밍
- ggplot
- HIVE
- 데이터처리
- 데이터시각화
- 그래프
- 머신러닝
- 기계학습
- R그래프
- 딥러닝
- Today
- Total
목록데이터분석/R (18)
욱이의 냉철한 공부
* ORACLE과 연동하기 전에 이해하고 해야 할 것이 있다. 1. rJava : 이 패키지로 자바에 있는 리소스를 가져 올 수 있다. 즉 rjdbc를 사용할 수 있다. 이러한 패키지를 사용하기 위해서는 jdk가 필요하다. 그래서 보통 R을 설치하기 전에 자바를 설치한다. 2. rjdbc : R하고 자바가 설치되어 있어야 사용할 수 있다. 모든 데이터베이스하고 연동하게 해준다. 3. mysql-connector-java-5.1.38-bin.jar jar 파일은 자바패키지 파일 덩어리이다. DB연동을 위해 mysql-connector-java-5.1.38-bin.jar에 있는 패키지를 사용할 것이다. 1. MySQL 연결 - JDBC() 함수를 사용하여 자바패키지를 사용한다. - 자바패키지를 사용할 수 있..
* 우리가 R을 쓰는 이유 : 시각화, 통계 패키지를 비롯하여 수많은 패키지 + 다른 언어, 툴과 연결 https://warm-uk.tistory.com/64?category=810499 [R, 정리] R의 특징과 장점, 사용이유 R은 제가 가장 자주, 잘 사용하는 툴이자 언어에요. 처음 데이터 공부를 R로 시작했기 때문에 그런 것일지도 모릅니다. Python을 자주 사용하면서 익히고 싶지만.. 아직 스몰데이터만 만져본 저에 warm-uk.tistory.com * 구글 그래프 - 자바스크립 이용한 기술이다. - 구글이 만든 무빙 그래프(설정에 의해서 움직이는 그래프) ,인터랙티브 그래프(마우스 움직임에 반응해 실시간으로 형태가 변하는 그래프) - R은 수많은 언어와 화합할 수 있고, R을 이용하여 자바스..
제가 블로그에 올리는 R 내용은 제가 학교 수업, 국비 수업, 책, 구글링, 프로젝트를 통해 습득했던 내용을 요약 정리해서 웬만하면 다른 데이터에 적용해서 포스팅 하고 있어요. (현재 기준으로 아직 워드클라우드, 데이터마이닝 패키지들, 구글그래프, 텍스트클러스터링, shiny 등등 .. 포스팅 할 것이 많네용 ) ggmap 패키지는 책 R까기의 내용을 실행하는 것을 올리도록 할께요~! 개인적으로 책으로 R에 입문할 때, (R 관련 책을 많이 읽어 본 건 아니지만...) R까기, R까기2 가 가장 좋은 책 같아요. R까기는 시각화 위주로 나왔고, R까기2는 R에서 기본적으로 사용할 수 있는 데이터 처리, 시각화, 통계적인 부분 이해하기 쉽게 쓰여진 책이에요 1. 지도 그리는 ggmap패키지 사용하기. * ..
R에서 XML 패키지를 사용하면 웹에서 쉽게 그래프를 크롤링 할 수 있어요~! 크롤링 함수를 알아볼께요~! 1. 패키지 설치 - XML 패키지를 설치한다. 2. 도표(Table) 가져오기 - 본인은 스포츠 통계 사이트에 들어가서 빨간색 박스의 '프리미어리그 최근 경기 결과 도표' 를 크롤링 하겠다. - 해당링크 : http://www.betstudy.com/soccer-stats/c/england/premier-league/2017-2018/ - 도표가 있는 크롤링 할 사이트의 링크를 입력한다. - XML 패키지의 readHTMLTable() 함수에 주소링크를 입력한다. - length() 함수를 통해 몇 개의 테이블을 R로 가져왔는지 확인한다. - 빨간색 박스를 통해 원하는 표를 크롤링 했다는 것을 확..
=> geom_point()와 geom_smooth()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/75?category=810499 [R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기1 - geom_point(), geom_smooth() * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생 warm-uk.tistory.com => geom_bar()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/76?category=810499 ..
=> geom_bar()와 geom_smooth()는 여기서 확인하시면 됩니다. https://warm-uk.tistory.com/75?category=810499 [R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기1 - geom_point(), geom_smooth() * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생 warm-uk.tistory.com * 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수..
* 예시로 사용할 데이터 셋 mpg : 자동차 234종에 대한 데이터입니다. 총 234행 11열(변수)로 이루어져 있습니다. 변수명 내용 변수명 내용 manufacturer 제조회사 model 자동차 모델명 dispal 배기량 year 생산연도 cyl 실린더 개수 trans 변속기 종류 drv 구동 방식 cty 도시 연비 hwy 고속도로 연비 fl 연료 종류 class 자동차 종류 1. ggplot 패키지 설치 및 데이터 셋 확인 - ggplot2패키지는 ggplot패키지의 업데이트된 버젼이다. - ggplot2패키지 내에 있는 mpg 데이터셋 객체를 불러와 데이터 프레임으로 만든다. - ggplot2::mpg는 ggplot2에 들어있는 mpg 데이터를 지칭하는 코드 - ::를 이용하면 특정 패키지에 들..
1. dplyr 패키지는 무엇인가? 1) plyr 패키지 데이터의 분할(split) – 적용(apply) -재조합(combine)하는 세 단계로 데이터를 처리하는 함수들을 제공하는 패키지이다. 대표함수 : adply(), ddply(), mdply() 2) dplyr 패키지 dataframe과 plyr이 합쳐진 이름으로 data.frame 전용 plyr 패키지이다. 대표함수 : filter(), select(), mutate(), summarise(), arrange() 3) dplyr 함수 구조 - 함수명() - filter(iris, Species=="virginica") - 첫 번째 인자는 dataframe - 두 번째 인자는 dataframe으로 무엇을 할 지를 표현(조건) - 반환값은 dataf..