Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 기계학습
- 그래프시각화
- R시각화
- Hadoop
- 주가예측
- 딥러닝
- word2vec
- R그래프
- 데이터처리
- 데이터
- ggplot
- 자연어처리
- Deeplearning
- Python
- 데이터분석
- 데이터시각화
- NLP
- r
- 그래프
- SQL
- R프로그래밍
- lstm
- 하둡
- pandas
- 빅데이터처리
- CNN
- AI
- HIVE
- 머신러닝
- 빅데이터
Archives
- Today
- Total
욱이의 냉철한 공부
[R, 크롤링, 패키지] XML 패키지 사용하여 웹에서 그래프 가져오기 본문
R에서 XML 패키지를 사용하면 웹에서 쉽게 그래프를 크롤링 할 수 있어요~!
크롤링 함수를 알아볼께요~!
1. 패키지 설치
- XML 패키지를 설치한다.
2. 도표(Table) 가져오기
- 본인은 스포츠 통계 사이트에 들어가서 빨간색 박스의 '프리미어리그 최근 경기 결과 도표' 를 크롤링 하겠다.
- 해당링크 : http://www.betstudy.com/soccer-stats/c/england/premier-league/2017-2018/
- 도표가 있는 크롤링 할 사이트의 링크를 입력한다.
- XML 패키지의 readHTMLTable() 함수에 주소링크를 입력한다.
- length() 함수를 통해 몇 개의 테이블을 R로 가져왔는지 확인한다.
- 빨간색 박스를 통해 원하는 표를 크롤링 했다는 것을 확인 할 수 있다.
- 해당 크롤링해서 담은 변수 pop_table이 list 데이터타입이라는 것을 확인 할 수 있다.
- 리스트 안에는 표 하나씩 데이터프레임으로 저장되어 있다.
3. 테이블 위치 지정하여 크롤링하기
- readHTMLTable()함수의 which 인자를 이용하여 리스트 안에 있는 순서에 맞게 표를 가져올 수 있다.
- which=3으로 설정되어 있기 때문에, 3번째 본인이 가져오고 싶은 '프리미어리그 최근 경기 결과 도표' 를 가져왔다.
- 가져온 표가 R에서 데이터프레임 데이터타입이라는 것을 확인 할 수 있다.
'데이터분석 > R' 카테고리의 다른 글
[R, 시각화, 패키지] googleVis 패키지 사용하여 구글 그래프 그리기 (0) | 2021.06.28 |
---|---|
[R, 시각화, 패키지] ggmap 패키지 사용하여 지도 그리기(R까기) (0) | 2021.06.28 |
[R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기3 - geom_histogram(), 국소화, 다중plot (0) | 2021.06.28 |
[R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기2 - geom_bar(), 막대그래프 응용 (0) | 2021.06.28 |
[R, 시각화, 패키지] ggplot 패키지 사용하여 이쁘게 그래프 그리기1 - geom_point(), geom_smooth() (0) | 2021.06.28 |