일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Python
- pandas
- 머신러닝
- lstm
- CNN
- R그래프
- AI
- 빅데이터처리
- 데이터분석
- 자연어처리
- 데이터시각화
- 그래프시각화
- r
- R시각화
- 딥러닝
- NLP
- 하둡
- Deeplearning
- 데이터
- 빅데이터
- 그래프
- R프로그래밍
- 기계학습
- 데이터처리
- Hadoop
- ggplot
- 주가예측
- HIVE
- word2vec
- SQL
- Today
- Total
목록빅데이터저장 (2)
욱이의 냉철한 공부

빅데이터의 유형 1) 구조화 데이터 - 행과 열로 구조화 되어 있다. - 고객데이터, 업무데이터, 거래데이터 등 - 관계 데이터베이스에 저장 - 앞으로 언급할 관계 데이터베이스 : 오라클-db, my-sql, mariai-db 2) 반구조화 데이터 - XML, JSON : 키와 값 구조로 되어있다. - NoSQL 데이터베이스에 저장 - 앞으로 언급할 NoSQL 데이터베이스 : Mongo-db, Cassndra, Hbase 3) 비구조화 데이터 ,빅데이터 - 텍스트, 동영상, 음성 - 하둡(분산처리시스템)에 저장 및 처리 - 앞으로 언급할 하둡에코시스템 : Hive 1, Hive2, Pig, Hbase, Spark => 빅데이터 및 비구조화 데이터를 저장하고 처리하기 위한 프로그램 하둡을 알아보자! 1. ..
1. 빅데이터 왜 활용하는가? - Digitizing business ex1) 이마트는 물건 만드는 회사가 아닌 물건 파는 회사였다. 하지만 현재는 만들어서 판매하고 있다. 예를 들면 너구리와 신라면이 있고, 중간 라면을 만들어서 팔면 효과가 있을 것이다 판단하여 판매를 하게 되었다. => 기존에는 고객의 데이터를 분석해서 상품들을 사라고 홍보하였다. -> 현재에는 고객이 원하는 것을 찾아 만들어 판다. => 새로운 고객층을 분석하는 것이 아니라 새로운 시장을 찾아야 한다. => 고객 데이터 뿐 아니라 SNS 데이터등의 빅데이터가 필요하다. ex2) 나이키의 적은 아디다스이다? 아니다. 게임하는 사람들은 운동용품을 구매하지 않는다. 나이키의 적은 아디다스가 아니라 게임회사이다. => 모든 관점에서 다 분..