[책] 빅데이터를 지탱하는 기술

March 8, 2022

1. 빅데이터의 기초 지식

[배경] 빅데이터의 정착

Copy of 정리-02

Copy of 정리-03

빅데이터 시대의 데이터 분석 기반

Copy of 정리-04

Copy of 정리-05

2. 빅데이터의 탐색

크로스 집계 / 열 지향 스토리지에 의한 고속화

Copy of 정리-06

애드혹 분석과 시각화 도구 / 데이터 마트 기본 구조

Copy of 정리-07

3. 빅데이터의 분산처리

대규모 분산처리의 프레임워크 : Hadoop, Spark

Copy of 정리-08

쿼리 엔진 : Hive, Presto

Copy of 정리-09

데이터 마트 구축

Copy of 정리-10

4. 빅데이터의 축적

벌크형 데이터 수집

Copy of 정리-11

스트리밍형 데이터 수집

Copy of 정리-12

[성능x신뢰성] 메시지 배송의 트레이드 오프

Copy of 정리-13

Copy of 정리-14

시계열 데이터의 최적화

Copy of 정리-15

비구조화 데이터의 분산 스토리지 : 분산KVS, 와이드칼럼스토어, 도큐먼트스토어, 검색엔진

Copy of 정리-16

Copy of 정리-17

5. 빅데이터의 파이프라인

워크플로 관리

Copy of 정리-18

Copy of 정리-19

배치 형의 데이터 플로우

Copy of 정리-20

스트리밍 형의 데이터 플로우

Copy of 정리-21

6. 빅데이터 분석 기반의 구축

스키마리스 데이터의 애드 혹 분석 : MongoDB, Spark

Copy of 정리-22

Hadoop에 의한 데이터 파이프라인 : MongoDB, Embulk, Hadoop, Hive, Presto

Copy of 정리-23

워크플로 관리 도구에 의한 자동화 : Airflow

Copy of 정리-24

클라우드 데이터 파이프라인 : AWS, GCP, 트레주어

Copy of 정리-25

Twitter Facebook LinkedIn