최대 1 분 소요

Mastering Hadoop3

하둡을 공부하기 위해 책을 읽을 예정이다. 이 책의 목차를 먼저 정리하도록 하자.

Section1. Introduce Hadoop3

하둡에 대한 소개 HDFS, 네임노드, 데이터노드, 인터페이스에 대한 내용이 있고
리소스 관리자인 YARN에 대한 내용도 있다. 마지막으로 맵리듀스와 유스케이스를 소개한다.

  • chapter1. 하둡으로의 여행
  • chapter2. HDFS(하둡 분산 파일시스템) 깊이 이해하기
  • chapter3. YARN 리소스 관리자
  • chapter4. 맵리듀스의 내부구조


Section2. Hadoop Ecosystem

여러가지 하둡 에코 시스템을 알려주는 섹션이다. SQL은 Presto, Hive, Impala 와 관련이 있어보인다.
실시간-처리 엔진으로는 Spark, Apache Flink, Storm/Heron 등을 얘기한다.
그 외 여러가지 하둡 에코시스템의 종류: Pig, HBase, Kafka, Flume

  • chapter 5. SQL on Hadoop
  • chapter 6. 실시간 처리 엔진
  • chapter 7. 널리 쓰이는 하둡 에코시스템 구성요소


Section3. Hadoop in the Real World

데이터 엔지니어링을 위한 데이터 압축, 직렬화, ingestion, processing, airflow에 대한 내용을 얘기한다.
하둡에서의 실시간 스트리밍 처리는 어떻게 하는지에 대한 이야기와, 하둡에서의 머신러닝 방법, Hadoop in the Cloud 등..

  • chapter 8. 어플리케이션 디자인 in Hadoop
  • chapter 9. 실시간 스트리밍 처리
  • chapter 10. 머신러닝 in Hadoop
  • chapter 11. Hadoop in Cloud
  • chapter 12. Hadoop Cluster Profiling


Section4. Securing Hadoop

하둡의 보안 > 인증, 허가, 네트워크 보안, 암호화
그리고 모니터링에 대해 이야기한다.

  • chapter 13. 누가, 무엇을 하둡에서 할 수 있는가
  • chapter 14. 네트워크와 데이터 보안
  • chapter 15. 하둡 모니터링

https://github.com/PacktPublishing/Mastering-Hadoop-3

카테고리:

업데이트:

댓글남기기