Global Vendors Training

Home > > 전체교육일정

Cloudera

Administrator Training: CDH

교육일정
교육기간
4일
교육금액
2,394,000원(면세)
Cloudera전체일정보기 수강신청

교육개요

본 과정은 Cloudera Manager를 사용하여 Hadoop 클러스터를 운영하고 유지하는 데 필요한 모든 단계에 대한 포괄적인 이해를 제공합니다. 설치 및 구성부터 로드 밸런싱 및 튜닝에 이르기까지이 Cloudera 관리자가 직면한 실제 문제에 대비한 최상의 준비 과정입니다.



교육목표

- 로깅 수집, 구성 관리, 자원 관리, 보고, 경고 및 서비스 관리 등 클러스터 관리를 쉽게 만들어 주는 Cloudera Manager 기능들
- YARN, HDFS, Impala, Hive, Spark, Kudu 및 Kafka를 포함한 주요 Hadoop 관련 서비스를 제공하는 프로덕션 규모 클러스터 구성 및 배포
- Cluster를 위한 올바른 하드웨어와 인프라 기반 시설을 결정
- 데이터 센터와 통합하기 위한 적절한 클러스터 구성 및 배포
- HDFS, Kudu 및 Amazon S3와 같은 클라우드 객체 저장소의 데이터 수집, 저장 및 액세스
- Kafka 및 Flume을 사용하여 파일 기반 및 스트리밍 데이터를 클러스터에 로드하는 방법
- 클러스터의 여러 사용자에 대해 서비스 수준 계약이 충족되도록 자동 리소스 관리 구성
- 프로덕션 클러스터 준비, 조정 및 유지 관리를 위한 모범 사례
- 클러스터 문제 해결, 진단 및 해결



수강대상

시스템 관리자 및 IT 매니저



선수과목

리눅스 사용 경험



강의내용

1.소개

2.Cloudera Enterprise Data Hub
-Cloudera Enterprise Data Hub
-CDH 개요
-Cloudera Manager 개요
-Hadoop 관리자의 책임

3.Cloudera Manager 및 CDH 설치
-클러스터 설치 개요
-Cloudera Manager 설치
-CDH 설치
-CDH 클러스터 서비스

4.Cloudera 클러스터 구성
-개요
-구성 설정
-서비스 구성 수정
-구성 파일
-역할 인스턴스 관리
-새로운 서비스 추가
-호스트 추가 및 제거

5.Hadoop 분산 파일 시스템
-개요
-HDFS 토폴로지 및 Roles
-로그 및 체크 포인트 편집
-HDFS 성능 및 Fault Tolerance
-HDFS 및 Hadoop 보안 개요
-HDFS용 웹 사용자 인터페이스
-HDFS 명령 줄 인터페이스 사용
-기타 명령 줄 유틸리티

6.HDFS 데이터 수집
-데이터 수집 개요
-파일 형식
-파일 전송 또는 REST 인터페이스를 사용하여 데이터 수집
-Apache Sqoop을 사용하여 관계형 데이터베이스에서 데이터 가져 오기
-Apache Flume을 사용하여 외부 소스에서 데이터 수집
-데이터 가져 오기 모범 사례

7.Hive 및 Impala
-Apache Hive
-Apache Impala

8.YARN 및 MapReduce
-YARN 개요
-YARN에서 애플리케이션 실행
-YARN 애플리케이션 보기
-YARN 애플리케이션 로그
-MapReduce 애플리케이션
-YARN 메모리 및 CPU 설정

9.Apache Spark
-Spark 개요
-Spark 애플리케이션
-Spark 애플리케이션이 YARN에서 실행되는 방법
-Spark 애플리케이션 모니터링

10.클러스터 계획하기
-일반적인 고려 사항
-올바른 하드웨어 선택
-네트워크 고려 사항
-가상화 옵션
-클라우드 배포 옵션
-노드 구성

11.고급 클러스터 구성
-서비스 포트 구성
-HDFS 및 MapReduce 튜닝
-HDFS 고가용성 활성화

12.자원 관리
-Static Service Pools로 cgroup 구성
-The Fair Scheduler
-동적 리소스 풀 구성
-Impala 쿼리 스케줄링

13.클러스터 유지 관리
-HDFS 상태 확인
-클러스터 간 데이터 복사
-HDFS에서 데이터 Rebalancing
-HDFS 디렉토리 스냅샷
-클러스터 업그레이드

14.클러스터 모니터링
-Cloudera Manager 모니터링 기능
-건강 테스트
-이벤트 및 경고
-차트 및 보고서
-모니터링 권장 사항

15.클러스터 문제 해결
-개요
-문제 해결 도구
-잘못된 구성 예
-필수 포인트

16.Hue 설치 및 관리
-개요
-Hue 관리 및 구성
-Hue 인증 및 권한부여

17.보안
-Hadoop 보안 개념
-Kerberos를 사용한 Hadoop 인증
-Hadoop 권한부여
-Hadoop 암호화
-Hadoop 클러스터 보안

18.Apache Kudu
-Kudu 개요
-아키텍처
-설치 및 구성
-모니터링 및 관리 도구

19.Apache Kafka
-Apache Kafka란?
-Apache Kafka 개요
-Apache Kafka 클러스터 아키텍처
-Apache Kafka 명령 줄 도구
-Flume과 함께 Kafka 사용

20.클라우드의 오브젝트 스토리지
-개체 스토리지
-Hadoop을 Object Storage에 연결