IBM
교육개요
DataStage에서 병렬 작업을 개발하는 데 필요한 기술을 학습합니다.
이 과정을 통해 프로젝트 관리자와 ETL 개발자는 DataStage에서 병렬 작업을 개발하는 데 필요한 기술을 습득할 수 있습니다. 개발자에 중점을 둡니다. DataStage 개발자와 관련된 관리 기능만 자세히 설명합니다. 학생들은 순차 및 관계형 데이터에 액세스하는 병렬 작업을 생성하고 함수 및 기타 작업 구성 요소를 사용하여 데이터를 결합 및 변환하는 방법을 배웁니다.
교육목표
- DataStage 및 DataStage 워크플로우의 사용 설명
- Information Server 아키텍처 및 DataStage가 아키텍처에 어떻게 적합한지 설명
- Information Server 및 DataStage 배치 옵션 설명
- Information Server 웹 콘솔 및 DataStage 관리자 클라이언트를 사용하여 DataStage 사용자를 작성하고 DataStage 환경을 구성
- DataStage 오브젝트를 파일로 가져오기 및 내보내기
- 순차 파일 및 관계형 테이블에 대한 테이블 정의 가져오기
- DataStage 병렬 작업 설계, 컴파일, 실행 및 모니터
- 순차 파일을 읽고 쓰는 작업 설계
- DataStage 병렬 처리 아키텍처 설명
- 조인 및 조회를 사용하여 데이터를 결합하는 작업 설계
- 데이터를 정렬하고 집계하는 작업 설계
- DataStage Transformer 스테이지를 사용하여 복잡한 비즈니스 로직 구현
- DataStage PX 디버거를 사용하여 DataStage 작업 디버깅
수강대상
DataStage를 사용하여 데이터 추출 및 변환을 담당하는 프로젝트 관리자 및 ETL 개발자
선수과목
- Windows 운영 체제에 대한 기본 지식
- 데이터베이스 액세스 기술에 대한 지식
강의내용
1. DataStage 소개
2. 전개
3. DataStage 관리
4. 메타데이터 작업
5. 병렬 작업 만들기
6. 순차 데이터 액세스
7. 알고리즘 분할 및 수집
8. 데이터 결합
9. 그룹 처리 단계
10. 변압기 스테이지
11. 리포지토리 기능
12. 관계형 데이터 작업
13. 제어 작업