전체교육일정
교육개요
본 과정에서는 Python의 주요 라이브러리인 Numpy, Pandas 라이브러리를 학습하고, 원시 데이터를 처리하여 분석에 적합한 형태로 만드는 방법들을 학습합니다.
교육목표
Python의 라이브러리인 Numpy, Pandas을 이해하고 활용할 수 있습니다.
데이터를 조회 및 집계하고, 처리하는 여러가지 방법을 이해하고 활용할 수 있습니다.
수강대상
- 현업에서 데이터 전처리 관련 업무를 하고싶은 학습자
- Python 라이브러리인 Numpy, Pandas 의 핵심을 익히고 싶은 학습자
강의내용
1. 데이터 구조와 Numpy 라이브러리
다양한 차원의 데이터 구조를 배우고, Numpy 라이브러리를 통해 배열을 다뤄봅니다.
학습 내용: 분석 단위, 데이터 셋, 배열 만들기, 배열 데이터 조회, 다양한 배열 연산, 배열 집계, 유용한 함수들
2. Pandas 라이브러리
Pandas 라이브러리를 통해 데이터 프레임에 대한 전반적인 개념을 학습합니다.
학습 내용: 데이터 프레임 이해, 데이터 프레임 불러오기, 데이터 프레임 조회
3. 데이터 조회와 집계
조회에 필요한 조건문, loc 와 iloc, 여러 조건 결합, between, isin을 학습합니다. 그 후 집계에 필요한 칼럼 기준, agg, pivot에 대해 학습합니다.
학습 내용: 조건 조회, 집계
4. 데이터 프레임 처리
데이터 프레임을 병합하고, 이동 평균을 구하는 함수에 대해 학습합니다.
학습 내용: merge, concat, rolling, shift
5. 데이터 값 처리
결측값 처리, 더미 변수, 스케일링, 데이터 특징 생성에 대해 학습합니다.
학습 내용: NaN 조치, Dummy Variable, Scaling, Feature Engineering