Data를 다루는 방법에 대해 공부한 내용(데이터 전처리, 시각화 등)을 한눈에 볼 수 있도록 정리한 게시글입니다.
데이터 전처리 (Data preprocess)
카테고리 변수 4가지 처리 방법
- Label encoding
- One hot encoding
- Count Encoding
- Target Encoding
결측치 처리
- 결측치 확인
- 결측치 제거
- 결측치 대체
데이터 스케일링
- Statndard Scaler, RoburstScaler
- MinMax Scaler, MaxAbs Scaler
- Normalizer
교차검증
- KFold, Startified KFold
- 교차 검증 종류 및 사용법
- cross_val_score, cross_validate
- LOOCV
- 임의 분할 교차 검증 (shuffle split cross)
- 반복 교차 검증 (Repeated)
- 그룹 교차 검증 (groups cross-validation)
데이터 시각화 (Data Visualization)
반응형