Idealim
article thumbnail
Published 2023. 11. 22. 21:03
Data Science 정리본 Data/Data Science

Data를 다루는 방법에 대해 공부한 내용(데이터 전처리, 시각화 등)을 한눈에 볼 수 있도록 정리한 게시글입니다.

데이터 전처리 (Data preprocess)

카테고리 변수 4가지 처리 방법

  • Label encoding
  • One hot encoding
  • Count Encoding
  • Target Encoding

결측치 처리

  • 결측치 확인
  • 결측치 제거
  • 결측치 대체

데이터 스케일링

  • Statndard Scaler, RoburstScaler
  • MinMax Scaler, MaxAbs Scaler
  • Normalizer

교차검증

  • KFold, Startified KFold
  • 교차 검증 종류 및 사용법
    • cross_val_score, cross_validate
    • LOOCV
    • 임의 분할 교차 검증 (shuffle split cross)
    • 반복 교차 검증 (Repeated)
    • 그룹 교차 검증 (groups cross-validation)

데이터 시각화 (Data Visualization)

반응형
profile

Idealim

@Idealim

읽어주셔서 감사합니다. 잘못된 내용이 있으면 언제든 댓글로 피드백 부탁드립니다.