결손값 (NA) 처리하기
결손값(NA) 를 처리하는 방법에 대해 다뤄보겠습니다.
1) NA 값 확인하기
`is.na()` : 각 원소별로 NA 인지 확인합니다.
`any(is.na())`: 하나라도 NA가 있으면 TRUE를 반환합니다.
2) NA 값 대체하기
`ifelse()` 사용하여 NA 값을 대체할 수 있습니다. 위 코드는 NA를 0으로 대체합니다.
3) NA 값 삭제하기
`na.omit()`을 통해 NA를 삭제할 수 있습니다.
추가적으로 R에서 제공하는 함수에서 `na.rm`이라는 인자를 이용할 수도 있습니다.
데이터 프레임에서 NA 처리하기
대부분 외부에서 구할 수 있는 정형 데이터는 데이터 프레임 형태로 불러올 수 있을텐데요. 이번에는 데이터 프레임을 예시로 NA를 처리해보겠습니다.
NA 있는 행 모두 삭제
`complete.cases()` 를 이용하면 NA가 있는 행을 모두 삭제 가능합니다.
`complete.cases()`는 NA가 있는 행을 FALSE 로 반환합니다. 이를 이용하여 NA값이 있는 행을 모두 삭제할 수 있습니다.
반응형