프로그래밍 /R

R에서 데이터 확인하기

yooj_lee 2019. 6. 12. 16:34
300x250

- 데이터 확인하기

데이터를 불러왔으니, 그 데이터가 멀쩡한지 멀쩡하다면 구조는 어떤지 탐색해야 한다.

 

1. 상/하단 행 확인

head(object, n)  상단 n개의 행 확인

tail(object, n) → 하단 n개의 행 확인

 

2. 객체 구조 및 변수별 기술통계 확인

str(객체명): 객체 구조 확인, str은 structure의 줄임말

summary(객체명): 각 변수의 기술통계 확인 → 사분위수, 평균값, 결측치 등을 보여줌.

 

3. 행, 열에 대해 파악

1) nrow(객체명): 행 개수 확인

2) ncol(객체명): 열 개수 확인

3) dim(객체명): 행/열 개수 확인

4) colnames(객체명): 변수명 확인

   cf.) rownames(), names()

 

위의 4가지는 반복문, 조건문, 자료 추가 시에 유용하게 쓰임.

예를 들어 내가 data.frame에 하나의 변수를 append시키고 싶을 경우

df[nrow+1] <- new.var

로 편하게 할 수 있음. 아니면 반복문의 경우에는 for(i in 1:nrow(df) ){...} 를 통해 쉽게 반복 작업을 할 수 있음. 이렇게 할 경우, 나중에 data.frame에 구조가 변경되었을 경우에 코드 수정이 필요 없어지니까 훨씬 효율적.

 

 

300x250