300x250
- 데이터 확인하기
데이터를 불러왔으니, 그 데이터가 멀쩡한지 멀쩡하다면 구조는 어떤지 탐색해야 한다.
1. 상/하단 행 확인
head(object, n) → 상단 n개의 행 확인
tail(object, n) → 하단 n개의 행 확인
2. 객체 구조 및 변수별 기술통계 확인
str(객체명): 객체 구조 확인, str은 structure의 줄임말
summary(객체명): 각 변수의 기술통계 확인 → 사분위수, 평균값, 결측치 등을 보여줌.
3. 행, 열에 대해 파악
1) nrow(객체명): 행 개수 확인
2) ncol(객체명): 열 개수 확인
3) dim(객체명): 행/열 개수 확인
4) colnames(객체명): 변수명 확인
cf.) rownames(), names()
→ 위의 4가지는 반복문, 조건문, 자료 추가 시에 유용하게 쓰임.
예를 들어 내가 data.frame에 하나의 변수를 append시키고 싶을 경우
df[nrow+1] <- new.var
로 편하게 할 수 있음. 아니면 반복문의 경우에는 for(i in 1:nrow(df) ){...} 를 통해 쉽게 반복 작업을 할 수 있음. 이렇게 할 경우, 나중에 data.frame에 구조가 변경되었을 경우에 코드 수정이 필요 없어지니까 훨씬 효율적.
300x250
'프로그래밍 > R ' 카테고리의 다른 글
R에서 함수 정의하기, 콜하기 (0) | 2019.06.12 |
---|---|
R에서 데이터 추출(데이터에서 하위 구조 데이터 추출), 치환 및 삽입하기 (0) | 2019.06.12 |
R로 데이터 가져오기(2) (0) | 2019.06.12 |
R로 데이터 가져오기 (1) (0) | 2019.06.12 |
[R 자료구조] 3. 고급 자료구조 (0) | 2019.06.12 |