스크립트 파일 관리
: 코드가 너무 길면 어떤 게 어디 있는지 찾기 어렵다. 수천 줄의 코드가 담긴 스크립트 파일을 어떻게 관리할지.
- 캡슐화(Encapsulation)
: 특정 기능을 수행하는 코드를 가져다가 꽁꽁 싸는 것. 유지, 보수, 관리가 잘됨.
1) R studio 기능 활용
: Script 파일 목차(구역 나누기 & 목차)를 만들 수 있음. (주석 끝에 ####)
코드 접고 펼 수 있음.
2) 사용자 정의 함수 활용
: 특정 기능을 하는 코드 뭉치를 사용자 정의 함수로 만든다. 별도의 스크립트 파일에 저장하여 필요할 때 불러온다(source 함수). or 패키지로 만들어버림.
- 스크립트 파일 grouping
1) 용도에 따른 구분
: 데이터 입출력, 전처리, 시각화 및 레포팅 등
2) 성질에 따른 구분
: 패키지 로딩 등 환경설정, 데이터 병합 등
3) 요구사항에 따른 구분
: 특정 업무 처리 (시각화의 경우 多)
ex) 공모전 나갈 때 이런 식으로 파일 구성하면 괜찮을 듯
1st Script 2nd Script (파일 읽고 살펴보기) 3rd Script
: 01_env : 02_EDA : 03_model
(데이터셋이 여러개일 때는 n개의 script 만듦) (예측 모델, 통계 분석 모델)
- 패키지 로딩 - 이상치 / 결측치 처리 - Feature Engineering
- 옵션 설정 - 데이터 분포 확인 - 모델 성능 비교
- DB 연결 - 상관계수 행렬 등
+) 추가로 시각화가 필요하다면 시각화 스크립트 파일을 추가해야겠지.
프로젝트 생성 및 관리
: 프로젝트 == 스크립트 파일을 여러개로 뭉쳐놓은 것.
스크립트 파일과 작업폴더(프로젝트 생성 시 따로 폴더가 지정이 됨. 그 폴더 내에서 모든 코드, 스크립트 파일, 데이터 등을 다 관리 할 수 있다)를 한 번에 관리할 수 있음. 데이터 및 코드 뒤섞임을 방지할 수 O. GitHub 연동 가능.
'프로그래밍 > R ' 카테고리의 다른 글
[R] 데이터 재가공 (0) | 2019.06.27 |
---|---|
[R] 반복문 없이 반복하기 (0) | 2019.06.27 |
[R] 데이터 읽어오기(read) & 데이터 기록하기(write) (0) | 2019.06.20 |
[R] 반복문(for loop, while loop) (0) | 2019.06.12 |
[R] 제어문(if, if~else if~, switch, ifelse) (0) | 2019.06.12 |