프로그래밍 /R

[R] 스크립트 파일 관리 & 프로젝트 생성 및 관리

yooj_lee 2019. 6. 28. 16:41
300x250

스크립트 파일 관리

: 코드가 너무 길면 어떤 게 어디 있는지 찾기 어렵다. 수천 줄의 코드가 담긴 스크립트 파일을 어떻게 관리할지.

- 캡슐화(Encapsulation)

: 특정 기능을 수행하는 코드를 가져다가 꽁꽁 싸는 것. 유지, 보수, 관리가 잘됨.

1) R studio 기능 활용

: Script 파일 목차(구역 나누기 & 목차)를 만들 수 있음. (주석 끝에 ####)

코드 접고 펼 수 있음.

 

2) 사용자 정의 함수 활용

: 특정 기능을 하는 코드 뭉치를 사용자 정의 함수로 만든다. 별도의 스크립트 파일에 저장하여 필요할 때 불러온다(source 함수). or 패키지로 만들어버림.

 

- 스크립트 파일 grouping

1) 용도에 따른 구분

: 데이터 입출력, 전처리, 시각화 및 레포팅 등

2) 성질에 따른 구분

: 패키지 로딩 등 환경설정, 데이터 병합 등

3) 요구사항에 따른 구분

: 특정 업무 처리 (시각화의 경우 多)

 

ex) 공모전 나갈 때 이런 식으로 파일 구성하면 괜찮을 듯

1st Script                       2nd Script (파일 읽고 살펴보기)                                  3rd Script

: 01_env                         : 02_EDA                                                                 : 03_model

                                    (데이터셋이 여러개일 때는 n개의 script 만듦)                  (예측 모델, 통계 분석 모델)

- 패키지 로딩                   - 이상치 / 결측치 처리                                               - Feature Engineering

- 옵션 설정                      - 데이터 분포 확인                                                    - 모델 성능 비교

- DB 연결                        - 상관계수 행렬 등

 

+) 추가로 시각화가 필요하다면 시각화 스크립트 파일을 추가해야겠지.

 

프로젝트 생성 및 관리

: 프로젝트 == 스크립트 파일을 여러개로 뭉쳐놓은 것.

스크립트 파일과 작업폴더(프로젝트 생성 시 따로 폴더가 지정이 됨. 그 폴더 내에서 모든 코드, 스크립트 파일, 데이터 등을 다 관리 할 수 있다)를 한 번에 관리할 수 있음. 데이터 및 코드 뒤섞임을 방지할 수 O. GitHub 연동 가능.

 

300x250