작업디렉토리란 데이터 불러오기 및 저장 시에 기본적으로 설정되어 있는 경로를 뜻합니다.
이와 관련하여 주로 쓰는 함수는 getwd, setwd, dir 와 같은 함수가 있습니다.
1. 현재 작업디렉토리 확인
getwd 는 현재 작업 경로의 위치를 확인할 수 있는 함수입니다.
dir 함수는 인자로 아무것도 적지 않으면 현재 작업디렉토리로 지정되어 있는 경로의 파일명 또는 디렉토리명을 문자형 벡터로 제공됩니다. 만약 현재 지정된 작업디렉토리 안에 또 다른 하위폴더가 있다면 인자로 하위폴더명을 적으면 그 안에 있는 파일명과 폴더명이 반환됩니다. dir() 결과로 현재 작업디렉토리에는 두 개의 파일이 있는 것으로 확인되네요.
> getwd() [1] "C:/Users/ho/Documents/R/Rtest/Blog" > dir() [1] "blog_test.csv" "love R.txt" |
2. 데이터 불러오기 및 저장하기
위에서 작업 디렉토리에 blog_test.csv 라는 파일을 불러오도록 하겠습니다.
read.csv 함수를 통해 간단하게 불러올 수 있습니다. 원칙적으로는 경로 전부를 입력하여야 합니다. 하지만 파일이 작업 디렉토리 안에 있는 경우 파일명만 인자로 넣어주면 됩니다. 저장도 마찬가지로 적용됩니다.
> # 작업디렉토리 안에 있는 파일 불러오기 > read.csv("blog_test.csv") v1 v2 1 1 4 2 2 5 3 3 6 > # 절대경로를 이용한 파일 불러오기 > read.csv("C:/Users/ho/Documents/R/Rtest/Blog/blog_test.csv") v1 v2 1 1 4 2 2 5 3 3 6 > # 작업디렉토리 안에 파일 저장하기 > write.csv("blog_test.csv") |
3. 작업디렉토리의 하위 폴더에 있는 데이터 불러오기
작업디렉토리로 지정되어 있는 경로에 파일 뿐만 아니라 하위 폴더가 존재할 수 있습니다. 아래는 작업디렉토리에 지정되어 있는 폴더 및 파일입니다.
위와 같이 작업_TEST 라는 폴더를 새로 생성 후에 안에 있는 csv파일을 불러오도록 해보겠습니다. 하위폴더로 접근하는 방법은 "./하위폴더명/파일명" 이렇게 적어주면 현재 디렉토리 내에 있는 폴더로 들어가 blog_test2.csv 라는 파일을 불러올 수 있습니다.
> # 작업디렉토리는 1번의 경로와 동일 > getwd() [1] "C:/Users/ho/Documents/R/Rtest/Blog" > dir() [1] "blog_test.csv" "love R.txt" "작업_TEST" > # dir('하위폴더명'): 작업디렉토리 내의 하위폴더에 있는 파일명 반환 > dir('작업_TEST') [1] "blog_test2.csv" > # 경로명에 ./ 을 앞에 붙여서 하위 폴더로 접근하여 데이터 불러오기 > read.csv("./작업_TEST/blog_test2.csv") v1 v2 1 10 40 2 20 50 3 30 60 |
4. 새로운 작업디렉토리 지정하기
setwd는 새로운 작업디렉토리를 지정할 수 있는 함수입니다. 작업디렉토리를 바탕화면으로 바꾸기 위해서 setwd의 인자로 바탕화면 경로를 지정해줍니다.
> # 작업디렉토리를 바탕화면으로 지정하기 > setwd("C:/Users/ho/Desktop") |
'데이터 분석 > R 데이터 처리 & 분석' 카테고리의 다른 글
[R데이터분석] 간단하게 변수 이름 변경하기 (0) | 2020.07.10 |
---|---|
[R] sapply 함수 사용법 & 활용하기 (0) | 2020.07.09 |
R 결측치 처리하기(is.na, complete.cases 등) (0) | 2020.06.13 |
[데이터처리] 중복 데이터 제거한 데이터프레임 생성(duplicated, unique, distinct) (0) | 2020.05.17 |
[R데이터분석] dplyr 패키지를 활용한 데이터전처리(3)(arrange,mutate) (0) | 2020.02.07 |