데이터 분석/SAS

[SAS] Proc Import 데이터 불러오기

love R 2022. 1. 7. 22:07
반응형

Import procedure은 외부 데이터를 불러오기 위한 프로시저입니다.

사용법은 아래와 같습니다.

1. Proc import statement

PROC IMPORT DATAFILE = 파일위치 or 파일명 
       DBMS= 불러올 데이터 타입 - (CSV, DLM,...)
       OUT= 생성할 데이터셋 이름 지정
       REPLACE; 데이터 덮어쓰기 
RUN;

 

 

csv 파일을 아래처럼 생성하였습니다.

 

 

PROC IMPORT DATAFILE = 파일위치 or 파일명;
       DBMS= CSV
       OUT= WORK.TEST1;
RUN;

 

만약 데이터를 덮어쓰고 싶다면 replace 를 지정해야 합니다.

즉, replace 지정하지 않으면 아무리 실행해도 최초에 생성된 데이터셋에서 변하지 않습니다!

 

PROC IMPORT DATAFILE = 파일위치 or 파일명;
       DBMS= CSV
       OUT= WORK.TEST1
       REPLACE;
RUN;

 

 

 

 

2. GETNAMES statement

GETNAMES statement는 raw data의 첫번째 행에 변수명이 포함되어 있을 경우 이용할 수 있는 statement입니다.

 

예를 들면 csv파일 형식의 경우 콤마( , )로 구분되어 있습니다. 대부분의 경우 csv파일의 가장 첫번째 행에 변수 이름이 있습니다. 이때 getnames statement를 이용합니다. 이 때 Default 값은 YES 이므로 getnames statement를 생략하여도 됩니다.

 

주의할 점은 세미콜론(;)을 따로 지정해줘야합니다. getnames statement가 단독적으로 존재하기 때문입니다.

PROC IMPORT DATAFILE = 파일위치 or 파일명 
       DBMS= CSV
       OUT= WORK.TEST2;
       GETNAMES = YES;
RUN;

 

 

만약 NO라고 지정한다면 아래 그림처럼 변수명이 관측치로 인식이 됩니다.

 

3. DATAROW statement

DATAROW statement는 지정된 숫자부터 행을 읽습니다.

PROC IMPORT DATAFILE = 파일위치 or 파일명 
       DBMS= CSV
       OUT= WORK.TEST3;
       GETNAMES = YES;
       DATAROW = 3;

RUN;

 

원시 데이터 아래처럼 5개의 행으로 구성되어있지만

 

DATAROW statement를 지정하면 아래처럼 일부 데이터만 추출됩니다.

 

 

※ 만약 첫번째 행부터 특정 행까지 불러오고 싶다면 options statement의 obs를 이용합니다.

OPTIONS OBS=3;
PROC IMPORT
 DATAFILE = 파일위치 or 파일명 
       DBMS= CSV
       OUT= WORK.TEST4;
       GETNAMES = YES;
RUN;

 

 

 

반응형

'데이터 분석 > SAS' 카테고리의 다른 글

[SAS] 데이터셋 만들기(input, cards) ㅡ ①  (0) 2021.08.12
[SAS] 라이브러리 지정하기  (0) 2021.08.12
[SAS] SAS OnDemand 사용 방법!  (1) 2021.04.06