반응형
Import procedure은 외부 데이터를 불러오기 위한 프로시저입니다.
사용법은 아래와 같습니다.
1. Proc import statement
PROC IMPORT DATAFILE = 파일위치 or 파일명 DBMS= 불러올 데이터 타입 - (CSV, DLM,...) OUT= 생성할 데이터셋 이름 지정 REPLACE; 데이터 덮어쓰기 RUN; |
csv 파일을 아래처럼 생성하였습니다.
PROC IMPORT DATAFILE = 파일위치 or 파일명; DBMS= CSV OUT= WORK.TEST1; RUN; |
만약 데이터를 덮어쓰고 싶다면 replace 를 지정해야 합니다.
즉, replace 지정하지 않으면 아무리 실행해도 최초에 생성된 데이터셋에서 변하지 않습니다!
PROC IMPORT DATAFILE = 파일위치 or 파일명; DBMS= CSV OUT= WORK.TEST1 REPLACE; RUN; |
2. GETNAMES statement
GETNAMES statement는 raw data의 첫번째 행에 변수명이 포함되어 있을 경우 이용할 수 있는 statement입니다.
예를 들면 csv파일 형식의 경우 콤마( , )로 구분되어 있습니다. 대부분의 경우 csv파일의 가장 첫번째 행에 변수 이름이 있습니다. 이때 getnames statement를 이용합니다. 이 때 Default 값은 YES 이므로 getnames statement를 생략하여도 됩니다.
주의할 점은 세미콜론(;)을 따로 지정해줘야합니다. getnames statement가 단독적으로 존재하기 때문입니다.
PROC IMPORT DATAFILE = 파일위치 or 파일명 DBMS= CSV OUT= WORK.TEST2; GETNAMES = YES; RUN; |
만약 NO라고 지정한다면 아래 그림처럼 변수명이 관측치로 인식이 됩니다.
3. DATAROW statement
DATAROW statement는 지정된 숫자부터 행을 읽습니다.
PROC IMPORT DATAFILE = 파일위치 or 파일명 DBMS= CSV OUT= WORK.TEST3; GETNAMES = YES; DATAROW = 3; RUN; |
원시 데이터 아래처럼 5개의 행으로 구성되어있지만
DATAROW statement를 지정하면 아래처럼 일부 데이터만 추출됩니다.
※ 만약 첫번째 행부터 특정 행까지 불러오고 싶다면 options statement의 obs를 이용합니다.
OPTIONS OBS=3; PROC IMPORT DATAFILE = 파일위치 or 파일명 DBMS= CSV OUT= WORK.TEST4; GETNAMES = YES; RUN; |
반응형
'데이터 분석 > SAS' 카테고리의 다른 글
[SAS] 데이터셋 만들기(input, cards) ㅡ ① (0) | 2021.08.12 |
---|---|
[SAS] 라이브러리 지정하기 (0) | 2021.08.12 |
[SAS] SAS OnDemand 사용 방법! (1) | 2021.04.06 |