반응형

데이터 분석 42

[R] non-numeric argument to binary operator(이항연산자에 수치가 아닌 인수입니다)

1. non-numeric argument to binary operator(이항연산자에 수치가 아닌 인수입니다) 에러 원인 해당 오류는 숫자형 자료에 다른 형태의 자료를 연산할 때 나오는 오류입니다. R에서는 따옴표를 통해서 문자형을 표현합니다. 즉, "1" 과 1은 다른 유형의 값들입니다. 2. 에러 해결방법 "1" + 1 # "1"은 문자형 자료 Error in "1" * 3 : 이항연산자에 수치가 아닌 인수입니다 1+1 # 모두 숫자형 2 함수를 이용해서 숫자로 바꾸는 것은 as.numeric 함수를 이용해 문자형을 숫자형으로 바꿉니다. #문자형 -> 숫자형 변환 후 연산 as.numeric("1") + 1 2 데이터프레임에서 겉으로 보기에는 숫자형인지 문자형인지 확인할 수는 없습니다. 이 때는 ..

[SAS] SAS OnDemand 사용 방법!

웹사이트 주소는 아래와 같습니다. https://welcome.oda.sas.com/ 1. 우측 상단에 있는 'Sign In' 버튼을 클릭합니다. 2. 그러면 아래처럼 나오는데 SAS 계정이 있으면 로그인합니다. 만약에 계정이 없으면 "Don't have a SAS Profile?"를 클릭하여 가입합니다. 3. 로그인 후에는 가운데에 'Launch' 버튼을 클릭합니다. 4. 구동이 완료된 것을 확인할 수 있습니다. *출처: SAS OnDemand for Academics: Registration Instructions

[R] Error in data.frame(..., check.names = FALSE) : arguments imply differing number of rows: 오류 처리

1. Error in data.frame(..., check.names=FALSE) 에러 원인 이 오류의 원인은 데이터프레임을 열별로 병합할 때 일어나는 오류입니다. 즉, 두 데이터프레임의 관측치 개수가 맞지 않기 때문입니다. # 아래처럼 관측치가 4개인 자료를 a에 할당하고 관측치가 5개인 자료를 b에 할당합니다. a

[R] Error in file(file, "r") : 커넥션을 열 수 없습니다(cannot open the connection)

1. Error in file(file, "r") : 커넥션을 열 수 없습니다(cannot open the connection) 원인 파악하기 R로 파일을 불러오려다보면 위와 같은 에러 문구가 나올 때가 있습니다. 이는 현재 설정된 경로에 해당 파일이 존재하지 않거나 또는 디렉토리가 존재하지 않기 때문에 나오는 에러입니다. 이 에러를 해결하기 위해선 아래 사항을 고려합니다. 2. 디렉토리 또는 파일이 실제로 존재하지 않는 경우 위 이미지는 'd'라는 변수에 임의로 잘못된 경로를 할당하여 read.csv 함수로 불러오려는 시도를 하였습니다. 이 때 이 오류를 해결하는 방법은 컴퓨터에 "c:/uu" 경로가 실제로 존재하는지 확인해야 합니다. 또는 실제로 디렉토리가 있지만 불러오려는 파일이 존재하는지를 확인합..

[R] 엑셀 파일 불러오기와 저장하기 (xls, xlsx)

엑셀 파일 불러오기와 저장하기(xls, xlsx) R로 데이터 처리할 시에는 직접 데이터를 입력하는 것보다 외부 파일을 불러오는 경우가 훨씬 많습니다. 보통 데이터는 엑셀 형식이나 텍스트 파일 형식으로 많이 저장이 됩니다. 일단 파일을 불러와야 뭘 어떻게든 해볼 수 있기 때문에 꼭 알고 있어야 하는 내용입니다. 1. 엑셀 파일 불러오기 1.1. readxl 패키지 - read_excel readxl 패키지를 설치 후 read_excel 이라는 함수를 이용하면 손쉽게 파일을 불러올 수 있습니다. read_excel 함수는 확장자가 xlsx 또는 xls 인 엑셀 파일 형식을 불러옵니다. read_xlsx 및 read_xls 함수를 직접 이용해도 사용 방법은 동일합니다. 경로명 지정시에는 getwd() 함수를..

[R] 반복문 사용하기 (for, while, break, next)

[R] 반복문 사용하기 (for, while, break, next) 다른 프로그래밍 언어와 마찬가지로 R에서도 반복문을 사용할 수 있습니다. 문법 자체는 크게 다를 바 없기 때문에 기존에 프로그래밍 언어 경험이 있는 분들은 쉽게 쓸 수 있습니다. 1. for 반복문 1.1. 용법 # data의 값을 x에 할당한 후 문장 수행 for( x in data) { 수행문장 } 1.2. 예시 1~5까지의 수를 print함수를 이용하여 각각 결과를 찍어보겠습니다. 변수 x에 1부터 5까지 각각 할당하면서 print(x) 함수로 각 결과가 나옵니다(변수명은 어떤 걸 써도 상관없음!). # 1부터 5까지 print for(x in 1:5){ print(x) } [1] 1 [1] 2 [1] 3 [1] 4 [1] 5 #..

[R] 벡터 생성과 인덱싱(Indexing) 및 추출

R 사용자라면 벡터(Vector)의 개념을 잘 이해하고 있는 것이 필수적입니다. R에서 벡터란 하나의 타입으로 지정된 데이터의 집합이라고 할 수 있습니다. 1. 벡터의 특징 - 한 가지 데이터 타입으로 저장 가능 - 기본적으로 열벡터 형태로 저장됨 - 벡터 연산으로 빠르게 처리 가능 2. 벡터 생성 벡터를 생성할 때는 c(...) 라는 문법을 사용합니다. 각 데이터 타입별 벡터를 생성해보겠습니다. # 1,2,3,4로 구성된 숫자형 벡터 생성 numeric_vector

[R] tidyr 패키지를 이용한 데이터 재구조(pivot_longer, pivot_wider)

1. pivot_longer : 데이터를 long format 으로 변경합니다. 즉, 행 수를 늘리고 열 수를 줄입니다. 1.1. 용법 pivot_longer( data, # data frame cols, # long format 으로 재구조할 칼럼 names_to = "name", # 재구조화된 항목의 칼럼명 values_to = "value", # 재구조화된 수치의 칼럼명 names_sep = NULL # names_to 에 여러 정보를 포함할 경우, 구분자를 기준으로 칼럼 이름을 분할하는 인자 values_drop_na = FALSE, # 결측치 존재시 포함여부 ... ) 1.2. 적용 tidyr의 기본 내장 데이터인 relig_income에는 특정 종교가 있는 사람들의 연간 수입에 대한 빈도 수 ..

반응형