데이터 분석/R 데이터 처리 & 분석

R 데이터프레임(data.frame)의 모든 것(행추가,열추가,삭제)

love R 2020. 1. 14. 00:54
반응형

 

 

R 데이터프레임(data.frame)의 모든 것(행추가,열추가)

이번에는 R 데이터프레임에 대해 알아볼 것인데요.
데이터프레임은 R에서 가장 많이 쓰고 중요한 데이터 구조입니다.
지난 포스팅에서 데이터프레임에 대해 간단하게 다루었는데, 이번 글은 데이터프레임만을 다루는 주제로 정했습니다.

 

 

1. 데이터프레임의 생성

데이터프레임을 생성하기 위해서는 data.frame() 이라는 함수를 쓰게 됩니다.
생성방법: data.frame(벡터,벡터,벡터...)

벡터 생성과 관련된 포스팅은 jobmanager1.tistory.com/71 을 참고해주세요.

 

[R] 벡터 생성과 인덱싱(Indexing) 및 추출

R 사용자라면 벡터(Vector)의 개념을 잘 이해하고 있는 것이 필수적입니다. R에서 벡터란 하나의 타입으로 지정된 데이터의 집합이라고 할 수 있습니다. 1. 벡터의 특징 - 한 가지 데이터 타입으로 �

jobmanager1.tistory.com

 

 

 

 

# 데이터프레임은 '열'을 기준으로 생성됨(중요★)
test <- data.frame(var1=c(1,2,3), var2=c(8,9,10))
test

 

 

2. 데이터프레임 행(row) 추가

 

2.1. 행 추가 방법

이제 위에서 만든 test라는 데이터에 행을 추가할 것입니다.

변수에 4와 11을 각각 추가하여 네번째 행을 만들어봅시다.

 

# 4행에 데이터 추가하기
# test[4, ] 은 test의 4번째 행을 가리키는 표현입니다.

test[4, ] <- c(4, 11)
test

 

 

 

3. 데이터프레임 열(column) 추가

데이터프레임의 열 추가도 위와 비슷한 방식으로 하면 됩니다.

test데이터에 var100 이라는 변수에 100, 200, 300, 400을 추가하고 싶습니다.

 

 

test[ , "var100" ] <- c(100,200,300,400)
test

 

 

4. 데이터프레임 열 삭제

변수 생성이 있으면 삭제하는 방법도 있습니다.
test 데이터에서 var1 변수를 제거하려면 -색인명을 붙여주면 됩니다.

 

# test[  , -1] 은 첫번째 열을 삭제를 의미함
test[  ,-1]

 

 

위와 같은 방법도 있고 남겨놓을 열을 선택하는 방법도 있습니다.

다수의 열을 남겨 놓을 때는 벡터를 이용합니다!

# 두번째, 세번째 열을 선택
test[  ,c(2,3) ]

# 연속적으로 열을 선택 또는 삭제는 : 를 이용할 수 있음
test[  , 2:3]

 

 

 

4. 데이터프레임 행 삭제

행 삭제도 위와 같은 방식으로 비슷하게 진행합니다.

 

# test[ -1, ] 은 첫번째 행 삭제를 의미함
test[ -1, ]

# test[ c(2,3,4) , ] 은 2~4행 선택을 의미함
test[ c(2,3,4), ]


# 연속적으로 행을 선택 또는 삭제는 : 를 이용할 수 있음
test[2:4, ]

 

 

 

행/열 추가 및 삭제는 dplyr 패키지를 이용하거나 subset 함수를 이용하여 할 수도 있습니다.

포스팅 해놓았으니 관심있으신 분들은 함께 봐주세요.

다른 함수를 이용해 행/열을 다룰 수 있지만, 이번에 소개한 방법이 가장 기본이 되는 것이기 때문에 꼭 숙지하시기 바랍니다!

 

 

 

 

 

 

반응형