10.5 데이터 프레임의 서브 세팅

지금까지 살펴본 바와 같이 데이터 프레임은 리스트 접근방법과 행렬 접근 방법으로 접근할 수 있습니다. 그런데 데이터 프레임에 접근할 결과를 하나의 변수에 할당연산자(<-)를 이용하여 할당하면 데이터 프레임의 서브세팅(subsetting)이 됩니다.

데이터 프레임의 서브세팅은 컬럼 중심의 서브 세팅과 행 중심의 서브 세팅으로 나누어 볼 수 있습니다.

컬럼 중심의 서브 세팅을 selection(선택)이라 하고, 행 중심의 서브 세팅을 필터링(filtering) 이라고 합니다.

## 열을 서브세팅해 보겠습니다. : selection
trees.2.3 <- trees[ , 2:3]                   # 2번째, 3번째 컬럼을 서브 세팅합니다.
trees.2.3
##    Height Volume
## 1      70   10.3
## 2      65   10.3
## 3      63   10.2
## 4      72   16.4
## 5      81   18.8
## 6      83   19.7
## 7      66   15.6
## 8      75   18.2
## 9      80   22.6
## 10     75   19.9
## 11     79   24.2
## 12     76   21.0
## 13     76   21.4
## 14     69   21.3
## 15     75   19.1
## 16     74   22.2
## 17     85   33.8
## 18     86   27.4
## 19     71   25.7
## 20     64   24.9
## 21     78   34.5
## 22     80   31.7
## 23     74   36.3
## 24     72   38.3
## 25     77   42.6
## 26     81   55.4
## 27     82   55.7
## 28     80   58.3
## 29     80   51.5
## 30     80   51.0
## 31     87   77.0
## 행을 서브세팅해 보겠습니다. 필터링(filtering)
trees.fil <- trees[trees$Height > 82,  ]     # Height 컬럼의 조건을 만족시키는 행만 필터링합니다.
trees.fil
##    Girth Height Volume
## 6   10.8     83   19.7
## 17  12.9     85   33.8
## 18  13.3     86   27.4
## 31  20.6     87   77.0

이러한 선택과 필터링은 데이터 관리를 위한 dplyr 패키지의 select() 함수와 filter() 함수로 더 정밀하게 수행할 수 있습니다.