10.5 데이터 프레임의 서브 세팅
지금까지 살펴본 바와 같이 데이터 프레임은 리스트 접근방법과 행렬 접근 방법으로 접근할 수 있습니다. 그런데 데이터 프레임에 접근할 결과를 하나의 변수에 할당연산자(<-
)를 이용하여 할당하면 데이터 프레임의 서브세팅(subsetting)이 됩니다.
데이터 프레임의 서브세팅은 컬럼 중심의 서브 세팅과 행 중심의 서브 세팅으로 나누어 볼 수 있습니다.
컬럼 중심의 서브 세팅을 selection(선택)이라 하고, 행 중심의 서브 세팅을 필터링(filtering) 이라고 합니다.
## 열을 서브세팅해 보겠습니다. : selection
2.3 <- trees[ , 2:3] # 2번째, 3번째 컬럼을 서브 세팅합니다.
trees.2.3 trees.
## Height Volume
## 1 70 10.3
## 2 65 10.3
## 3 63 10.2
## 4 72 16.4
## 5 81 18.8
## 6 83 19.7
## 7 66 15.6
## 8 75 18.2
## 9 80 22.6
## 10 75 19.9
## 11 79 24.2
## 12 76 21.0
## 13 76 21.4
## 14 69 21.3
## 15 75 19.1
## 16 74 22.2
## 17 85 33.8
## 18 86 27.4
## 19 71 25.7
## 20 64 24.9
## 21 78 34.5
## 22 80 31.7
## 23 74 36.3
## 24 72 38.3
## 25 77 42.6
## 26 81 55.4
## 27 82 55.7
## 28 80 58.3
## 29 80 51.5
## 30 80 51.0
## 31 87 77.0
## 행을 서브세팅해 보겠습니다. 필터링(filtering)
<- trees[trees$Height > 82, ] # Height 컬럼의 조건을 만족시키는 행만 필터링합니다.
trees.fil trees.fil
## Girth Height Volume
## 6 10.8 83 19.7
## 17 12.9 85 33.8
## 18 13.3 86 27.4
## 31 20.6 87 77.0
이러한 선택과 필터링은 데이터 관리를 위한
dplyr
패키지의select()
함수와filter()
함수로 더 정밀하게 수행할 수 있습니다.