20.1 일변량 연속형 데이터 그래프
플롯 함수의 데이터 인수가 1개 이며, 그 데이터가 연속형(정수형, 실수형 등)인 경우의 그래프입니다.
이러한 유형의 변수의 시각화를 위한 다양한 그래프 함수가 있는데 이 절에서는 다음과 같은 유형의 그래프에 대하여 살펴보겠습니다.
히스토그램(Histogram)
박스 플롯(Box and whisker plot)
줄기 잎 플롯(Stem and leaf plot)
20.1.1 히스토그램
연속형 데이터 x
를 단계(또는 구간, bins)로 분할하여 각 구간별 데이터의 빈도수(또는 합계, 평균 등)을 시각화하는 것입니다.
base 의 hist()
함수를 사용합니다.
다음의 예는 Cars93
데이터 세트의 MPG.highway
변수를 히스토그램으로 작성하는 것입니다.
# hist() 함수를 이용하여 히스토그램을 작성합니다.
library(MASS)
class(Cars93$MPG.highway) # Cars93$MPG.highway 컬럼의 클래스를 확인합니다.
## [1] "integer"
hist(Cars93$MPG.highway, main = " 히스토그램 : hist()")
? hist()
를 이용하여 자세한 도움말을 참고하기 바랍니다.
20.1.2 박스 플롯
박스 플롯은 연속형 데이터 x
에 대한 통계적 요약 정보인 summary()
의 결과를 시각화하는 것입니다.
base의 boxplot()
함수를 사용합니다.
다음의 예는 Cars93
데이터 세트의 MPG.highway
변수를 박스 플롯으로 작성하는 것입니다.
# Cars93$MPG.highway의 통계적 요약 정보를 확인합니다.
library(MASS)
summary(Cars93$MPG.highway)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 20.00 26.00 28.00 29.09 31.00 50.00
# boxplot() 함수를 이용하여 박스 플롯을 작성합니다.
boxplot(Cars93$MPG.highway, main = "박스 플롯 : boxplot()")
? boxplot()
을 이용하여 자세한 도움말을 참고하기 바랍니다.
20.1.3 줄기 잎 플롯
줄기 잎 플롯은 연속형 데이터 x
를 표 형태와 그래프 형태의 혼합된 방법으로 시각화하는 것입니다.
# 줄기 잎 플롯 : stem()
library(MASS)
stem(Cars93$MPG.highway)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 2 | 00112233334444
## 2 | 55555555666666666667777778888888888999999
## 3 | 000000000111111123333333444
## 3 | 6667778
## 4 | 13
## 4 | 6
## 5 | 0
? stem()
을 이용하여 자세한 도움말을 참고하기 바랍니다.