20.1 일변량 연속형 데이터 그래프

플롯 함수의 데이터 인수가 1개 이며, 그 데이터가 연속형(정수형, 실수형 등)인 경우의 그래프입니다.

이러한 유형의 변수의 시각화를 위한 다양한 그래프 함수가 있는데 이 절에서는 다음과 같은 유형의 그래프에 대하여 살펴보겠습니다.

  • 히스토그램(Histogram)

  • 박스 플롯(Box and whisker plot)

  • 줄기 잎 플롯(Stem and leaf plot)

20.1.1 히스토그램

연속형 데이터 x단계(또는 구간, bins)로 분할하여 각 구간별 데이터의 빈도수(또는 합계, 평균 등)을 시각화하는 것입니다.

base 의 hist() 함수를 사용합니다.

다음의 예는 Cars93 데이터 세트의 MPG.highway 변수를 히스토그램으로 작성하는 것입니다.

# hist() 함수를 이용하여 히스토그램을 작성합니다.
library(MASS)
class(Cars93$MPG.highway)                    # Cars93$MPG.highway 컬럼의 클래스를 확인합니다.
## [1] "integer"
hist(Cars93$MPG.highway, main = " 히스토그램 : hist()")

? hist()를 이용하여 자세한 도움말을 참고하기 바랍니다.

20.1.2 박스 플롯

박스 플롯은 연속형 데이터 x에 대한 통계적 요약 정보인 summary()의 결과를 시각화하는 것입니다.

base의 boxplot() 함수를 사용합니다.

다음의 예는 Cars93 데이터 세트의 MPG.highway 변수를 박스 플롯으로 작성하는 것입니다.

# Cars93$MPG.highway의 통계적 요약 정보를 확인합니다.
library(MASS)
summary(Cars93$MPG.highway)               
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   26.00   28.00   29.09   31.00   50.00
# boxplot() 함수를 이용하여 박스 플롯을 작성합니다.
boxplot(Cars93$MPG.highway, main = "박스 플롯 : boxplot()")

? boxplot()을 이용하여 자세한 도움말을 참고하기 바랍니다.

20.1.3 줄기 잎 플롯

줄기 잎 플롯은 연속형 데이터 x를 표 형태와 그래프 형태의 혼합된 방법으로 시각화하는 것입니다.

#  줄기 잎 플롯 : stem() 
library(MASS)
stem(Cars93$MPG.highway)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   2 | 00112233334444
##   2 | 55555555666666666667777778888888888999999
##   3 | 000000000111111123333333444
##   3 | 6667778
##   4 | 13
##   4 | 6
##   5 | 0

? stem()을 이용하여 자세한 도움말을 참고하기 바랍니다.