4.1 데이터 세트 : Cars93

데이터의 시각화를 위한 전체적인 예제 데이터로 MASS 패키지에 수록되어 있는 Cars93 데이터 세트를 사용합니다.

항상 데이터의 분석 또는 시각화에 앞서 데이터의 구조를 확인하는 것이 첫 번째 작업입니다. 다음은 Cars93 데이터 세트의 구조를 확인하는 스크립트입니다.

library(MASS)
str(Cars93)
## 'data.frame':    93 obs. of  27 variables:
##  $ Manufacturer      : Factor w/ 32 levels "Acura","Audi",..: 1 1 2 2 3 4 4 4 4 5 ...
##  $ Model             : Factor w/ 93 levels "100","190E","240",..: 49 56 9 1 6 24 54 74 73 35 ...
##  $ Type              : Factor w/ 6 levels "Compact","Large",..: 4 3 1 3 3 3 2 2 3 2 ...
##  $ Min.Price         : num  12.9 29.2 25.9 30.8 23.7 14.2 19.9 22.6 26.3 33 ...
##  $ Price             : num  15.9 33.9 29.1 37.7 30 15.7 20.8 23.7 26.3 34.7 ...
##  $ Max.Price         : num  18.8 38.7 32.3 44.6 36.2 17.3 21.7 24.9 26.3 36.3 ...
##  $ MPG.city          : int  25 18 20 19 22 22 19 16 19 16 ...
##  $ MPG.highway       : int  31 25 26 26 30 31 28 25 27 25 ...
##  $ AirBags           : Factor w/ 3 levels "Driver & Passenger",..: 3 1 2 1 2 2 2 2 2 2 ...
##  $ DriveTrain        : Factor w/ 3 levels "4WD","Front",..: 2 2 2 2 3 2 2 3 2 2 ...
##  $ Cylinders         : Factor w/ 6 levels "3","4","5","6",..: 2 4 4 4 2 2 4 4 4 5 ...
##  $ EngineSize        : num  1.8 3.2 2.8 2.8 3.5 2.2 3.8 5.7 3.8 4.9 ...
##  $ Horsepower        : int  140 200 172 172 208 110 170 180 170 200 ...
##  $ RPM               : int  6300 5500 5500 5500 5700 5200 4800 4000 4800 4100 ...
##  $ Rev.per.mile      : int  2890 2335 2280 2535 2545 2565 1570 1320 1690 1510 ...
##  $ Man.trans.avail   : Factor w/ 2 levels "No","Yes": 2 2 2 2 2 1 1 1 1 1 ...
##  $ Fuel.tank.capacity: num  13.2 18 16.9 21.1 21.1 16.4 18 23 18.8 18 ...
##  $ Passengers        : int  5 5 5 6 4 6 6 6 5 6 ...
##  $ Length            : int  177 195 180 193 186 189 200 216 198 206 ...
##  $ Wheelbase         : int  102 115 102 106 109 105 111 116 108 114 ...
##  $ Width             : int  68 71 67 70 69 69 74 78 73 73 ...
##  $ Turn.circle       : int  37 38 37 37 39 41 42 45 41 43 ...
##  $ Rear.seat.room    : num  26.5 30 28 31 27 28 30.5 30.5 26.5 35 ...
##  $ Luggage.room      : int  11 15 14 17 13 16 17 21 14 18 ...
##  $ Weight            : int  2705 3560 3375 3405 3640 2880 3470 4105 3495 3620 ...
##  $ Origin            : Factor w/ 2 levels "USA","non-USA": 2 2 2 2 2 1 1 1 1 1 ...
##  $ Make              : Factor w/ 93 levels "Acura Integra",..: 1 2 4 3 5 6 7 9 8 10 ...

$ 다음에 변수명, 데이터 타입, 그리고 데이터 예를 보여주고 있습니다. (자세한 사항은 ? Cars93으로 출력되는 도움말을 확인합니다. 이 도움말에는 Cars93의 각 변수에 대한 설명 즉 메타 데이터를 제공합니다.)

Card93의 데이터들은 다음의 표 4.1 와 같습니다.

Table 4.1: Cars93 데이터 세트
Manufacturer Model Type Min.Price Price Max.Price MPG.city MPG.highway AirBags
Acura Integra Small 13 16 19 25 31 None
Acura Legend Midsize 29 34 39 18 25 Driver & Passenger
Audi 90 Compact 26 29 32 20 26 Driver only
Audi 100 Midsize 31 38 45 19 26 Driver & Passenger
BMW 535i Midsize 24 30 36 22 30 Driver only
Buick Century Midsize 14 16 17 22 31 Driver only

Cars93 데이터 세트는 27개의 변수와 93개의 관측치 데이터로 구성됩니다.