13.3 데이터 확인하기

R에는 데이터의 개체 또는 데이터 세트의 내용을 확인하기 위한 함수들이 많이 있습니다.

# 현재의 작업 한경에 있는 개체의 목록을 확인합니다. : ls()
ls()
##   [1] "a"                  "arr.1"              "arr.2"             
##   [4] "arr.3"              "arr.4"              "arr.5"             
##   [7] "b"                  "candy_patterns"     "comp.index"        
##  [10] "conv1"              "conv2"              "conv3"             
##  [13] "conv4"              "conv5"              "d"                 
##  [16] "data"               "data1"              "data2"             
##  [19] "data3"              "date"               "date1"             
##  [22] "dates"              "Dates.Chr"          "days"              
##  [25] "df"                 "df.arr.3"           "df1"               
##  [28] "df2"                "df3"                "df4"               
##  [31] "df5"                "dia.mat1"           "dia.mat2"          
##  [34] "emp.data"           "emp.data1"          "emp.finaldata"     
##  [37] "emp.newdata"        "final"              "floor"             
##  [40] "floor_type"         "floor_type_ordered" "ftab.1"            
##  [43] "ftab.2"             "ftab.3"             "ftab.4"            
##  [46] "grade.cast"         "grade.full"         "grade.inner"       
##  [49] "grade.left"         "grade.molten"       "grade.right"       
##  [52] "i.mat"              "interviews"         "kbd.data"          
##  [55] "list_data"          "list_data1"         "list_data2"        
##  [58] "list1"              "list2"              "lst"               
##  [61] "mat"                "mat.names"          "mat1"              
##  [64] "mat2"               "mat3"               "mean.myvar1"       
##  [67] "memb_assoc"         "merged.list"        "mid"               
##  [70] "my.comp.df"         "my.dates"           "my.df"             
##  [73] "my.new.df"          "mycsv"              "mydata"            
##  [76] "mydata1"            "mydates"            "myString"          
##  [79] "num1"               "num2"               "ordered_floor"     
##  [82] "p"                  "pi"                 "result"            
##  [85] "s"                  "s1"                 "s2"                
##  [88] "s3"                 "s4"                 "s5"                
##  [91] "s6"                 "samp.data"          "st_data"           
##  [94] "sub_candy"          "sum_1_2"            "t.mat"             
##  [97] "tb"                 "today"              "trees"             
## [100] "trees.2.3"          "trees.fil"          "True"              
## [103] "uniq_d"             "univ.libr"          "v"                 
## [106] "v1"                 "v2"                 "v3"                
## [109] "var.1"              "var.2"              "var.3"             
## [112] "w"                  "w1"                 "w10"               
## [115] "w2"                 "w3"                 "w4"                
## [118] "w5"                 "w6"                 "w7"                
## [121] "w8"                 "w9"                 "x"                 
## [124] "x1"                 "x2"                 "x3"                
## [127] "x4"                 "x5"                 "x6"                
## [130] "x7"                 "y"                  "y1"                
## [133] "y2"                 "y3"                 "y5"                
## [136] "y6"                 "y7"                 "year_fct"          
## [139] "z"                  "z1"                 "z2"
# 현재의 작업 환경에 있는 개체를 제거합니다. : rm()
rm(list = ls())                                  # 현재의 작업 환경에 있는 모든 개체들을 제거합니다.

# rm()에 의해 mydata 개체가 제거되어서, 다시 파일을 불러옵니다.
mydata <- read.table("data/University_Library_20201028.csv", 
                     head = TRUE, 
                     sep = ",") 


# mydata에 있는 컬럼(변수)을 확인합니다. : names()
names(mydata)
## [1] "평가년도"   "도서관구분" "도서관코드" "면적"       "시군구"    
## [6] "장서수"     "사서수"     "대출권수"   "예산액"
# mydata의 구조를 확인합니다. : str()
str(mydata)
## 'data.frame':    1834 obs. of  9 variables:
##  $ 평가년도  : int  2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 ...
##  $ 도서관구분: chr  "LIBTYPE008" "LIBTYPE008" "LIBTYPE008" "LIBTYPE008" ...
##  $ 도서관코드: int  227 25 269 290 311 340 363 387 408 43 ...
##  $ 면적      : chr  "경북" "대전" "경기" "서울" ...
##  $ 시군구    : chr  "영천시" "서구" "여주시" "종로구" ...
##  $ 장서수    : int  20827 31054 114815 6326 756633 1306474 1611325 136147 4421 1379785 ...
##  $ 사서수    : int  1 1 2 1 6 11 30 2 0 20 ...
##  $ 대출권수  : int  2044 15745 10677 4647 53358 303522 187458 26534 495 123313 ...
##  $ 예산액    : num  3.44e+07 0.00 3.80e+07 7.50e+06 1.05e+08 ...
# mydata의 요인 컬럼의 요인 수준을 확인합니다. : levels()
mydata$"평가년도" <- as.factor(mydata$"평가년도")   # 평가년도 컬럼을 요인형으로 변환합니다.
levels(mydata$"평가년도")                          # 수준을 확인합니다.
## [1] "2014" "2015" "2016" "2017"
# mydata의 차원을 확인합니다. : dim()
dim(mydata)
## [1] 1834    9
# 개체의 클래스를 확인합니다. : class()
class(mydata)
## [1] "data.frame"
# mydata를 출력합니다.
# mydata                                           # 너무 데이터가 많아서 생략합니다.

# mydata의 첫 10개 행을 출력합니다. : head()
head(mydata, n = 10)
##    평가년도 도서관구분 도서관코드 면적 시군구  장서수 사서수 대출권수    예산액
## 1      2014 LIBTYPE008        227 경북 영천시   20827      1     2044  34412000
## 2      2014 LIBTYPE008         25 대전   서구   31054      1    15745         0
## 3      2014 LIBTYPE008        269 경기 여주시  114815      2    10677  38000000
## 4      2014 LIBTYPE008        290 서울 종로구    6326      1     4647   7500000
## 5      2014 LIBTYPE008        311 경남 김해시  756633      6    53358 105000000
## 6      2014 LIBTYPE008        340 서울 동작구 1306474     11   303522 740000000
## 7      2014 LIBTYPE008        363 대전 유성구 1611325     30   187458 300000000
## 8      2014 LIBTYPE008        387 경기 시흥시  136147      2    26534  35000000
## 9      2014 LIBTYPE008        408 전북 김제시    4421      0      495   6500000
## 10     2014 LIBTYPE008         43 경남 진주시 1379785     20   123313 320000000
# mydata의 마지막 5개 행을 출력합니다. : tail()
tail(mydata, n=5)
##      평가년도 도서관구분 도서관코드 면적 시군구  장서수 사서수 대출권수
## 1830     2017 LIBTYPE008         60 서울 성북구 2867238     28   429509
## 1831     2017 LIBTYPE008         61 세종   누락  554001      3    42765
## 1832     2017 LIBTYPE008         62 서울 종로구   48966      0     7408
## 1833     2017 LIBTYPE008         63 부산 영도구  470566      4    36713
## 1834     2017 LIBTYPE008         64 충북 청주시  217010      7    37760
##         예산액
## 1830 731938000
## 1831  91473000
## 1832  15000000
## 1833 120700000
## 1834  90000000
# mydata를 View화면에서 확인합니다 : View()
View(mydata)