13.3 데이터 확인하기
R에는 데이터의 개체 또는 데이터 세트의 내용을 확인하기 위한 함수들이 많이 있습니다.
# 현재의 작업 한경에 있는 개체의 목록을 확인합니다. : ls()
ls()
## [1] "a" "arr.1" "arr.2"
## [4] "arr.3" "arr.4" "arr.5"
## [7] "b" "candy_patterns" "comp.index"
## [10] "conv1" "conv2" "conv3"
## [13] "conv4" "conv5" "d"
## [16] "data" "data1" "data2"
## [19] "data3" "date" "date1"
## [22] "dates" "Dates.Chr" "days"
## [25] "df" "df.arr.3" "df1"
## [28] "df2" "df3" "df4"
## [31] "df5" "dia.mat1" "dia.mat2"
## [34] "emp.data" "emp.data1" "emp.finaldata"
## [37] "emp.newdata" "final" "floor"
## [40] "floor_type" "floor_type_ordered" "ftab.1"
## [43] "ftab.2" "ftab.3" "ftab.4"
## [46] "grade.cast" "grade.full" "grade.inner"
## [49] "grade.left" "grade.molten" "grade.right"
## [52] "i.mat" "interviews" "kbd.data"
## [55] "list_data" "list_data1" "list_data2"
## [58] "list1" "list2" "lst"
## [61] "mat" "mat.names" "mat1"
## [64] "mat2" "mat3" "mean.myvar1"
## [67] "memb_assoc" "merged.list" "mid"
## [70] "my.comp.df" "my.dates" "my.df"
## [73] "my.new.df" "mycsv" "mydata"
## [76] "mydata1" "mydates" "myString"
## [79] "num1" "num2" "ordered_floor"
## [82] "p" "pi" "result"
## [85] "s" "s1" "s2"
## [88] "s3" "s4" "s5"
## [91] "s6" "samp.data" "st_data"
## [94] "sub_candy" "sum_1_2" "t.mat"
## [97] "tb" "today" "trees"
## [100] "trees.2.3" "trees.fil" "True"
## [103] "uniq_d" "univ.libr" "v"
## [106] "v1" "v2" "v3"
## [109] "var.1" "var.2" "var.3"
## [112] "w" "w1" "w10"
## [115] "w2" "w3" "w4"
## [118] "w5" "w6" "w7"
## [121] "w8" "w9" "x"
## [124] "x1" "x2" "x3"
## [127] "x4" "x5" "x6"
## [130] "x7" "y" "y1"
## [133] "y2" "y3" "y5"
## [136] "y6" "y7" "year_fct"
## [139] "z" "z1" "z2"
# 현재의 작업 환경에 있는 개체를 제거합니다. : rm()
rm(list = ls()) # 현재의 작업 환경에 있는 모든 개체들을 제거합니다.
# rm()에 의해 mydata 개체가 제거되어서, 다시 파일을 불러옵니다.
<- read.table("data/University_Library_20201028.csv",
mydata head = TRUE,
sep = ",")
# mydata에 있는 컬럼(변수)을 확인합니다. : names()
names(mydata)
## [1] "평가년도" "도서관구분" "도서관코드" "면적" "시군구"
## [6] "장서수" "사서수" "대출권수" "예산액"
# mydata의 구조를 확인합니다. : str()
str(mydata)
## 'data.frame': 1834 obs. of 9 variables:
## $ 평가년도 : int 2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 ...
## $ 도서관구분: chr "LIBTYPE008" "LIBTYPE008" "LIBTYPE008" "LIBTYPE008" ...
## $ 도서관코드: int 227 25 269 290 311 340 363 387 408 43 ...
## $ 면적 : chr "경북" "대전" "경기" "서울" ...
## $ 시군구 : chr "영천시" "서구" "여주시" "종로구" ...
## $ 장서수 : int 20827 31054 114815 6326 756633 1306474 1611325 136147 4421 1379785 ...
## $ 사서수 : int 1 1 2 1 6 11 30 2 0 20 ...
## $ 대출권수 : int 2044 15745 10677 4647 53358 303522 187458 26534 495 123313 ...
## $ 예산액 : num 3.44e+07 0.00 3.80e+07 7.50e+06 1.05e+08 ...
# mydata의 요인 컬럼의 요인 수준을 확인합니다. : levels()
$"평가년도" <- as.factor(mydata$"평가년도") # 평가년도 컬럼을 요인형으로 변환합니다.
mydatalevels(mydata$"평가년도") # 수준을 확인합니다.
## [1] "2014" "2015" "2016" "2017"
# mydata의 차원을 확인합니다. : dim()
dim(mydata)
## [1] 1834 9
# 개체의 클래스를 확인합니다. : class()
class(mydata)
## [1] "data.frame"
# mydata를 출력합니다.
# mydata # 너무 데이터가 많아서 생략합니다.
# mydata의 첫 10개 행을 출력합니다. : head()
head(mydata, n = 10)
## 평가년도 도서관구분 도서관코드 면적 시군구 장서수 사서수 대출권수 예산액
## 1 2014 LIBTYPE008 227 경북 영천시 20827 1 2044 34412000
## 2 2014 LIBTYPE008 25 대전 서구 31054 1 15745 0
## 3 2014 LIBTYPE008 269 경기 여주시 114815 2 10677 38000000
## 4 2014 LIBTYPE008 290 서울 종로구 6326 1 4647 7500000
## 5 2014 LIBTYPE008 311 경남 김해시 756633 6 53358 105000000
## 6 2014 LIBTYPE008 340 서울 동작구 1306474 11 303522 740000000
## 7 2014 LIBTYPE008 363 대전 유성구 1611325 30 187458 300000000
## 8 2014 LIBTYPE008 387 경기 시흥시 136147 2 26534 35000000
## 9 2014 LIBTYPE008 408 전북 김제시 4421 0 495 6500000
## 10 2014 LIBTYPE008 43 경남 진주시 1379785 20 123313 320000000
# mydata의 마지막 5개 행을 출력합니다. : tail()
tail(mydata, n=5)
## 평가년도 도서관구분 도서관코드 면적 시군구 장서수 사서수 대출권수
## 1830 2017 LIBTYPE008 60 서울 성북구 2867238 28 429509
## 1831 2017 LIBTYPE008 61 세종 누락 554001 3 42765
## 1832 2017 LIBTYPE008 62 서울 종로구 48966 0 7408
## 1833 2017 LIBTYPE008 63 부산 영도구 470566 4 36713
## 1834 2017 LIBTYPE008 64 충북 청주시 217010 7 37760
## 예산액
## 1830 731938000
## 1831 91473000
## 1832 15000000
## 1833 120700000
## 1834 90000000
# mydata를 View화면에서 확인합니다 : View()
View(mydata)