10.3 데이터 프레임의 통계적 요약 정보
summary()
함수를 적용하여 통계 요약 및 데이터의 특성을 파악할 수도 있습니다.
summary(emp.data1) # emp.data의 통계 요약정보를 반환합니다.
## emp_id emp_name salary start_date
## Min. :1 Dan :1 Min. :515.2 Min. :2012-01-01
## 1st Qu.:2 Gary :1 1st Qu.:611.0 1st Qu.:2013-09-23
## Median :3 Michelle:1 Median :623.3 Median :2014-05-11
## Mean :3 Rick :1 Mean :664.4 Mean :2014-01-14
## 3rd Qu.:4 Ryan :1 3rd Qu.:729.0 3rd Qu.:2014-11-15
## Max. :5 Max. :843.2 Max. :2015-03-27
summary()
함수는 emp.data1
을 구성하고 있는 각 컬럼별로 통계적 요약정보를 반환합니다.
emp_id
, salary
그리고 start_date
등과 같은 숫자형과 날짜형 컬럼에 대하여는최솟갑, 최댓갑, 평균값 그리고 4분위수 등의 통계적 요약정보를 반환합니다. 반면에 문자형 컬럼의 경우는 데이터의 갯수, 클래스 그리고 모드 등을 반환합니다. 그리고 요인형 컬럼인 경우는 도수 분포(frequency)에 대한 정보를 반환합니다.