6.8 요인의 발생빈도 계산
요인 개체는 범주형 변수로서 요인 개체의 연산은 주로 요인의 수준별 발생 빈도와 관련한 연산을 하게 됩니다. 이와 관련된 함수가 table()
함수와 proportions()
함수입니다.
table()
함수는 교차 분류 요인(cross-classifying factor)을 사용하여 요인 수준의 각 조합8에 대한 발생 빈도표 즉 도수분포표(frequency table)를 반환합니다.
proportions()
함수(또는 prop.tables()
함수)는table()
함수를 데이터 인수로 하여 상대도수분포표를 반환합니다.
<- factor(c("pattern", "pattern", "pattern", "plain",
candy_patterns "plain", "plain", "pattern", "pattern", "pattern",
"plain", "plain", "plain"))
# 요인의 수준별 도수분포표와 상대도수분포표를 구합니다.
table(candy_patterns) # candy_patterns 개체의 수준별 빈도수를 계산하여
## candy_patterns
## pattern plain
## 6 6
# 각 수준별 발생 빈도를 보여주는 "도수분포표"를 반환합니다.
proportions(table(candy_patterns)) # '도수 분포표'의 "상대 도수분포표"를 반환합니다.
## candy_patterns
## pattern plain
## 0.5 0.5
참고로table()
함수는 벡터에도 적용할 수 있습니다.
제2주 제7장의 데이터 프레임에서 좀 더 상세히 학습하겠습니다.↩︎