6.8 요인의 발생빈도 계산

요인 개체는 범주형 변수로서 요인 개체의 연산은 주로 요인의 수준별 발생 빈도와 관련한 연산을 하게 됩니다. 이와 관련된 함수가 table()함수와 proportions() 함수입니다.

table() 함수는 교차 분류 요인(cross-classifying factor)을 사용하여 요인 수준의 각 조합8에 대한 발생 빈도표 즉 도수분포표(frequency table)를 반환합니다.

proportions() 함수(또는 prop.tables() 함수)는table()함수를 데이터 인수로 하여 상대도수분포표를 반환합니다.

candy_patterns <- factor(c("pattern", "pattern", "pattern", "plain",
                         "plain", "plain", "pattern", "pattern", "pattern",
                         "plain", "plain", "plain"))

# 요인의 수준별 도수분포표와 상대도수분포표를 구합니다.
table(candy_patterns)                  # candy_patterns 개체의 수준별 빈도수를 계산하여 
## candy_patterns
## pattern   plain 
##       6       6
                                       # 각 수준별 발생 빈도를 보여주는 "도수분포표"를 반환합니다.
proportions(table(candy_patterns))     # '도수 분포표'의 "상대 도수분포표"를 반환합니다.
## candy_patterns
## pattern   plain 
##     0.5     0.5

참고로table() 함수는 벡터에도 적용할 수 있습니다.


  1. 제2주 제7장의 데이터 프레임에서 좀 더 상세히 학습하겠습니다.↩︎