6.8 요인의 발생빈도 계산
요인 개체는 범주형 변수로서 요인 개체의 연산은 주로 요인의 수준별 발생 빈도와 관련한 연산을 하게 됩니다. 이와 관련된 함수가 table()함수와 proportions() 함수입니다.
table() 함수는 교차 분류 요인(cross-classifying factor)을 사용하여 요인 수준의 각 조합8에 대한 발생 빈도표 즉 도수분포표(frequency table)를 반환합니다.
proportions() 함수(또는 prop.tables() 함수)는table()함수를 데이터 인수로 하여 상대도수분포표를 반환합니다.
candy_patterns <- factor(c("pattern", "pattern", "pattern", "plain",
"plain", "plain", "pattern", "pattern", "pattern",
"plain", "plain", "plain"))
# 요인의 수준별 도수분포표와 상대도수분포표를 구합니다.
table(candy_patterns) # candy_patterns 개체의 수준별 빈도수를 계산하여 ## candy_patterns
## pattern plain
## 6 6
# 각 수준별 발생 빈도를 보여주는 "도수분포표"를 반환합니다.
proportions(table(candy_patterns)) # '도수 분포표'의 "상대 도수분포표"를 반환합니다.## candy_patterns
## pattern plain
## 0.5 0.5
참고로table() 함수는 벡터에도 적용할 수 있습니다.
제2주 제7장의 데이터 프레임에서 좀 더 상세히 학습하겠습니다.↩︎