6.3 요인 데이터의 저장 방식
여기서 수준의 순서는 “cement”, “earth”
순이며 알파벳 순서로 자동으로 1
, 2
가 배정된 것입니다. 즉, R은 이 벡터의 첫 번째 요소가 earth
이지만 cement
가 알파벳 순서 상 앞에 오기 때문에 cement
가 1 수준이 되며, 이 1
수준인 "cement"
에 정수값 1
을 할당하고, 2 수준인 "earth"
에는 정수값 2
를 배정하게 되는 것입니다.
이렇듯 요인의 데이터는 문자열로 보이지만, 실제로 저장되는 것은 정수형 숫자로 저장이 되는 것입니다.
R의 메모리에서 이러한 요인는 정수 (1, 2)로 표시되지만, 요인의 수준값 또한 정수보다 더 많은 정보를 제공하기 때문에 중요합니다. "cement"
와 "earth"
가 1
과 2
보다 더 많은 것을 설명하기 때문입니다. 어느 것이 “earth
”인가 궁금할 때 정수 데이터만으로는 알 수가 없습니다. 따라서 요인에는이 정보도 내장되어 있습니다.