6.3 요인 데이터의 저장 방식

여기서 수준의 순서“cement”, “earth”순이며 알파벳 순서로 자동으로 1, 2가 배정된 것입니다. 즉, R은 이 벡터의 첫 번째 요소가 earth 이지만 cement가 알파벳 순서 상 앞에 오기 때문에 cement1 수준이 되며, 이 1수준인 "cement"에 정수값 1을 할당하고, 2 수준인 "earth"에는 정수값 2를 배정하게 되는 것입니다.

이렇듯 요인의 데이터는 문자열로 보이지만, 실제로 저장되는 것은 정수형 숫자로 저장이 되는 것입니다.

R의 메모리에서 이러한 요인는 정수 (1, 2)로 표시되지만, 요인의 수준값 또한 정수보다 더 많은 정보를 제공하기 때문에 중요합니다. "cement""earth"12 보다 더 많은 것을 설명하기 때문입니다. 어느 것이 “earth”인가 궁금할 때 정수 데이터만으로는 알 수가 없습니다. 따라서 요인에는이 정보도 내장되어 있습니다.