7.2 Untidy data
분석가에 의해 수집되지 않은 데이터의 사용은 생각보다 더 untidy data를 자주 대하게 만든다.
데이터는 다양한 방식으로 엉망이 될 수 있지만, tidyr
도구들로 타이디하게 될 수 있는 두 가지 방법에 대하여 살펴보기로 한다:
- 컬럼 제목들은 변수명이 아닌 값이다.
- 복수의 변수들이 하나의 컬럼에 저장되어 있다.
untidy 데이터 세트에 대하여 살펴보고, tidyr
패키지의 pivot_longer()
함수와 pivot_wider()
함수가 어떻게 그것들을 타이디하게 만들어 주는지 살펴보기로 한다.