7.2 Untidy data

분석가에 의해 수집되지 않은 데이터의 사용은 생각보다 더 untidy data를 자주 대하게 만든다.

데이터는 다양한 방식으로 엉망이 될 수 있지만, tidyr 도구들로 타이디하게 될 수 있는 두 가지 방법에 대하여 살펴보기로 한다:

  • 컬럼 제목들은 변수명이 아닌 값이다.
  • 복수의 변수들이 하나의 컬럼에 저장되어 있다.

untidy 데이터 세트에 대하여 살펴보고, tidyr 패키지의 pivot_longer() 함수와 pivot_wider() 함수가 어떻게 그것들을 타이디하게 만들어 주는지 살펴보기로 한다.