Chapter 13 데이터 불러오기와 저장하기

R로 데이터를 가져 오는 것은 매우 간단합니다. StataSystat의 경우 외부 패키지를 사용해야 합니다. SPSS와 SAS의 경우 Hmisc 패키지를 이용하면 편리합니다. 이러한 패키지를 구하고 설치하는 방법에 대한 정보는 패키지의 Quick-R 섹션을 참조하기 바랍니다.

데이터를 R로 올바르고 쉽게 가져오기 위해 다음의 사항들에 대하여 살펴보는 것도 유용할 수 있습니다.

  • 스프레드 시트로 작업하는 경우 일반적으로 첫 번째 행은 컬럼 제목으로 사용하고, 첫 번째 열은 샘플링 단위를 식별하기 위한 데이터를 입력하는 것이 좋습니다.
  • 공백이 있는 이름, 값 또는 항목을 피하는 것이 좋습니다. 그렇지 않으면 각 단어가 별도의 변수로 해석되어 데이터 세트의 한 줄당 요소 수의 불일치와 관련한 오류가 발생할 가능성이 높아집니다.
  • 단어를 연결하려면. 공백 대신 단어 사이에 점(.)을 사용하는 것이 좋습니다.
  • 긴 이름보다는 짧은 이름이 좋습니다.
  • ?, $, %, ^, &, *, (,),-, #,? ,,, <,>, /, |, \, [,], {, 그리고 }같은 기호가 포함된 이름은 사용하지 않는게 좋습니다.
  • 파일에 상관없는 컬럼이나 NA가 추가되지 않도록 Excel 파일에 작성한 주석을 삭제하십시오.
  • 엑셀 데이터에 입력한 결측치 값을 확인하기 바랍니다. 이 값은 데이터를 불러오기 할 때 NA로 처리해야 합니다.