Chapter 13 데이터 불러오기와 저장하기
R로 데이터를 가져 오는 것은 매우 간단합니다. Stata 및 Systat의 경우 외부 패키지를 사용해야 합니다. SPSS와 SAS의 경우 Hmisc
패키지를 이용하면 편리합니다. 이러한 패키지를 구하고 설치하는 방법에 대한 정보는 패키지의 Quick-R 섹션을 참조하기 바랍니다.
데이터를 R로 올바르고 쉽게 가져오기 위해 다음의 사항들에 대하여 살펴보는 것도 유용할 수 있습니다.
- 스프레드 시트로 작업하는 경우 일반적으로 첫 번째 행은 컬럼 제목으로 사용하고, 첫 번째 열은 샘플링 단위를 식별하기 위한 데이터를 입력하는 것이 좋습니다.
- 공백이 있는 이름, 값 또는 항목을 피하는 것이 좋습니다. 그렇지 않으면 각 단어가 별도의 변수로 해석되어 데이터 세트의 한 줄당 요소 수의 불일치와 관련한 오류가 발생할 가능성이 높아집니다.
- 단어를 연결하려면. 공백 대신 단어 사이에 점(
.
)을 사용하는 것이 좋습니다. - 긴 이름보다는 짧은 이름이 좋습니다.
?
,$
,%
,^
,&
,*
,(
,)
,-
,#
,?
,,
,<
,>
,/
,|
,\
,[
,]
,{
, 그리고}
같은 기호가 포함된 이름은 사용하지 않는게 좋습니다.- 파일에 상관없는 컬럼이나
NA
가 추가되지 않도록 Excel 파일에 작성한 주석을 삭제하십시오. - 엑셀 데이터에 입력한 결측치 값을 확인하기 바랍니다. 이 값은 데이터를 불러오기 할 때
NA
로 처리해야 합니다.