2.3 환경(Environment)
RStudio 환경 탭은 콘솔 화면 오른쪽에 있는 편리한 기능이다. 환경(Environment), 히스토리(History), 연결(Connections) 그리고 튜토리얼(Tutorials) 등의 네 가지 탭이 있다. 환경 탭은 그림 2.5에 나와 있다.
R에서 환경은 작업 공간이다. 환경에 개체와 데이터를 저장할 수 있다. 예제에서는 단순히 글로벌 환경을 사용하지만 R의 환경은 풍부한 주제가 될 수 있으며 고급 R 프로그래밍 기술에 사용된다는 점을 알고 있어야 한다. 예를 들어, 각 R 함수 (재사용 가능한 코드 단위)는 자체 환경을 갖게 되고 프로그래머는 다양한 목적을 위해 자체 환경을 할당할 수 있다. 그러나 대부분의 사람들은 이런 방식으로 환경의 미묘함에 대해 그렇게 걱정할 필요가 없다.
지금은 아직 개체를 만들지 않았거나 데이터를 로드하지 않았기 때문에 환경이 완전히 비어 있어야 한다. 변수를 만들어 변경해 보자. 콘솔을 클릭하고 “Hello World” 문자열을 greeting
이라는 개체에 할당하여 개체를 만든다.
greeting <- "Hello World"
환경 창에서 무슨 일이 일어 났는지 보기 전에 이 새로운 구문에 대해 먼저 살펴 보기로 한다. 위의 구문을 바로 시작하여 분해해 보자.
“Hello World”는 처음에 입력 한 것과 동일한 문자열이다. 문자열은 따옴표로 묶인 문자 집합이다. 숫자와 마찬가지로 문자열은 일종의 데이터이다. 문자열 왼쪽에 있는 <-
기호 집합을 할당 연산자라고 한다. 할당 연산자의 임무는 개체에 데이터 값을 할당하는 것이다.
여기에 있는 개체는 할당 연산자의 왼쪽에 있으며 greeting
이라는 이름이 지정되어 있다. 위의 코드를 입력하고 Enter 키를 눌러 greeting
개체에 “Hello World”값을 할당하면 이 개체에 관한 정보가 Global Environment에 들어 간다. 이제 그림 2.6과 같이 화면의 오른쪽 영역에서 글로벌 환경에서 이러한 내용을 확인할 수 있다.
데이터 분석을 수행할 때 작업의 현재 상태를 확인할 수 있게 해 주므로 매우 편리한 기능이라 할 수 있다.결과를 한 눈에 볼 수 있으며, 예상하는 변수가 올바른지 확인할 수도 있다. 이 기능만으로도 RStudio는 데이터 프로그래밍 키트에서는 필수 도구가 되는 것이다. 그러나 더 많은 것이 있다.
환경 위젯에는 작업을 저장하고 다른 환경을 여는 기능도 있다. 따라서 하루 종일 데이터 문제와 씨름하고, 모든 데이터와 변수를 저장하려면 플로피 디스크(저장) 아이콘을 사용하면 됩니다. 환경을 열려면 폴더 아이콘을 사용한 다음 저장한 환경 파일로 이동하면 된다.
2.3.1 데이터 불러오기
많은 사람들에게 도움이 될 또 다른 특징은 SAS 및 Excel과 같은 다른 데이터 분석 도구에서 데이터를 가져올 수 있는 능력이다. Import Dataset
버튼을 클릭하면 그림 2.7과 같이 다양한 옵션이 표시된다.
이 옵션을 클릭하면 이러한 소스에서 RStudio로 데이터를 쉽게 가져 오는데 사용할 수 있는 가져 오기 마법사(import wizard)가 시작된다.
이는 다음과 같은 R 코드의 작업과 동일하다.
library(readxl)
<- read_excel("data/dormitory.xls")
dormitory View(dormitory)
마지막으로이 화면에는 환경에서 모든 것을 지울 수있는 친숙한 빗자루 아이콘이 있습니다.
2.3.2 데이터 세트
가져오기 기능을 설명하기 위해 data.go.kr의 대학재정알리미 사이트(http://uniarlimi.kasfo.or.kr/totalAnno/dormitory)에서 전국 대학의 기숙사 현황 데이터 세트를 다운로드했다.대학재정 알리미 웹 사이트는 그림 2.8에 나와 있다.
이 데이터는 Excel에 저장되며 데이터 세트 가져 오기 도구를 사용하여 데이터 세트를 R로 가져와서 검사할 수 있다. 이 예제를 따르려면 위의 URL을 방문하여 웹 페이지에서 xlsx 파일을 다운로드한다.
data 폴더에서 dormitory.xlsx
라는 파일을 찾는다. 이것은 우리가 살펴볼 Excel 형식의 데이터 세트이다. 이제 RStudio에서 “Import Dataset” 버튼을 클릭하고 “From Excel…”을 선택한다. “찾아보기” 버튼을 클릭한다. 이 화면의 예는 그림 2.9를 참조하기 바란다.
다음으로 dormitory.xlsx
라는 Excel 파일이 있는 위치로 이동한다. 화면은 데이터의 처음 몇 행과 그림 2.10과 같이 인터페이스를 사용하지 않고 나중에 이 데이터 세트를 다시 가져오는 데 사용할 수 있는 복사 할 수있는 코드로 채워진다.
“Import”를 클릭하면 Import Dataset이 사라지고 메인 RStudio IDE 화면으로 돌아간다.. 그러나 그림 2.11에서 볼 수 있듯이 많은 것이 변경 될 것이다.
데이터가 우리 화면에 나타난 것을 볼 수 있다. 이 새 화면의 컨트롤을 사용하여 데이터를 필터링하고 데이터 세트를 검색할 수 있다. 데이터 세트는 또한 우리의 Global Environment에도 나타났으며, 자동으로 dormitory로 이름이 지정되었다. 이것은 R 코드에서이 데이터 세트를 참조하는 데 사용할 이름이다. 예를 들어 콘솔에서 R의 head()
함수를 사용하여 데이터의 처음 6개의 행을 볼 수 있다.
그림 2.12에 표시된 출력은 이 데이터 세트에 대한 더 많은 정보를 제공한다. 데이터와 R에 대해 더 많이 배우면 데이터 세트 이름을 분석에 대한 입력으로 사용할 수 있다.