9.5 시간대
시간대는 엄청나게 복잡한 주제인데, 지정학적 요소들과 상호작용이 있기 때문이다. 다행히 데이터 분석을 할 때 시간대가 항상 중요하지는 않기 때문에 세부사항을 모두 파고들지 않아도 되지만, 정면으로 맞서야 하는 문제가 몇 개 있다.
첫 번째 문제는 일상적인 시간대 이름은 모호하다는 것이다. 예를 들어 여러분이 미국인이라면 아마 EST, 즉 동부 표준시가 익숙할 것이다. 그러나 호주와 캐나다에도 EST가 있다! 혼란을 방지하기 위해, R은 국제 표준 IANA 시간대를 사용한다. 이는 일반적으로 ’<대륙>/<도시>’ 형태로 ’/’를 쓰는 일관된 명명 체계를 사용한다 (모든 국가가 대륙에 위치하는 것은 아니기 때문에 몇 가지 예외도 있다). 예를 들면 ’America/New_York‘, ’Europe/Paris‘와 ’Pacific/Auckland‘ 등이 있다.
시간대가 국가, 혹은 국가 내 지역과 관련되었다고 일반적으로 생각하면 왜 시간대가 도시를 사용하는지 궁금할 것이다. 이는 IANA 데이터베이스가 시간대 규칙을 수십 년 분량이나 기록해야 하기 때문이다. 수십 년 사이에 국가 이름은 꽤 자주 변경(또는 분리)되지만, 도시의 이름은 유지되는 편이다. 또 다른 문제는 이름은 현재의 행동뿐만 아니라 전체 역사를 반영해야 한다는 것이다. 예를 들어 ’America/New_York‘과 ’America/Detroit‘ 시간대가 있다. 두 도시는 현재 모두 동부 표준시간을 사용하지만 (디트로이트가 위치한) 미시간주는 1969-1972’에, 일광절약제를 따르지 않았기 때문에 이름이 따로 필요한 것이다. 이러한 이야기들이 있는 원시 시간대 데이터베이스(http://www.iana.org/time-zones)를 읽어볼 만하다!
Sys.timezone()
를 사용해서 현재 R이 인식하고 있는 시간대를 알아볼 수 있다. (우리나라 시간대는 “Asia/Seoul”이다.)
Sys.timezone()
## [1] "Asia/Seoul"
(R이 모르는 경우 NA
가 나올 것이다.)
그리고 OlsonNames()
를 사용해서 모든 시간대 이름의 전체 목록을 볼 수 있다.
length(OlsonNames())
## [1] 594
head(OlsonNames())
## [1] "Africa/Abidjan" "Africa/Accra" "Africa/Addis_Ababa"
## [4] "Africa/Algiers" "Africa/Asmara" "Africa/Asmera"
R에 있어서, 시간대는 출력 제어만 하는 데이트-타임형의 한 속성이다. 예를 들어 이 세 가지 객체는 같은 시점을 나타낸다.
<- ymd_hms("2015-06-01 12:00:00", tz = "America/New_York")) (x1
## [1] "2015-06-01 12:00:00 EDT"
<- ymd_hms("2015-06-01 18:00:00", tz = "Europe/Copenhagen")) (x2
## [1] "2015-06-01 18:00:00 CEST"
<- ymd_hms("2015-06-02 04:00:00", tz = "Pacific/Auckland")) (x3
## [1] "2015-06-02 04:00:00 NZST"
이들이 같은 시점이라는 것을 뺄셈을 사용하여 확인할 수 있다.
- x2 x1
## Time difference of 0 secs
- x3 x1
## Time difference of 0 secs
별도 명시가 없는 한, lubridate 는 항상 UTC를 사용한다. UTC(Coordinated Universal Time)는 과학계에서 사용하는 표준 시간대이며 그 전신인 GMT(그리니치 표준시)와 거의 같다. UTC는 DST가 없는데, 이로 인해 계산에 용이한 표현 방법이 된다. c()
와 같이 데이트-타임형을 조합하는 연산은 종종 시간대를 제거한다. 이 경우 데이트-타임형은 현지 시간대로 표시된다.
<- c(x1, x2, x3)
x4 x4
## [1] "2015-06-01 12:00:00 EDT" "2015-06-01 12:00:00 EDT"
## [3] "2015-06-01 12:00:00 EDT"
두 가지 방법으로 시간대를 변경할 수 있다.
시각을 유지하고 표시 방법을 변경한다. 시각은 맞지만 더 자연스러운 표시를 원한다면 이 방법을 써라.
<- with_tz(x4, tzone = "Australia/Lord_Howe") x4a x4a
## [1] "2015-06-02 02:30:00 +1030" "2015-06-02 02:30:00 +1030" ## [3] "2015-06-02 02:30:00 +1030"
- x4 x4a
## Time differences in secs ## [1] 0 0 0
(이 예시는 시간대의 다른 어려운 점을 보여준다. 시간대 오프셋이 모두 정수-시 (integer hour) 인 것은 아니다!)
기본 시각을 변경한다. 시각에 잘못된 시간대가 붙어 있어서 이를 수정해야 한다면 이 방법을 사용하라.
<- force_tz(x4, tzone = "Australia/Lord_Howe") x4b x4b
## [1] "2015-06-01 12:00:00 +1030" "2015-06-01 12:00:00 +1030" ## [3] "2015-06-01 12:00:00 +1030"
- x4 x4b
## Time differences in hours ## [1] -14.5 -14.5 -14.5