14 3개 이상 변수의 다변량 그래프

실전 업무에서는 다변량 데이터(multivariate data set)를 사용하는 경우가 다반사입니다. 그리고 분석업무 초반에 탐색적 분석을 수행할 때 시각화를 통해 변수들 간의 관계, 패턴을 탐색하는 분석 기법이 굉장히 유용합니다.

하지만 다변량 데이터 중에서도 특히 3개 이상의 변수를 가지는 다변량 데이터의 경우 그동안 소개해드렸던 히스토그램, 막대그림, 박스 그림, 산포도, 선그림/시계열 그림 등을 활용해서 2차원 평면에 나타낼 수 없는 한계가 있습니다. (물론, 색깔이라든지 모양을 데이터 그룹 별로 달리하면 3차원, 4차원의 정보를 시각화할 수 있기는 합니다만…)

변수 3개 이상의 다변량 데이터를 2차원 평면에 효과적으로 시각화할 수 있는 방법으로

  1. 레이더 차트 (radar chart) or 거미줄 그림(spider plot)

  2. 별 그래프 (레이더 차트와 유사, 중심점 다름)

  3. 평행 좌표 그림 (parallel coordinate plot)

  4. [3차원 산포도 (3 dimensional scatter plot)]

  5. [체르노프 얼굴그림 (Chernoff faces)]

  6. [산포도 행렬(scatter plot matrix)]

  7. [모자이크 그림(mosaic plot)]