ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Visualization] 데이터 시각화(Data Visualization)
    Data Visualization/Visualization 2020. 8. 27. 21:02

    Table of Contents

    1. Introduction
    2. 데이터 시각화(Data Visualization)란?
    3. 데이터 시각화의 역사(Data Visualization History)
    4. 데이터 시각화 접근법(Data Visualization Approach)
    5. Reference

     

    Introduction

     IT의 발달로 인해 데이터 홍수 속에 살고 있는 현대 사회에서는 데이터로부터 유의미한 가치를 창출하는 것이 화두이다. 데이터의 규모는 날이 갈수록 늘고 있으며, 증가하는 속도 역시 빠르게 증가하고 있다. 독일의 유명한 통계 Statista의 Volume of data/information created worldwide from 2010 to 2024에 따르면, 2020년 현재 데이터 생산량은 59zettabytes이며, 2024년에는 3배까지 증가할 것으로 예측하고 있다. 데이터 생산량은 과거에 비해 점차 속도가 증가하는 것을 확인 할 수 있다. 이렇듯 복잡하고 무질서한 흐름 속에 숨겨진 패턴을 발견하여 사람들이 이해할 수 있도록 표현하는 방법이 중요한 수단으로 여겨지고 있다.

    <그림 1> Statista의 연도별 데이터 생성 규모 예측

     

    데이터 시각화(Data Visualization)란?

     데이터 시각화는 데이터 분석 결과를 쉽게 이해할 수 있도록 차트, 그래프, 지도, 대시보드 등으로 정보를 효과적으로 전달하는 것을 말하며, 수 많은 데이터로부터 이슈와 결함을 찾기 위해서 혹은 최상의 제품을 선택하거나 데이터 기반의 의사 결정을 하기 위해 아주 큰 도움을 준다. 또한, 미래를 예측하는 등 데이터 시각화는 다양한 방식으로 우리에게 도움을 줄 수 있다. Data Revelations 창업자인 스티브 웩슬러에 따르면 데이터를 시각화하기 위한 방법에는 방향, 길이, 너비, 크기, 형태, 곡률, 표시 추가, 둘러싸기 그리고 색상, 색조, 위치, 공간적 그룹핑이 있으며, 그 중에서 길이가 가장 신뢰할 수 있고, 효율적이라고 말한다.
     시각화의 경우 다양한 데이터들을 종합하여 나타낸 결과물로 심플해야 사용자로 하여금 쉽게 이해할 수 있으며, 핵심을 파악할 수 있다. 화면에 담을 콘텐츠와 여러 페이지 간의 시나리오를 잘 설계해야하며, 하나의 화면 안에 다양한 콘텐츠를 담기 어려울 경우 시나리오가 복잡하다고 할 수 있다. 이럴 경우 시나리오가 복잡한게 아닌가 확인하고 개선해야 한다.

     

    데이터 시각화의 역사(Data Visualization History)

       데이터 시각화가 오늘날 하루 아침에 생긴 개념은 아니다. 오랜 기간에 걸쳐서 다양한 분야와 다양한 형태로 시각화를 해왔으며, 특히 확률론, 통계학, 천문학, 지도제작 분야에서의 발전이 현대의 데이터 시각화에 큰 영향을 주었다. 17세기 이전에는 지도와 도표를 기반으로 시각화를 하였으며, 17세기에 들어서 측정과 이론에 관한 시각화가 진행되었다. 18세기에 접어 들면서 새로운 형태의 그래프들을 표현하기 시작했으며, 19세기에서야 본격적으로 현대적 시각화가 진행되었다. 19세기 중반인 1849년 당시 영향력 있던 신문인 뉴욕 트리뷴(New York Tribune)의 콜레라로부터 얼마나 생존했는지에 대한 현황을 시각화하였다.

    <그림 2> The New York Tribune's 1849 cholera visualization.

     통계학에서는 1952년 미국 데이터 시각화 전문가 메리 스피어(Mary Eleanor Spear)에 의해 초기 버전의 상자 그림이 제안되었고 1970년대에 미국 수학자 존 튜키(John Wilder Tukey)에 의해 완성되었다. 또한 1973년에는 미국의 통계학자인 허먼 체르노프(Herman Chernoff)는 사람들의 얼굴 생김새를 쉽게 구분하는 것에서 착안해 다변량 데이터를 효과적으로 표현하기 위한 시각화 방법으로 체르노프 얼굴(Chernoff face)을 제안하였다.

    메리 스피어(Mary Eleanor Hunt Spear) 존 튜키(John Wilder Tukey) 허먼 체르노프

     

    데이터 시각화 접근법(Data Visualization Approach)

      데이터 시각화는 궁극적으로 데이터를 가지고 말하고자 하는 바를 이해하기 쉽게 표현하는 방식으로, 시각화 유형화 사례를 기반으로 유형화 시킨 Jay Viz Taxonomy가 있으며, 목적에 따라 다음과 같이 데이터 시각화 접근법을 상세 분류 할 수 있다.

    구분 목적 Jay Viz Taxonomy
    비교 데이터를 서로 비교하는 목적 막대 그래프, 누적 막대 그래프, 레이더 차트, 피라미드 차트
    구성 전체 중에서 차지하는 비중을 탐색하는 목적 파이 차트, 도넛차트, 트리맵, 퍼널 차트
    시간 시간에 따른 데이터 흐름을 파악하는 목적 선 그래프, 영역 차트, 주식 차트, 캔들 차트
    분포 데이터를 이해하기 위한 목적 산점도, 버블 차트, 상자 그림, 히트맵
    평가 KPI 또는 현황을 측정 및 평가하기 위한 목적 게이지 차트, 막대형 게이지 차트, 총알 차트
    지도 지리정보 기반의 데이터 파악을 위한 목적 행정구역 맵, 도트 맵, 버블 맵, 연결 맵, 흐름도 맵

     

    <그림 2> Jay Viz Taxonomy

     

    Reference

    Tableau, "Tableau", www.tableau.com/ko-kr

    Arne Holst, "Information created globally 2010-2024", statista, 2020-07-07
    황승구 등 8명, "시각화의 중요성", 빅데이터 플랫폼 전략, 20130-02-11
    Michael Friendly, "A Brief History of Data Visualization", 2008-01

    Scott Klein, "Infographics in the Time of Cholera, https://www.propublica.org/nerds/infographics-in-the-time-of-cholera
    Jay Stevenson, "What is Data Visualization? Definion, History, and Examples", 2018-11-20

    Mary Eleanor Spear, https://en.wikipedia.org/wiki/Mary_Eleanor_Spear

    John Tukey, https://en.wikipedia.org/wiki/John_Tukey

    Herman Chernoff, https://en.wikipedia.org/wiki/Herman_Chernoff

     

    댓글

Designed by Tistory.