ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [R] Bar Chart Race 재현 01
    Project/Bar Chart Race (with R) 2020. 5. 28. 23:52

    서론

     2019년 Youtube에서는 다양한 오픈데이터를 수집하여 시간의 흐름에 따라 다양한 순위 변화를 한눈에 알아 볼 수 있게 만든 막대그래프 기반의 애니메이션 영상이 인기를 끌고 있었다. 특히, 최근에 이슈가 되고 있는 코로나19(Coronavirus)와 관련해서 발병 초기부터 현재까지의 국가별 발생 현황 또는 치료/사망자 현황 데이터를 기반으로 제작된 영상들이 자주 올라오고 있다. 영상을 보게 되면, 어떤 국가가 얼마나 잘 대처하고 있는지 짧은 시간안에 확인할 수 있다는 장점을 가지고 있다. 이를 구성하기 위해 다양한 오픈 소스를 기반으로 만들기도 하였고, 최근에는 Tableau, Power Bi 등과 같은 Business Intelligence(BI) Tool을 활용하여 코딩이 아닌 드래그 앤 드랍으로 손쉽게 구성하여 만들기도 한다.

     

    관련 연구

    빅데이터 시각화

     4차 산업혁명과 함께 데이터의 양은 기하급수적으로 방대해 지고 있기에, 가공 전 원천 데이터(Raw Data)만으로 의미 있는 데이터를 찾기 어렵다. 김형년(2013)에 따르면 빅데이터로부터 의미를 찾아내고자 하는 기술을 제시하였으며, 시각화의 시각적 표현 방식과 데이터의 표현방식의 특성을 파악하고 시각화 작업의 중요성을 파악하였다.

    상황에 맞는 시각화

     Andy Krik(2012)에 따르면 데이터 시각화란 데이터 속성을 적절한 시각화 요소에 매핑시켜 정보를 전달하는 것으로 정확한 정보를 제공하기 위해 상황에 맞는 시각화 설계가 필요하다고 한다. 장유희(2016)에 따르면 기존의 정보시각화적 요소인 색상, 형태, 위치를 고려한 시각화에서 나아가 상호작용적 요소인 대상과 전개를 고려한 데이터 시각화 기법을 제시하여, 목적에 맞게 전개하는 방식을 독자에게 통찰을 주고 직관적으로 정보의 전달성을 확보하였다.

     

    연구 모형

     Bar chart Race 재현을 위한 연구모형은 <그림 1>과 같이 크게 수집 단계, 처리 단계, 시각화 단계, 애니메이션 처리단계로 나뉜다. 수집 단계에서는 원천 데이터를 가지고 오는 과정으로 일반적으로 공공 데이터를 가져오는 방식은 XML을 받아오거나, API로 가져오는 방법이 있다. 이는 데이터를 시각화 하기 위해 핸들링 가능한 형태로 데이터를 구조화 할 필요가 있다. 또한, CSV 파일이나 xlsx와 같은 엑셀 파일로도 수집이 가능하다. 이렇게 수집된 데이터를 바탕으로 Bar Chart Race를 만들기 위한 시각화 생성하기 위해 처리 단계에서 데이터를 정리한다. 이후 시각화 단계와 애니메이션 처리 과정을 거쳐 하나의 Bar Chart Race를 구성할 수 있다.

     

    <그림 1> Bar Chart Race(By Jay Data Graph)

    Lesson Learned

     해당 연구 모형을 기반으로 실제 R을 이용한 Bar Chart Race를 재현한 소스 코드를 리뷰할 예정이며, 2019년 7월 14일에 첫 번째 재현한 결과를 시작으로 2019년 11월 29일까지 총 22개의 영상을 유튜브 Jay Data Graph 채널에서 공개하고 있다. 최초에 작성했던 시점의 Bar Chart Race는 연구모형을 구현하기에 급급했다. 최종으로 게시했던 결과물은 처음보다 많이 개선된 결과물이다. 주로 국가통계포탈(Kosis)이나 JNTO(Japan National Tourism Organization)으로부터 데이터를 수집하여 공공 데이터 기반의 시각화를 재현했으며, R을 이용한 시각화를 영상으로 처리하는 방법론을 제시하여 이와 관련된 다양한 사람들의 관심도가 증가하길 기대한다.

    <그림 2> Jay Data Graph Youtube 링크

    Reference

    1.  김형년, "빅데이터 비주얼라이제이션 사례분석 - 시각화 표현 방식을 중심으로 -", Journal of Integrated Design Research, 2014. 12

    2.  Andy Krik, "Data Visualization : a successful design process", 도서,  2012

    3.  장유희, "대상과 전개를 고려한 데이터 시각화 기법", 석사학위 논문, 2016. 12

    'Project > Bar Chart Race (with R)' 카테고리의 다른 글

    [R] Bar Chart Race 재현 04  (0) 2020.07.18
    [R] Bar Chart Race 재현 03  (0) 2020.07.11
    [R] Bar Chart Race 재현 02  (0) 2020.07.05

    댓글

Designed by Tistory.