전체 글
-
[Tableau] 막대 그래프(Bar Plot) 시각화하기Data Visualization/Tableau(Intermediate) 2020. 8. 10. 23:29
Table of Contents Introduction Data Tableau에서 막대그래프 시각화하기 Reference Introduction 막대 그래프는 일반적으로 수직이나 수평으로 놓인 막대로 2개 이상의 차원을 서로 비교하기 위한 목적으로 사용한다. 차트의 한쪽 축에는 비교하기 위한 차원값을 두고 또 다른 축에는 수치값을 표현한다. Severino Ribecca는 과 같이 막대 그래프의 정의를 구체적으로 제시하며, 히스토그램(Histogram)과는 별개의 특징을 가지고 있다고 소개하고 있다. Data 다음 데이터를 태블로 데스크탑 이나 퍼블릭에서 불러온다. Date Type Product Sale 2017-12-31 아이스 아이스 아메리카노 125 2017-12-31 아이스 아이스 라떼 111 ..
-
[Visualization] 태블로 주요 기능 설명Data Visualization/Visualization 2020. 8. 9. 00:39
Table of Contents Introduction Tableau 주요 기능 및 화면 설명 데이터를 불러온 Tableau 화면 이해하기 Tableau 시각화 하기 Reference Introduction 기업에서는 오랜기간 운영하면서 비즈니스 인사이트를 얻기 위해 기업 내부와 외부에서 발생하는 데이터를 지속적으로 수집하기 위한 노력을 하고 있었으며, 데이터 사이언티스트들을 고용하여 인사이트 도출을 위한 데이터 분석 및 모델링이 진행되고 있다. 이와 함께 데이터를 얼마나 효과적으로 보여주는 것이 중요한지에 대해 데이터 시각화(Data Visualization)와 관련된 연구가 활발하게 진행하고 있다. 은 태블로 퍼블릭(Tableau Public) 공식 사이트에서 선정된 오늘의 비주얼라이제이션으로 202..
-
[Visualization] BI(Business Intelligence)란?Data Visualization/Visualization 2020. 8. 5. 21:50
Table of Contents Introduction BI(Business Intelligence)란? 태블로(Tableau)이란? Reference Introduction 데이터 분석과 함께 시각화의 중요성은 데이터 기반의 의사결정을 하는데 있어서 중요한 역할을 하고 있다. 실제로 분석의 결과로 새로운 시스템을 도입하거나 시각화를 제공하는 케이스가 점점 증가하고 있다. 최근에는 공공 데이터를 통합하고 이를 시각화하여 지자체 모니터링을 시도하고 있으며, 이를 바탕으로 의사 결정에 도움을 받고 있다. 서울시는 2019년 4월에 서울시 디지털 시민 시장실을 오픈했으며, 은 메인 화면이다. 이 화면은 시장실 한 면을 대형 전광판으로 채워 서울시와 관련된 행정정보를 실시간으로 보고 받아 시정 활동을 수행하는데..
-
세 집단을 비교하기Data Analysis/Statistics 2020. 8. 2. 22:11
Table of Contents Introduction 분산분석(Analysis of Variance;ANOVA)이란? 일원배치 분산분석(One-way ANOVA) 이원배치 분산분석(Two-way ANOVA) 다변량 분산분석(Multivariate Analysis of Variance, MANOVA) 공분산분석(Analysis of Covariance, ANCOVA) Reference Introduction 데이터 기반의 의사 결정을 위해 두 집단 간의 평균 차이를 비교하는 방법으로 T-검정이 있다. 두 집단을 비교하기를 통해 T-검정의 종류를 소개하였고, 종류 별 상황과 실제 R을 이용하여 분석을 하는 과정을 함께 설명하였다. 하지만, 일상 생활에서 우리는 의사 결정을 할때 두 가지의 경우에서 하나의 ..
-
두 집단을 비교하기Data Analysis/Statistics 2020. 8. 2. 21:23
Table of Contents Introduction T검정(T-Test)이란? 일표본 T검정(One sample T-test)이란? 독립표본 T검정(Independent-samples T-test)이란? 대응표본 T검정(Paired-samples T-test)이란? Reference Introduction 최근들어 데이터 기반의 의사 결정이라는 말이 보편화되어 다양한 현장에서 활용하고 있으며, 이와 관련된 채용이 적극적으로 늘고 있는 추세이다. 제품 A를 판매하고 있는 회사에서 새로운 제품 B를 출시 하기 위해서 다양한 형태로 제품의 특성을 측정하고 이들 간의 관계를 분석하곤 한다. 이렇게 두 집단의 차이가 우연에 의해 발생하는 차이가 아니라 정말로 다른 두 집단이라는 검정을 하기 위해서 두 집단의 ..
-
[Algorithms] 인공 신경망(Artificial Neural Network)이란?Data Analysis/Algorithms 2020. 7. 27. 23:26
Table of Contents Introduction 인공 신경망(Artificial Neural Network)이란? 인공 신경망 in R Reference Introduction 지난 날 인터넷 기술의 발달과 재생 에너지를 기반으로 3차 산업 혁명을 이끌어 왔다면, 4차 산업혁명(The Fourth Industrial Revolution)은 초연결(Hyperconnectivity)과 초지능(Superintelligence)이라는 특징을 가지고 있기에 기존의 주변 환경을 보다 빠르게 변화시키고 있다. 이를 가능케 했던 근본적인 기술에는 인공 지능(Artificial Intelligence;AI), 사물 인터넷(Internet of Things;IoT), 클라우드 컴퓨팅(Cloud Computing),..
-
[R] Bar Chart Race 재현 04Project/Bar Chart Race (with R) 2020. 7. 18. 13:10
목차 [R] Bar Chart Race 재현 01 [R] Bar Chart Race 재현 02 [R] Bar Chart Race 재현 03 서론 Bar Chart Race 재현 프로젝트의 마지막 단계로 지난 3번의 과정을 거쳐 데이터를 수집하고, 전처리 과정을 통해 데이터의 구조를 변경하는 작업을 진행하였다. 전처리 과정을 막대 그래프를 그리기 위한 과정이었으며, 이 과정에서는 melt()함수에 대한 이해가 필요했다. 데이터를 구조화 한 이후에 ggplot2를 이용하여 시각화를 한다. Bar Chart Race 재현의 마지막 과정으로 시각화 한 부분을 영상처리를 할 예정이다. 시각화 작업을 진행하기 위해서는 프레임 단위로 이미지가 생성이 되어야 가능하며, R에서는 gganimate를 활용하여 영상화를 진..
-
[R] Bar Chart Race 재현 03Project/Bar Chart Race (with R) 2020. 7. 11. 11:02
목차 [R] Bar Chart Race 재현 01 [R] Bar Chart Race 재현 02 서론 Bar Chart Race 재현 프로젝트를 수행하면서 전체적인 프로세스를 소개하였고 공공데이터를 수집하는 방법과 Bar Chart Race가 가능하도록 데이터를 가공하는 과정을 소개하였다. 이어서 가공한 데이터를 기반으로 데이터 시각화 하는 방법에 대해 가이드 할 예정이다. R에서는 기본으로 제공하는 graphics라는 라이브러리가 있으나, 시각화를 자유롭게 핸들링하기 위해서는 ggplot2를 추천한다. 본 재현에서는 기존에 있는 graphics 라이브러리가 아닌 ggplot2를 이용하여 시각화를 한다. 데이터 시각화 reshape2 라이브러리에 있는 melt()를 사용하여 [표 1]과 같이 데이터를 가공..