전체 글
-
[Data 이모저모] 데이콘, 한국판 캐글대회Data 이모저모 2020. 11. 30. 03:10
Table of Contents Introduction 캐글(Kaggle)이란? 한국판 캐글, DACON Reference Introduction 빅데이터 분석의 수요 뿐만 아니라 데이터 분석가에 대한 관심도는 나날이 늘고 있다. 해외에서는 기업이 데이터를 제공하고 일반인들이나 데이터 분석가들이 목표 점수를 달성하기 위한 경쟁을 하고 있었다. 우리나라 역시 해외에서 유명한 분석 대회 플랫폼인 캐글(www.kaggle.com/)에 참여하는 사람들이 늘고 있다. 여기에 2020년 7월 14일 코로나19로 인해 경기 회복을 위한 국가 프로젝트로 디지털 뉴딜 정책을 발표했다. 이로 인해 데이터 분석에 대한 니즈 뿐만 아니라 관련된 자리도 늘어가는 추세이다. 그럼에도 신입 인력에 대한 확충은 아직도 부족한 상황이..
-
[Tableau Tip] 사용자 지정 색상표 만들기Data Visualization/Tableau Infra(Tip) 2020. 11. 29. 00:31
Table of Contents Introduction Color Palette 관련 사이트 사용자 지정 색상표 만들기 Reference Introduction 태블로 작업을 하는 과정에서 색상을 적용하는 것 역시 반복되는 액션일 수 있다. 이런 시간을 단축시키기 위해 미리 정해진 색상 팔레트를 선정해야 한다. 태블로에는 기본적으로 제공하는 색상표가 존재한다. 그럼에도 색감을 보면 상당히 난해하다고 생각하기도 한다. 실제 프로젝트를 수행하다보면, 태블로에서 제공하는 기본 색상이 익숙하지 않아서 새로운 컬러로 변경하는 경우도 발생한다. 어떤 경우에는 고객사 CI와 컬러 매칭이 안되는 경우가 발생하기도 한다. 이럴 때 마다 색상을 적용하는 것이 굉장히 시간이 소모되는 일이 된다. 우리가 전문적인 디자이너가 ..
-
[Tableau Tip] 매개 변수와 필터 여백 설정하기Data Visualization/Tableau Dashboard(Tip) 2020. 11. 15. 19:53
Table of Contents Introduction 매개 변수 생성하기 매개 변수/필터 서식 적용하기 Reference Introduction 태블로를 이용해서 데이터 시각화를 진행한 경험이 있는 분들이라면, 매개 변수와 필터를 적절하게 활용할 수 있을 것이라 생각된다. 매개 변수와 필터는 데이터 시각화를 구성하는데 있어서 경제적으로 페이지를 구성할 수 있다. 매개 변수를 활용해서 대시보드에 다양한 변화를 제공할 수 있으며, 반복되는 화면 구성을 필터에 의해 다른 정보를 제공한다는 점에서도 주목할 만 하다. 이렇게 생성된 매개 변수와 필터를 잘 배열하고, 보고를 위해 출력 또는 대시보드 이미지를 추출하는 경우가 종종 발생된다. 우리 눈에는 정상적인 위치에 배치되어있는 매개 변수와 필터는 말썽일까? 매..
-
[Tableau Tip] 태블로에서 사용자 지정 맵 연결하기Data Visualization/Tableau Dashboard(Tip) 2020. 11. 12. 00:07
Table of Contents Introduction TMS 연결을 위한 요구사항 단순한 TMS 파일 만들기 VWORLD 제공 TMS 파일 생성하기 태블로에서 TMS파일 불러오기 Reference Introduction 회사에서 태블로를 사용하고 있는 분들 가운데 보통 외부망과 내부망을 끊어서 사용하는 경우가 있다. 이럴 경우 온라인을 연동해서 지도를 활용하기가 쉽지 않다. 또한, 인터넷 망이 불안정하거나 기존에 태블로에서 제공하는 지도를 활용할 경우 속도가 느릴 때, 이를 해결하기 위한 방법으로 TMS(Tableau Map Service)에서 연결해서 지도를 활용할 수 있다. 이때, 우리는 tms 파일(Tile Map Service)을 가져와야 합니다. 국내에서는 국토교통부에서 운영하고 있는 VWOR..
-
[NLP] 문서 요약(Text Summarization)Data Analysis/Natural Language Processing 2020. 11. 7. 13:40
Table of Contents Introduction 문서 요약(Text Summarization)이란? Reference Introduction 빅데이터 분석의 수요가 증가하면서 비정형 데이터 분석 및 활용 사례도 점차 늘어나고 있다. 데이터 발생의 80~90%가 비정형 데이터로 구성되있는 것에 비해 비정형 데이터 활용은 가야할 길이 멀다. 비정형 데이터 중에서 텍스트는 우리 주변에서 다양하게 활용하고 있으며, 정보 전달에 가장 중요한 역할을 한다. 다른 비정형 데이터나 정형 데이터보다 쉽게 수집이 가능하다는 점에서 분석가들의 관심을 끌고 있다. 텍스트 분석의 활용은 문서 분류(Document Classification), 문서 요약(Document Summarization), 감성 분석(Sentim..
-
[EDA] 똑똑하게 EDA하기Data Analysis/EDA 2020. 10. 31. 23:54
Table of Contents Introduction SmartEDA란? R에서 이용가능한 EDA 패키지 비교 Reference Introduction 데이터 분석을 활용하지 않는 곳이 없을 정도로 사회 각 지역의 다양한 곳에서 데이터를 수집하여 분석하고 있다. 대부분 데이터 분석에서 관심을 갖고 있는 영역은 통계 분석이나 머신 러닝을 이용한 문제 해결일 것이다. 그럼에도 데이터 분석에서 EDA는 가장 중요한 역할을 하고 있으며, 모든 곳에서 데이터 분석의 우선적인 프로세스로 수행하고 있다. [EDA] 탐색적 데이터 분석(Exploratory Data Analysis, EDA)에서 EDA에 대한 이해를 설명하고 있다. SmartEDA란? EDA는 크게 통계 분석 파트와 시각화 파트로 나뉜다. 데이터의 ..
-
[Tableau] 폭포 차트(Waterfall Chart) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 26. 23:25
Table of Contents Introduction Data Tableau에서 폭포 차트 시각화하기 Reference Introduction 폭포 차트(Waterfall Chart)는 연속적으로 누적해가면서 증가하거나 감소하는 것을 한 눈에 표현하기 위한 목적으로 사용한다. 태블로에서는 생키 다이어그램을 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다. Data 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. Date Type Product Price Visit Sales 2017-12-31 핫 라떼 4000 132 528000 2017-12-31 핫 아메리카노 3500 117 409500 2017-12-31 아이스 아이스..
-
[Tableau] 생키 다이어그램(Sankey Diagram) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 18. 17:21
Table of Contents Introduction Data Tableau에서 생키 다이어그램 시각화하기 Reference Introduction 생키 다이어그램(Sankey Diagram)은 각 단계별 물량의 변화를 한 눈에 표현하기 위한 목적으로 사용한다. 특히, 전체 물량이 어떤 곳으로 흘러가는지 혹은 어떤 단계에서 얼마나 많은 양이 이탈하는지까지도 한눈에 파악할 수 있는 효과적인 시각화이다. Severino Ribecca는 과 같이 생키 다이어그램의 정의를 구체적으로 제시하였다. 태블로에서는 생키 다이어그램을 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다. Data 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. ..