분류 전체보기
-
[NLP] 문서 요약(Text Summarization)Data Analysis/Natural Language Processing 2020. 11. 7. 13:40
Table of Contents Introduction 문서 요약(Text Summarization)이란? Reference Introduction 빅데이터 분석의 수요가 증가하면서 비정형 데이터 분석 및 활용 사례도 점차 늘어나고 있다. 데이터 발생의 80~90%가 비정형 데이터로 구성되있는 것에 비해 비정형 데이터 활용은 가야할 길이 멀다. 비정형 데이터 중에서 텍스트는 우리 주변에서 다양하게 활용하고 있으며, 정보 전달에 가장 중요한 역할을 한다. 다른 비정형 데이터나 정형 데이터보다 쉽게 수집이 가능하다는 점에서 분석가들의 관심을 끌고 있다. 텍스트 분석의 활용은 문서 분류(Document Classification), 문서 요약(Document Summarization), 감성 분석(Sentim..
-
[EDA] 똑똑하게 EDA하기Data Analysis/EDA 2020. 10. 31. 23:54
Table of Contents Introduction SmartEDA란? R에서 이용가능한 EDA 패키지 비교 Reference Introduction 데이터 분석을 활용하지 않는 곳이 없을 정도로 사회 각 지역의 다양한 곳에서 데이터를 수집하여 분석하고 있다. 대부분 데이터 분석에서 관심을 갖고 있는 영역은 통계 분석이나 머신 러닝을 이용한 문제 해결일 것이다. 그럼에도 데이터 분석에서 EDA는 가장 중요한 역할을 하고 있으며, 모든 곳에서 데이터 분석의 우선적인 프로세스로 수행하고 있다. [EDA] 탐색적 데이터 분석(Exploratory Data Analysis, EDA)에서 EDA에 대한 이해를 설명하고 있다. SmartEDA란? EDA는 크게 통계 분석 파트와 시각화 파트로 나뉜다. 데이터의 ..
-
[Tableau] 폭포 차트(Waterfall Chart) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 26. 23:25
Table of ContentsIntroductionDataTableau에서 폭포 차트 시각화하기Reference Introduction폭포 차트(Waterfall Chart)는 연속적으로 누적해가면서 증가하거나 감소하는 것을 한 눈에 표현하기 위한 목적으로 사용한다. 태블로에서는 생키 다이어그램을 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다.Data다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. DateTypeProductPriceVisitSales2017-12-31핫라떼40001325280002017-12-31핫아메리카노35001174095002017-12-31아이스아이스 라떼40001455800002017-12-31아..
-
[Tableau] 생키 다이어그램(Sankey Diagram) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 18. 17:21
Table of ContentsIntroductionDataTableau에서 생키 다이어그램 시각화하기Reference Introduction생키 다이어그램(Sankey Diagram)은 각 단계별 물량의 변화를 한 눈에 표현하기 위한 목적으로 사용한다. 특히, 전체 물량이 어떤 곳으로 흘러가는지 혹은 어떤 단계에서 얼마나 많은 양이 이탈하는지까지도 한눈에 파악할 수 있는 효과적인 시각화이다. Severino Ribecca는 과 같이 생키 다이어그램의 정의를 구체적으로 제시하였다. 태블로에서는 생키 다이어그램을 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다. Data다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. DateT..
-
[Tableau] 막대 게이지 차트(Bar Gauge Chart) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 10. 00:17
Table of ContentsIntroductionDataTableau에서 막대 게이지 차트 시각화하기Reference Introduction 막대 게이지 차트(Gauge Chart)는 일반적인 게이지 차트와 유사하며, 자동차 대시보드에 있는 게기판 형태로 시각화하여 현재의 상태가 어떤지 한눈에 파악하기 위한 목적으로 사용한다. 다만, 대시보드에 표현할 공간이 좁아서 게이지 차트로 표현하기 어려울 경우 막대 게이지 차트를 활용해서 사용하기도 한다. 은 Google Charts의 Gague chart guide로 자동차 계기판을 연상시키는 모습을 보이고 있다. 태블로에서는 막대 게이지 차트는 게이지 차트와 다르게 표현하는 방식은 훨씬 쉬운 편이다. Data 다음 데이터는 이번 시즌 K리그 기록을 가져온 ..
-
[Tableau] 게이지 차트(Gauge Chart) 시각화하기Data Visualization/Tableau(Advanced) 2020. 10. 4. 02:28
Table of ContentsIntroductionDataTableau에서 게이지 차트 시각화하기Reference Introduction 게이지 차트(Gauge Chart)는 자동차 대시보드에 있는 게기판 형태로 시각화하여 현재의 상태가 어떤지 한눈에 파악하기 위한 목적으로 사용한다. 은 Google Charts의 Gague chart guide로 자동차 계기판을 연상시키는 모습을 보이고 있다. 태블로에서는 게이지 차트 대신 총알차트를 제공하고 있기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다. Data 다음 데이터는 이번 시즌 K리그 기록을 가져온 데이터이다. 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. 구단선수명시즌출장골어시스트슈팅강원FC가솔현20200000광주..
-
[EDA] 탐색적 데이터 분석(Exploratory Data Analysis, EDA)Data Analysis/EDA 2020. 9. 30. 00:57
Table of Contents Introduction 탐색적 데이터 분석(EDA)란? Reference Introduction 데이터 분석을 하는 모든 사람들이라면 한번씩 접해볼 수 있는 용어 중 하나인 EDA는 데이터 입수 후에 가장 첫번째 단계이며, 내가 갖고 있는 데이터가 무엇인지 어떻게 생긴 데이터인지 확인할 필요가 있다. 만약 내가 가지고 있는 데이터에 빈칸만 존재한다면, 다음 스텝으로 넘어갈 수 없을 것이다. 따라서, 우리는 데이터 입수 후에 내 데이터에 빈칸이 존재하는지, 아니면 정상 범주에 포함되는 값이 들어가 있는지 확인할 필요가 있다. 이 과정을 강조하고 싶은 이유는 바로 여기에 있다. 실제 프로젝트를 할 경우 수집한 데이터가 정상적으로 잘 쌓여 있는지 아무도 아는 사람이 없다. 데이..
-
[Tableau] 레이더 차트(Radar Chart) 시각화하기Data Visualization/Tableau(Advanced) 2020. 9. 27. 20:41
Table of ContentsIntroductionDataTableau에서 레이더 차트 시각화하기Reference Introduction 레이더 차트(Radar Chart)는 스파이더 차트라고도 불리며, 다양한 지표를 평가 혹은 측정하여 한 눈에 표현하기 위한 목적으로 사용한다. Severino Ribecca는 과 같이 레이더 차트의 정의를 구체적으로 제시하였다. 태블로에서는 레이더 차트를 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 트릭이 필요하다. 태블로에서 레이더 차트를 작성하는 방법에는 여러가지 방법이 있다. 지표의 수를 결정해서 지표의 좌표를 계산하는 방식이 있는 반면, 지표의 수에 따라서 자동으로 지표의 좌표값을 계산하는 방식이 있다. Data ..