전체 글
-
[Tableau Tip] 태블로에서 정규표현식 활용하기Data Visualization/Tableau Dashboard(Tip) 2022. 10. 23. 15:12
Table of Contents Introduction 태블로 정규표현식 태블로 정규표현식 활용 함수 Reference Introduction 다양한 텍스트 데이터가 수집함에 따라 유사한 패턴을 갖고 있는 텍스트만 발췌하여 분석을 하거나 시각화를 하려는 니즈가 늘어나고 있다. 이때, 유사한 패턴을 도출하기 위해 정규표현식을 사용하게 된다. 정규표현식이란 특정한 규칙을 가진 문자열의 집합을 표현하는데 사용하는 언어이다. 태블로 정규표현식 태블로에서 사용하고 있는 정규표현식은 Internation Components for Unicode에서 제공하고 있는 정규표현식을 따른다. 어떤 방식으로 정규표현식이 사용 가능한지 목록을 살펴보자. 먼저, 아래의 문자와 숫자 패턴을 정규표현식으로 사용할 경우 메타캐릭터(\..
-
임의 추출을 위한 R 패키지 samplingData Analysis/R 패키지 2022. 10. 22. 18:44
Table of Contents Introduction sampling 라이브러리 Reference Introduction 오늘날과 같이 수 많은 데이터가 발생하는 과정에서 전수 조사가 어려운 경우가 발생하기도 한다. 이때, 모집단을 대표하는 표본을 대상으로 분석을 수행하는데 임의 추출을 사용한다. 임의 추출에는 단순 임의 추출, 층화 추출, 계통 추출이 있다. 단순 임의 추출의 경우에는 전체 데이터에서 모든 샘플 데이터가 동일한 확률로 추출하는 방법을 말한다. 층화 추출의 경우에는 모집단의 특성을 최대한 반영할 수 있도록 몇계의 층을 나누어 각 층별로 임의 표본 추출을 하는 것이다. 따라서 층화 추출의 경우에는 층 간 데이터의 성격이 이질적이며, 층 내에 데이터의 성격은 동질적이다. 마지막으로 계통 추..
-
[R] Customer Behavior Analysis 01Project/Customer Behavior (with R) 2022. 10. 15. 09:36
Table of Contents Introduction 고객이란? 고객 유형 분류 기존 고객 세분화의 한계점 Reference Introduction IT의 발달과 함께 데이터의 저장 혹은 저장된 데이터를 불러와서 처리하기 용이해졌고 계속해서 발전해가고 있다. 특히, 대규모 데이터베이스(DB)의 구축이 가능해짐에 따라 고객 데이터의 효율적 운영과 체계적인 분석을 가능하게 했다. 고객은 제품과 서비스를 제공받는 대가로 일정한 가치를 제공하는 사람이기 때문에 기업에서는 중요한 관심 대상이다. 따라서 기업에서는 빅데이터를 활용한 고객 데이터 처리 및 분석 방법에 대한 다양한 시도를 하고 있으며, 회사 내부에서는 고객 분석의 니즈는 반드시 해야하는 대상이다. 고객이란? 고객(Customer)의 사전적 정의는 늘..
-
[Data 이모저모] 오픈 API 활용하기Data 이모저모 2022. 7. 31. 23:54
Table of ContentsIntroductionOPEN API란?공공데이터포털공공데이터포털 데이터 활용하기Reference Introduction최근 다양한 사이트에 작성된 글을 수집하여 텍스트 분석을 수행하고 그 안에서 의미있는 정보를 도출하고자 하는 니즈가 늘어나고 있다. 수집을 하는 과정에서 몇 가지 문제가 발생할 수 있다.먼저, 저작권에 관한 문제가 가장 먼저 생길 수 있다. 저작권은 저작자(창작물을 만든 사람)가 자신이 창작한 저작물에 대해 갖는 권리이다. 따라서, 웹에 있는 다양한 데이터는 저작권법에 의해 보호되고 있기 때문에 함부로 수집해서 처리할 수 없다. 다만, 법령, 국가/공공단체의 고시/공고/훈령, 법원 판결, 사실전달에 불과한 시사보도 등은 저작권을 인정하지 않는다.다음으로,..
-
[Tableau Tip] 태블로 대시보드 구축 프로세스Data Visualization/Tableau Infra(Tip) 2022. 5. 22. 14:23
Table of ContentsIntroduction태블로 대시보드 구현 시 고려사항태블로 대시보두 구축 프로세스Reference Introduction데이터의 활용이 자연스러워지면서 데이터 리터러시 역량이 필요한 시대이다. 특히, 데이터 기반의 의사결정을 위한 데이터 시각화 니즈가 높아지면서, 태블로의 활용이 대두되고 있다. 과거, "[Visualization] BI(Business Intelligence)란?" 에서 태블로가 어떤 제품인지 가이드 한 적이 있다. 태블로를 사용하는 방식이 GUI(Graphical User Interface) 방식이다보니, 프로그래밍 언어에 비해 빠르게 구축이 가능하다. 태블로에 대한 기본 기능은 "[Visualization] 태블로 주요 기능"에서 가이드 한 적 있..
-
[Tableau] 상위 아이템 목록 표시하기Data Visualization/Tableau(Advanced) 2022. 5. 15. 14:52
Table of ContentsIntroductionData상위 아이템 목록 표시하기Reference Introduction태블로에서 다양한 대시보드를 구현하다 보면, [그림 1]과 같이 연도별 혹은 카테고리별 가장 많이 판매된 상품을 보여달라고 요청이 올 때가 있다. 엑셀이나 PPT였으면 굉장히 쉽게 보여줄 수 있는 자료를 태블로에서는 표현하기가 상당히 까다롭다. 이때, 우리는 RANK 함수와 테이블 계산식을 활용해서 구성해볼 수 있다. Data다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. DateTypeProductPriceVisitSales2017-12-31핫라떼40001325280002017-12-31핫아메리카노35001174095002017-12-31아이스아이스 라떼4..
-
[R] 클립보드 활용하여 데이터 불러오기Data Analysis/R 2022. 5. 8. 15:32
Table of Contents Introduction 클립보드를 활용하여 데이터 불러오기 Reference Introduction 업무 하는 과정에서 정보를 수집하다보면, 웹에 게시된 테이블 형식의 데이터를 가져오기 위해 크롤러를 만들거나 복사해서 엑셀에 하나씩 붙여 넣고 수정해야 하는 경우 복잡하고 귀찮게 한다. 이를 보다 쉽게 처리하기 위해 클립보드에 있는 정보를 불러와서 처리할 수 있다. 클립보드를 활용하여 데이터 불러오기 국가코드를 활용하기 위해 위키피디아의 국가코드 목록을 접속한 뒤 복사할 대상을 지정하고 복사한다. 이후, 다음 코드를 입력하고 실행하면 복사된 내용이 클립보드에 저장되고 다시 R에서 해당 내용을 출력할 수 있게 된다. # windows용 read.table("clipboard"..
-
[Tableau] 피라미드 차트(Pyramid Chart) 시각화하기Data Visualization/Tableau(Advanced) 2022. 4. 23. 16:48
Table of ContentsIntroductionDataTableau에서 피라미드 차트 시각화하기Reference Introduction피라미드 차트(Pyramid Chart)는 두 비교 집단을 단계별로 서로 대응해서 비교하기 위한 목적으로 사용한다. 특히 인구피라미드가 대표적인 피라미드 차트의 예시 입니다. [그림 1]과 같이 피라미드 차트를 활용하면, 같은 연령대의 다른 성별을 서로 비교해보기 위해 효과적으로 표현할 수 있다. Data22년 2월 21일 통계청에서 2020년 임금근로일자리 소득(보수) 결과를 발표하였고, 그 중의 일부 데이터를 편집하여 2020년 임금근로일자리소득.xlsx로 구성하였다. 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다.연령성별기업규모소득10대..