분류 전체보기
-
[Data 이모저모] 오픈 API 활용하기Data 이모저모 2022. 7. 31. 23:54
Table of Contents Introduction OPEN API란? 공공데이터포털 공공데이터포털 데이터 활용하기 Reference Introduction 최근 다양한 사이트에 작성된 글을 수집하여 텍스트 분석을 수행하고 그 안에서 의미있는 정보를 도출하고자 하는 니즈가 늘어나고 있다. 수집을 하는 과정에서 몇 가지 문제가 발생할 수 있다. 먼저, 저작권에 관한 문제가 가장 먼저 생길 수 있다. 저작권은 저작자(창작물을 만든 사람)가 자신이 창작한 저작물에 대해 갖는 권리이다. 따라서, 웹에 있는 다양한 데이터는 저작권법에 의해 보호되고 있기 때문에 함부로 수집해서 처리할 수 없다. 다만, 법령, 국가/공공단체의 고시/공고/훈령, 법원 판결, 사실전달에 불과한 시사보도 등은 저작권을 인정하지 않는다..
-
[Tableau Tip] 태블로 대시보드 구축 프로세스Data Visualization/Tableau Infra(Tip) 2022. 5. 22. 14:23
Table of Contents Introduction 태블로 대시보드 구현 시 고려사항 태블로 대시보두 구축 프로세스 Reference Introduction 데이터의 활용이 자연스러워지면서 데이터 리터러시 역량이 필요한 시대이다. 특히, 데이터 기반의 의사결정을 위한 데이터 시각화 니즈가 높아지면서, 태블로의 활용이 대두되고 있다. 과거, "[Visualization] BI(Business Intelligence)란?" 에서 태블로가 어떤 제품인지 가이드 한 적이 있다. 태블로를 사용하는 방식이 GUI(Graphical User Interface) 방식이다보니, 프로그래밍 언어에 비해 빠르게 구축이 가능하다. 태블로에 대한 기본 기능은 "[Visualization] 태블로 주요 기능"에서 가이드 한 ..
-
[Tableau] 상위 아이템 목록 표시하기Data Visualization/Tableau(Advanced) 2022. 5. 15. 14:52
Table of Contents Introduction Data 상위 아이템 목록 표시하기 Reference Introduction 태블로에서 다양한 대시보드를 구현하다 보면, [그림 1]과 같이 연도별 혹은 카테고리별 가장 많이 판매된 상품을 보여달라고 요청이 올 때가 있다. 엑셀이나 PPT였으면 굉장히 쉽게 보여줄 수 있는 자료를 태블로에서는 표현하기가 상당히 까다롭다. 이때, 우리는 RANK 함수와 테이블 계산식을 활용해서 구성해볼 수 있다. Data 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. Date Type Product Price Visit Sales 2017-12-31 핫 라떼 4000 132 528000 2017-12-31 핫 아메리카노 3500 117 40950..
-
[R] 클립보드 활용하여 데이터 불러오기Data Analysis/R 2022. 5. 8. 15:32
Table of Contents Introduction 클립보드를 활용하여 데이터 불러오기 Reference Introduction 업무 하는 과정에서 정보를 수집하다보면, 웹에 게시된 테이블 형식의 데이터를 가져오기 위해 크롤러를 만들거나 복사해서 엑셀에 하나씩 붙여 넣고 수정해야 하는 경우 복잡하고 귀찮게 한다. 이를 보다 쉽게 처리하기 위해 클립보드에 있는 정보를 불러와서 처리할 수 있다. 클립보드를 활용하여 데이터 불러오기 국가코드를 활용하기 위해 위키피디아의 국가코드 목록을 접속한 뒤 복사할 대상을 지정하고 복사한다. 이후, 다음 코드를 입력하고 실행하면 복사된 내용이 클립보드에 저장되고 다시 R에서 해당 내용을 출력할 수 있게 된다. # windows용 read.table("clipboard"..
-
[Tableau] 피라미드 차트(Pyramid Chart) 시각화하기Data Visualization/Tableau(Advanced) 2022. 4. 23. 16:48
Table of Contents Introduction Data Tableau에서 피라미드 차트 시각화하기 Reference Introduction 피라미드 차트(Pyramid Chart)는 두 비교 집단을 단계별로 서로 대응해서 비교하기 위한 목적으로 사용한다. 특히 인구피라미드가 대표적인 피라미드 차트의 예시 입니다. [그림 1]과 같이 피라미드 차트를 활용하면, 같은 연령대의 다른 성별을 서로 비교해보기 위해 효과적으로 표현할 수 있다. Data 22년 2월 21일 통계청에서 2020년 임금근로일자리 소득(보수) 결과를 발표하였고, 그 중의 일부 데이터를 편집하여 2020년 임금근로일자리소득.xlsx로 구성하였다. 다음 데이터를 다운로드하고 태블로 데스크탑 이나 퍼블릭에서 불러온다. 연령 성별 기업..
-
[저자직강] 실무 예제로 끝내는 R 데이터 분석(2022.03.14)About 2022. 3. 14. 13:43
2021년 9월 7이 출간된 실무 예제로 끝내는 R 데이터 분석에 이어 인프런에서 강의를 오픈하였습니다. 전체 내용 중에서 정형 데이터 2가지 비정형 데이터 2가지 내용을 동영상 강의로 구성하였으며 5시간이라는 짧은 시간 동안 수강할 수 있습니다. 강의는 아래 링크를 클릭하면 연결됩니다. 실무 예제로 끝내는 R 데이터 분석(저자직강) 실무 예제로 끝내는 R 데이터 분석(저자직강) - 인프런 | 강의 데이터 분석가를 위해 준비한 "실무 예제 기반 데이터 분석" 강의입니다., - 강의 소개 | 인프런... www.inflearn.com 강의 내용 √ 데이터 분석 이해하기 √ 정형 데이터에서 보물 찾기Ⅰ - 지난 1년간 카페에는 어떤 일이 있었을까? √ 정형 데이터에서 보물 찾기Ⅱ - KOSPI 예측이 가능할..
-
[R] 오프라인 환경을 위한 R 라이브러리Data Analysis/R 2022. 2. 28. 17:19
Table of Contents Introduction 오프라인 환경에서 R 라이브러리 설치를 위한 함수 이해하기 사용자 함수를 이용하여 처리하기 R 라이브러리 설치하기 Introduction Introduction 기업 내부에 존재하는 데이터의 경우에는 보안을 민감하게 여기고 있기 때문에 외부망과 단절되어 있다. 이런 폐쇄망에서 시스템이 구성되어 있으며, 데이터가 저장되어 있는 데이터베이스가 내부망에 구성되어 있기 때문에 일반적으로 인터넷이 자유롭게 사용되는 환경에서처럼 R스튜디오를 운영할 수 없다. 이런 경우 외부에서 장비를 반입하기 전에 미리 분석 환경을 세팅하고 들어가거나 설치 파일을 USB 또는 CD에 담아서 들어가기도 한다. 오프라인 환경에서 R 라이브러리 설치를 위한 함수 이해하기 R과 R스..
-
[R] Recommendation System 01Project/Recommendation System (with R) 2021. 12. 5. 21:29
Table of Contents Introduction 추천 시스템(Recommendation Systems)이란? 추천 시스템의 분류 Reference Introduction 과거에 비해 다양한 정보의 발생으로 인한 개인의 정보 과다노출로 피로도는 급격하게 늘어나고 있다. 이에 따라 다양한 영역에서 사용자의 니즈를 바탕으로 상품 또는 콘텐츠 등을 추천하기 위한 추천 시스템(Recommendation System)이 등장하였다. 추천 시스템은 크게 정보 필터링(Information Filtering System) 기술의 일종으로 영화 예매 사이트 또는 리뷰 사이트의 영화 추천 시스템 또는 쇼핑몰의 상품 추천 시스템 등에 사용되고 있다.우리는 주변에서 추천 시스템이라고 하면 협업 필터링(Collaborat..