전체 글
-
[Tableau Tip] 태블로 퍼블릭에서 구글 드라이브 연동하기Data Visualization/Tableau Dashboard(Tip) 2021. 10. 11. 02:29
Table of Contents Introduction 구글 드라이브 연동하기 Reference Introduction 주변에 다양한 형태의 대용량 데이터가 발생하면서 데이터를 보다 쉽게 이해하기 위해서 시각화의 중요성을 강조하고 있다. 이 뿐만 아니라 데이터를 읽고 쓰기 위한 능력인 데이터 리터러시(Data Literacy)에 대해 많이 언급되고 있다. 태블로는 데이터 시각화를 위한 간편한 도구이며, 무료로 사용 가능한 버전인 퍼블릭(Tableau Public) 버전을 제공하고 있다. 데스크탑(Tableau Desktop) 버전과는 DB연동과 R/Python 연동 외에는 차이가 없으며, 퍼블릭 버전에서는 데이터를 https://public.tableau.com/app/discover에 게시하여 사용한다..
-
[R] .libPaths()를 이용한 "package or namespace load failed" 조치Data Analysis/R 2021. 9. 10. 12:33
Table of Contents Introduction 패키지 설치 경로 탐색 함수, .libPaths() Reference Introduction 새로운 패키지를 설치하고 이를 실행시키는 과정에서 [그림 1]과 같이 설치 경로를 찾을 수 없다고 에러 메시지(package or namespace load failed for 패키지명)가 발생한다. 이럴 때마다 진행도 안되고 답답했던 경험이 있을 것이다. 패키지 설치 경로 탐색 함수, .libPaths() .libPaths() 함수는 패키지 설치 경로를 탐색하는 함수로, 경로 입력 없이 .libPath()만 입력할 경우에는 아래와 같이 결과가 나타난다. 경로를 입력할 경우에는 패키지 설치 경로를 지정할 수 있다. 이를 이용하면 앞에서 "package or ..
-
[출간] 실무 예제로 끝내는 R 데이터 분석(2021.09.07)About 2021. 9. 2. 23:48
대학에 처음 입학하여 통계학을 전공하고 데이터 분석가로 입사하여 일하는 과정에서 필요한 분석 내용을 담아 지난 1년간 자료를 정리하여 출간을 하게 되었습니다. 특히 API를 이용한 데이터 처리 방식이 다양하게 활용되고 있으며, 정형 데이터와 비정형 데이터를 다양하게 처리할 기회가 많아 졌습니다. 따라서 관련 경험을 독자들에게 전달하기 위해 최대한 상세하게 작성하였습니다. R에 대한 기초 지식이 없을 경우에는 김승욱 저의 R좀 R려줘나 박기군 저의 실무 프로젝트로 배우는 데이터 분석 with R를 참고하시기 바랍니다. 이번에 출간한 실무 예제로 끝내는 R 데이터 분석은 크게 4개의 챕터로 구성되어 있습니다. 글을 작성하고 있는 9월 2일 기준으로 현재는 예약 판매를 진행하고 있으며 2021년 9월 8일 이..
-
[R] system.time을 이용한 실행 속도 측정Data Analysis/R 2021. 8. 29. 19:05
Table of Contents Introduction 현재 시간을 출력하는 함수, Sys.time 코드의 실행 속도를 측정하는 함수, system.time Reference Introduction R을 이용한 프로그래밍을 수행해본 경험이 축적되면서 어떻게 하면 소스를 효율적으로 개발할 것인가 고민하게 된다. 프로젝트를 수행하면서 프로그램을 개발할 때에는 한정된 리소스를 이용하기 때문에 불필요한 소스 코드를 최소화하고 효율적으로 작성하기 위한 소스 튜닝 작업을 진행한다. R에서는 소스 코드를 실행했던 시간을 측정하기 위한 기본적인 함수가 있다. 이와 관련하여 작성한 함수보다 더 빠르고 효율적으로 작동할 수 있게 소스 실행 속도를 측정하기 위한 다양한 방법이 있다. 현재 시간을 출력하는 함수, Sys.ti..
-
[R] Sys.sleep을 이용한 속도 제한 이슈 해결Data Analysis/R 2021. 8. 29. 19:04
Table of Contents Introduction 코드 실행을 잠시 멈추는 함수, Sys.sleep Reference Introduction 코딩 업무를 수행하는 과정에서 내가 만든 코드를 실행할 때 에러가 발생하는 것 만큼 끔찍한 상황이 없다. 보통은 오타이거나 변수나 함수를 잘못 참조했기 때문에 발생할 것이다. 만약, API를 가이드 문서에 따라 사용했다면 더욱 당황스럽다. 코드 실행을 잠시 멈추는 함수, Sys.sleep API를 가져다가 쓸때 아래와 같는 에러를 본 적이 있을 것이다. API를 제공하는 회사에서 서버의 부담을 줄이기 위해 데이터 전송 건수를 제안했기 때문에 발생한다. 이를 해결하기 위해서 코드가 빨리 실행하는게 걸리는 시간을 줄여주는 것이 필요하다. 이때 사용하는 함수가 Sy..
-
[R] try, tryCatch를 이용한 예외처리Data Analysis/R 2021. 8. 29. 19:04
Table of Contents Introduction 에러를 무시하는 함수, try() 예외 처리하는 함수, tryCatch() Reference Introduction 2020년이 어느 덧 1시간도 안남았다. 코딩은 하면 할수록 어렵고 복잡하다. 특정 케이스를 입력할 때 내가 만든 로직은 항상 에러가 발생하기 마련인데 이때, 어떻게 해야 에러를 무시하고 처리할 수 있을까? 예전 프로젝트를 수행하는 과정에서 try() 함수를 접한 적이 있었는데, 이걸 활용했을 때 조건문 없이 예외처리를 할 수 있다는 점에서 매력적으로 느꼈다. 그 이후 데이터 분석을 하기 위해 크롤러를 만드는 과정에서 활용했다. R에서 변수가 정의가 안된 이름을 입력하고 엔터를 칠 경우 에러가 발생하는 것을 본적 있을 것이다. 이때, ..
-
[R] R/R스튜디오 설치하기Data Analysis/R 2021. 8. 28. 20:50
Table of Contents R 설치하기 R 설치파일 다운로드 하기 R 설치하기 R 실행하기 R스튜디오 설치하기 R 스튜디오 설치파일 다운로드 하기 R 스튜디오 설치하기 R 설치하기 R을 사용하려면 PC에 R을 설치해야 합니다. R 공식 홈페이지에서는 관련된 최신 뉴스와 새로운 버전에 대한 릴리즈 노트를 제 공하고 있습니다. R과 관련된 최신 동향을 이해하기 위해 홈페이지에 방문하는 것 도 좋은 방법입니다. R 설치파일 다운로드 하기 R 설치 파일은 R 공식 홈페이지의 CRAN Mirrors 페이지에서 다운로드 할 수 있습 니다. CRAN Mirrors 페이지는 지정된 국가별로 URL을 제공하고 있으며, 해당하는 국가 혹은 인접 국가의 페이지로 접속하여 다운로드 하는 것을 권장합니다. 직접 따라하기 ..
-
[Tableau Tip] Tabpy를 이용한 대시보드 구성하기Data Visualization/Tableau Dashboard(Tip) 2021. 8. 22. 18:47
Table of Contents Introduction Python 설치 확인하기 Tabpy 설치 및 실행하기 Tableau Desktop에서 Tabpy와 연동하기 Tableau Desktop에서 실습하기 Reference Introduction 최근에는 데이터 시각화의 영역이 확장되고 있으며, BI 솔루션의 보급 역시 폭발적으로 성장하고 있다. 그 가운데 데이터 엔지니어나 머신러닝 엔지니어의 경우 BI 솔루션을 활용한 시각화를 제공하고자하는 니즈를 보이고 있다. 이를 위해 Tableau에서는 R과 파이썬을 다이렉트로 연동할 수 있도록 기능을 제공하고 있다. Python 설치 확인하기 태블로와 파이썬을 연동하기 위해서 태블로 데스크탑이 설치된 환경에 파이썬이 설치되어 있는지 확인해야 한다. 키보드에서 시..