전체 글
-
[Python] 파이썬 라이브러리 PandasAIData Analysis/Python 2024. 3. 4. 22:10
Table of ContentsIntroductionPandasAI란?Reference Introduction 2023년 10월 100달러 였던 엔비디아 주식은 최근 800달러를 넘으며 앤비디아(NVIDIA) 주가가 미친듯이 치솟고 있다. AI과 관련된 테마주 역시 상당한 반응을 보이며 다시 한번 AI 세상에 살고 있음을 느끼게 하고 있다. 매일 AI 신기술들이 발표되고 있을 정도인데, 데이터를 분석하고 모델을 만드는 직업을 갖고 있다면 많이 사용하고 있는 언어 파이썬의 새로운 라이브러리를 소개하려고 한다. 특히, 기존에 데이터를 처리하거나 분석하는 과정에서 오랜 시간을 소비했던 영역을 자연어를 활용하여 손쉽게 처리할 수 있게 했다는 점에서 굉장한 매력을 갖고 있다. 바로 PandasAI인데, LLM을 ..
-
[Tableau Tip] 대시보드 조회 시 최신 날짜로 화면 조회 기능 구현하기Data Visualization/Tableau Dashboard(Tip) 2024. 2. 15. 23:24
Table of ContentsIntroduction샘플 데이터기능 구현하기Reference Introduction Tableau를 이용하여 데이터를 시각화하고 팀 내부에서 공유하기 위해 Tableau Server에 게시를 해야 한다. 이때, 우리는 데이터를 미리 갱신하고 Tableau 대시보드를 조회할 경우 최근에 게시했던 정보를 노출하는 것이 일반적이다. 다만, Tableau에서는 매개 변수(Parameter)를 활용하여 최근일에 대한 데이터를 조회할 수 있다. 이는 비즈니스에서 가장 당연하게 생각할 기능이지만 기본 기능으로 제공하지 않았기 때문에 그 방법에 대해 이해 할 필요가 있다.샘플 데이터 먼저 2024년 1월 1일부터 1월 7일까지 발생한 지표 데이터이다. 심플한 데이터 셋이지만 최신 날짜를..
-
[Python]공공데이터포탈 DEADLINE_HAS_EXPIRED_ERROR 해결Data Analysis/Python 2024. 2. 12. 12:28
Table of Contents공공 데이터 포탈 API 활용공공 데이터 포탈 주요 에러 코드DEADLINE_HAS_EXPIRED_ERROR 조치 방법 공공 데이터 포탈 API 활용최근 공공데이터를 활용하는 사례가 늘어남에 따라 API사용에 따른 이슈가 발생하기도 한다. 해당 사례는 지역코드를 받기 위한 API를 사용하는 과정에서 발생한 이슈인데, DEADLINE_HAS_EXPIRED_ERROR가 나타난 것이다. 대부분의 사람들이 코드를 입력하는 과정에서 일단 나오는 에러는 뭔지 자세히 읽어보지 않는 것처럼 본인 역시도 대충 건너띄기 마련이다. 도대체 무슨에러인지 일단 구글부터 찾는 맛 아니겠는가import requestsurl = 'http://apis.data.go.kr/1741000/StanRegin..
-
[책 리뷰] Streamlit으로 프로젝트 한방에 끝내기 with 파이썬(개정판)Data 이모저모/책 리뷰 2024. 2. 12. 12:03
Table of ContentsIntroduce시작하기 전개정판 특징저자 직강Reference Introduce 데이터 분석부터 머신 러닝 모델 개발까지, 파이썬은 그 놀라운 다양성으로 개발자와 연구자 사이에서 인기 있는 언어가 되었다. 이러한 인기에 힘입어 파이썬을 활용할 수 있는 다양한 도구가 생겨났는데 그 중에서도 Streamlit은 데이터 과학 프로젝트를 손쉽게 웹 애플리케이션으로 전환하는 도구이다. 이 글에서는 Streamlit을 활용해 파이썬 프로젝트를 효율적으로 완성하는 방법에 대해 상세하게 다루고 있다. 개발자와 데이터 과학자는 물론, 이 분야에 관심이 있는 모든 사람들에게 필요한 정보를 담았다.시작하기 전 Streamlit을 효과적으로 사용하기 위해서는 파이썬과 관련 라이브러리에 대한 기..
-
[R] xmlToDataFrame()을 이용하여 xml 문서 파싱하기Data Analysis/R 2024. 1. 21. 20:47
Table of ContentsIntroductionXML libraryxmlToDataFrame 함수Reference Introduction 웹에 게시된 데이터를 가져오기 위해 크롤러를 만들거나 API를 사용해서 데이터를 수집한 경우 xml 형태로 데이터가 오게 되고 이런 데이터를 깔끔하게 정리하지 않으면 바로 분석에 사용하기 어렵다. 따라서 xml을 테이블 형태로 파싱할 수 있는 기능을 구현해야 하지만 그 때 그때 만들기가 쉽지 않다. XML library 주로 XML 문서를 읽거나 생성하기 위해 많이 사용하는 라이브러리 중 하나로 R에서 데이터를 크롤링하여 사용하거나 API를 호출해서 데이터를 수집할 경우 데이터를 파싱하기 위해 사용하는 라이브러리 중 하나이다. CRAN Team이 주도하여 만들..
-
[Python]파이썬 자료 구조2(튜플편)Data Analysis/Python 2024. 1. 19. 00:54
Table of Contents 튜플(Tuple) Reference 튜플(Tuple) 리스트와 같이 여러 요소들을 갖고 있는 자료구조이다 다만, 수정 및 삭제가 자유로웠던 리스트와는 달리 수정이 불가능한 튜플은 데이터의 변경이 필요 없는 경우에 한해 사용한다. 특히, 리스트에 비해 메모리를 적게 사용한다. 튜플의 경우 할당하기 위해 소괄호를 활용한다. sample = (‘test1’, ‘test2’, ‘test3’) 생성한 리스트의 특정 요소를 선택하기 위해 인덱스를 활용하는데, R과 다르게 0부터 시작한다는 점이 특징이다. 다만, 파이썬에서 음수를 이용하여 인덱스가 가능하다. -1의 경우 가장 마지막 요소를 호출하게 되고, -2는 뒤에서 두번째 요소를 호출하게 된다. 리스트 내 요소를 호출하는 또 다른..
-
[Data 이모저모] DALL·E란 무엇인가?Data 이모저모 2024. 1. 12. 19:21
Table of ContentsIntroductionDALL·E란?결론Reference Introduction최근 '달리'라는 이름을 많이 들어봤을 것이다. 초현실주의 작가인 살바도르 달리(Salvador Dali)를 말하는 것은 아닐 것이다. 2021년 1월 5일 OpenAI에서 출시한 달리(DALL-E)는 2022년 4월 6일 버전이 업그레이드 되면서 달리2로 세상을 마주하게 되었다. 그 전까지 인공지능을 활용한 기술이 얼마나 활용이 되겠냐고 생각했으나 실제 달리2가 등장하고 나서 미술, 패션, 건축, 마케팅까지 다양한 분야에 걸쳐서 혁신을 하기 시작했고 생성형 AI를 활용한 다양한 도서들이 출간되기 시작했다. 2023년 9월 달리3이 출시되면서 이미지를 좀 더 자세하게 구현할 수 있게 되었다. D..
-
[SQL] 짝수와 홀수인 조건으로 조회하기Data Analysis/SQL 2023. 12. 16. 12:24
Table of ContentsQuestionAnswerReference Question Query a list of CITY names from STATION for cities that have an even ID number. Print the results in any order, but exclude duplicates from the answer.The STATION table is described as follows: where LAT_N is the northern latitude and LONG_W is the western longitude. AnswerQuestion quest us how to query the City names that have an even ID num..