EDA
-
[R] 신용카드 사용자 연체 예측 AI 경진대회 - EDAProject/AI Competition (with R) 2021. 4. 10. 11:03
Table of Contents 개요 EDA R markdown을 이용한 분석 - 2일차 Reference 개요 분석 기간 : 2021.04.05 ~ 2021.05.24 17:59 분석 주제 : 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 분석 배경 신용카드사는 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정합니다. 신용카드사는 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측합니다. 현재 많은 금융업계는 인공지능(AI)를 활용한 금융 서비스를 구현하고자 합니다. 사용자의 대금 연체 정도를 예측할 수 있는 인공지능 알고리즘을 개발해 금융업계에 제안할 수 있는 인사이트를 발굴해주세요! 대회 설명 : 신용카드 사용자..
-
[EDA] 똑똑하게 EDA하기Data Analysis/EDA 2020. 10. 31. 23:54
Table of Contents Introduction SmartEDA란? R에서 이용가능한 EDA 패키지 비교 Reference Introduction 데이터 분석을 활용하지 않는 곳이 없을 정도로 사회 각 지역의 다양한 곳에서 데이터를 수집하여 분석하고 있다. 대부분 데이터 분석에서 관심을 갖고 있는 영역은 통계 분석이나 머신 러닝을 이용한 문제 해결일 것이다. 그럼에도 데이터 분석에서 EDA는 가장 중요한 역할을 하고 있으며, 모든 곳에서 데이터 분석의 우선적인 프로세스로 수행하고 있다. [EDA] 탐색적 데이터 분석(Exploratory Data Analysis, EDA)에서 EDA에 대한 이해를 설명하고 있다. SmartEDA란? EDA는 크게 통계 분석 파트와 시각화 파트로 나뉜다. 데이터의 ..
-
[EDA] 탐색적 데이터 분석(Exploratory Data Analysis, EDA)Data Analysis/EDA 2020. 9. 30. 00:57
Table of Contents Introduction 탐색적 데이터 분석(EDA)란? Reference Introduction 데이터 분석을 하는 모든 사람들이라면 한번씩 접해볼 수 있는 용어 중 하나인 EDA는 데이터 입수 후에 가장 첫번째 단계이며, 내가 갖고 있는 데이터가 무엇인지 어떻게 생긴 데이터인지 확인할 필요가 있다. 만약 내가 가지고 있는 데이터에 빈칸만 존재한다면, 다음 스텝으로 넘어갈 수 없을 것이다. 따라서, 우리는 데이터 입수 후에 내 데이터에 빈칸이 존재하는지, 아니면 정상 범주에 포함되는 값이 들어가 있는지 확인할 필요가 있다. 이 과정을 강조하고 싶은 이유는 바로 여기에 있다. 실제 프로젝트를 할 경우 수집한 데이터가 정상적으로 잘 쌓여 있는지 아무도 아는 사람이 없다. 데이..