ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Data 이모저모] 데이콘, 한국판 캐글대회
    Data 이모저모 2020. 11. 30. 03:10

    Table of Contents

    1. Introduction

    2. 캐글(Kaggle)이란?

    3. 한국판 캐글, DACON

    4. Reference

     

    Introduction

     빅데이터 분석의 수요 뿐만 아니라 데이터 분석가에 대한 관심도는 나날이 늘고 있다. 해외에서는 기업이 데이터를 제공하고 일반인들이나 데이터 분석가들이 목표 점수를 달성하기 위한 경쟁을 하고 있었다. 우리나라 역시 해외에서 유명한 분석 대회 플랫폼인 캐글(www.kaggle.com/)에 참여하는 사람들이 늘고 있다. 여기에 2020년 7월 14일 코로나19로 인해 경기 회복을 위한 국가 프로젝트로 디지털 뉴딜 정책을 발표했다. 이로 인해 데이터 분석에 대한 니즈 뿐만 아니라 관련된 자리도 늘어가는 추세이다. 그럼에도 신입 인력에 대한 확충은 아직도 부족한 상황이다.

    <그림 1> 기획재정부에서 발표한 한국판 뉴딜 구조

     

    캐글(Kaggle)이란?

    2010년 설립한 분석 대회 플랫폼으로 기업과 단체에서는 데이터를 제공하고, 데이터 분석가들이 참여해서 모델을 개발하고 서로 경쟁한다. 대회는 수시로 생기도 있으며, 각 각의 대회에는 상금이 걸려있다. 캐글 홈페이지에서 상단에 있는 Compete를 선택하면, 현재 진행 중인 대회를 볼 수 있다. 기본적으로 데이터를 제공하는 기업과 단체에서는 데이터에 대한 기본적인 설명을 제공하고 있으며, 모델에 대한 평가 방법, 일정, 상금, 코드에 대한 필요 조건 등을 설명하고 있다.

    대회에 참여한 분석가들은 본인이 개발한 모델을 바탕으로 예측한 결과를 제출하면 리더보드에 본인의 등수와 예상되는 점수가 나타난다. 종종 기준이 되는 베이스라인 코드를 제공하기도 한다.

    <그림 2> 캐글 페이지

    한국판 캐글, DACON

    2018년 5월 캐글과 같은 플랫폼이 국내에 설립되었다. 국내 기업들의 데이터를 바탕으로 분석할 수 있는 기회가 생겼으며, 데이터 분석에 관심 있는 다양한 사람들이 참여할 수 있는 기회가 점차 늘어난 셈이다. 캐글과 동일하게 R 또는 Python을 이용해서 분석할 수 있으며, 어떤 툴을 사용하더라도 큰 문제는 없다. 아쉽게도 국내에서는 R보다 Python에 치중되어 사용하고 있다. 최근에는 분석 툴과 함께 시각화 툴로 알려진 Tableau를 활용한 시각화 분석 대회도 종종 개최된다. 2020년 11월 마지막 날인 오늘 기준으로 총 47개의 대회를 개최했으며, 3억 6천여만원의 상금이 걸렸다.

    <그림 3> 데이콘

    Reference

    기획재정부, "한국판 뉴딜(New Deal)", www.moef.go.kr/mp/nd/newDeal.do

    Kaggle, www.kaggle.com/

    Dacon, dacon.io/

    댓글

Designed by Tistory.