전체 글
-
[R] Bar Chart Race 재현 02Project/Bar Chart Race (with R) 2020. 7. 5. 22:41
목차 [R] Bar Chart Race 재현 01 서론 지난 1년 동안 Bar Chart Race와 관련된 영상들이 계속해서 등장하여 많은 인기를 끌고 있다. 실제 Bar Chart Race를 구성해서 제공하는 콘텐츠부터, 다양한 툴을 활용하여 이를 제작하는 과정까지를 소개하는 콘텐츠들이 이에 해당한다. Bar Chart Race의 경우 다이나믹한 데이터 시각화를 애니메이션으로 보여주기 때문에 데이터에 대한 변화를 쉽게 이해 할 수 있다는 장점을 가지고 있다. Bar Chart Race를 재현하기 위한 연구모형으로 지난 Bar Chart Race 재현 01에서 을 소개하였다. 이번 재현에서는 원천 데이터를 수집하는 것부터 시작해서 원하는 형태로 데이터를 가공하는 전처리 단계까지의 데이터 엔지니어링(Dat..
-
[Algorithms] 연관 규칙(Association Rule) 분석Data Analysis/Algorithms 2020. 7. 4. 18:06
Table of Contents Introduction 연관 규칙(Association Rule)이란? 연관 규칙의 이해 연관성 분석 in R Reference Introduction 데이터 마이닝에 관심이 있는 사람들이라면 기저귀를 사는 사람이 맥주도 산다는 사례를 들어본 적이 있을 것이다. 남편에게 기저귀 심부름을 하면 맥주를 사오는 현상에 따라 진열장을 재 배치했다는 이 사례는 Rakesh Agrawal이 Marks & Spencer 라는 영국의 할인점 체인에서 시도한 분석 기법이다. 다만, 이게 실제 성공한 사례인지에 대해서는 알려진 바 없다. 바코드 시스템 도입으로 리테일 산업에서 대용량 데이터가 발생하기 시작했으며 이를 장바구니 데이터라고 부른다. 이런 대용량 데이터를 수집하기 전부터 도대체 ..
-
통계적 검정은 어떻게 하는가?Data Analysis/Statistics 2020. 6. 27. 19:19
Table of Contents Introduction 통계적 가설(Statistical Hypothesis)이란? 검정통계량(Test Statistic)이란? 오류(Error)와 유의수준(Significance level)이란? Reference Introduction 현대의 통계학과 다르게 대푯값을 집계만 해도 괜찮았던 시기가 있었다. 평균을 구하거나 백분률을 계산하는 방식의 고전적인 통계는 19세기 초에 세계적으로 널리 확산됐다. 간호사로 알려져 있는 나이팅게일(Florence Nightingale, 1820 ~ 1910)도 이러한 방법을 사용해서 참전했던 군인들의 현황을 집계하여, 전시에 사망한 군인보다 야전 병원에서 병균으로 전염된 환자의 수가 많다는 것을 알 수 있었다. 이를 바탕으로 전장 물..
-
[R] AI기반 작곡 솔루션(AI MUSIC) 재현 05Project/AI Music (with R) 2020. 6. 21. 01:31
목차 Markov Chain(마코프 연쇄) [R] AI기반 작곡 솔루션(AI MUSIC) 재현 01 [R] AI기반 작곡 솔루션(AI MUSIC) 재현 02 [R] AI기반 작곡 솔루션(AI MUSIC) 재현 03 [R] AI기반 작곡 솔루션(AI MUSIC) 재현 04 서론 지난 3월부터 시작해서 4월 25일까지 약 2달간 동안 인공지능 작곡 프로그램을 재현하는 프로젝트를 수행하였다. 프로젝트는 Markov Chain을 능동적으로 익히기 위해서 수행했으며, 작곡 프로그램의 End-to-end를 설계하고 개발하는데 그 목적을 가지고 있다. 프로젝트 명칭은 AI기반 작곡 솔루션(AI MUSIC) 재현으로 하였으며, 총 5차례에 걸쳐 블로그에 설명을 나누고 있다. 이번 프로젝트를 수행하는 동안 오픈소스인 R..
-
회귀분석 1탄 - 단순선형회귀분석Data Analysis/Statistics 2020. 6. 16. 23:59
Table of Contents Introduction 확률이란? Reference Introduction 19세기 초 프랑스 수학자인 아드리앵마리 르장드르에 의해 발표되었던 선형 회귀(Linear Regression)은 변수 간의 상관관계를 분석하는 방법 중 하나이다. 혜성 궤도를 연구하고 있던 르장드르가 "Nouvelles méthodes pour la détermination des orbites des comètes" 논문을 발표하면서 나온 변수들 간 선형 관계를 모델링하는 방법을 제안하였는데 이는 선형회귀 분석의 초석이 되는 중요한 아이디어 중 하나이다. 이후 1877년 영국의 수학자 프란시스 골턴에 의해 유전 형질 예측을 다루었던 "Typical Laws of Heredity"에 활용하였다. ..
-
로또에 당첨될 확률Data Analysis/Statistics 2020. 6. 16. 22:42
Table of Contents Introduction 확률이란? 확률의 공리적 정의란? 조건부확률이란? Reference Introduction 어떤이는 한주를 로또를 기대하는 마음으로 보내기도 하고 어떤이는 매주마다 추첨하는 로또를 보면서 1등에 당첨됐으면 하는 바람을 가지고 있다. 2002년 12월 7일을 시작으로 매주마다 추첨했던 로또는 오늘날짜 기준으로 로또는 915회차를 진행해왔으며, 약 54조원어치 판매를 달성하였으며, 절반에 해당하는 약 27조가 당첨금으로 사용되었다. 로또는 45개의 숫자 중에서 순서와 관계없이 6개의 숫자가 일치하면 1등에 당첨된다. 이때, 1등에 당첨될 확률은 8,145,060분의 1이란 결과가 나온다. 확률이란? 로또에 당첨될 확률이 저렇게 낮은데, 도대체 확률이란 ..
-
[R] AI기반 작곡 솔루션(AI MUSIC) 재현 04Project/AI Music (with R) 2020. 6. 10. 00:56
목차Markov Chain(마코프 연쇄)[R] AI기반 작곡 솔루션(AI MUSIC) 재현 01[R] AI기반 작곡 솔루션(AI MUSIC) 재현 02[R] AI기반 작곡 솔루션(AI MUSIC) 재현 03 서론 프로젝트의 마지막 단계이며 몇 가지 향후 연구를 남겨두고자 한다. 먼저, 이번 프로젝트에서 사용한 Markov Chain에 대해 간단하게 이해할 필요가 있기에 관련 자료를 첨부하였으며, [Project] AI기반 작곡 솔루션(AI MUSIC) 재현 01에서는 AI기반 작곡 솔루션에 대한 선행 연구를 바탕으로 의 Markov Chain 기반 AI Composer를 정리하였다. 재현 02에서는 Modeling Process를 재현하였으며, 소리를 발생시키는 라이브러리인 tuneR 함께 소개하였다. ..
-
[R] AI기반 작곡 솔루션(AI MUSIC) 재현 03Project/AI Music (with R) 2020. 5. 31. 02:56
목차Markov Chain(마코프 연쇄)[R] AI기반 작곡 솔루션(AI MUSIC) 재현 01[R] AI기반 작곡 솔루션(AI MUSIC) 재현 02 서론 두 차례에 걸쳐 AI기반 작곡 솔루션에 대한 이론과 Markov Chain Model 기반의 인공지능 작곡 솔루션(AI MUSIC) 연구 모형의 모델을 생성하는 과정을 살펴보았다. Markov Chain 기반 AI Composer 연구모형에 대한 간단한 리뷰를 하자면, 과 같이 모델을 생성하는 과정(Modeling Process)과 모델을 기반으로 작곡을 하는 과정(Compose Process)으로 구성되어 있다. 지난번에 이어 세번째로 소개하고자 하는 부분은 생성된 모델을 기반으로 작곡하는 과정을 재현하고자 한다. Markov Chain 기반 AI..