R library
-
인터랙티브 웹앱 위한 라이브러리 shinyData Analysis/R 패키지 2022. 10. 29. 14:59
Table of Contents Introduction shiny 라이브러리 Reference Introduction 데이터 분석부터 분석 결과 리포팅까지의 모든 과정을 분석가에게 요구하는 시대가 왔다. 그 만큼 분석가들에게 인터랙티브한 분석 결과를 기대하고 있는 것이다. 이에 따라 R에서는 데이터 분석부터 시작해서 웹앱을 생성할 수 있는 프레임워크가 존재한다. shiny는 R에서 웹앱 프레임워크이다. shiny는 ui와 server로 구성되어있다. ui는 화면을 구성하는 영역이고 server는 화면에 출력되기까지 데이터를 가공하는 과정을 핸들링하는 영역이다. shiny 라이브러리 R에서 분석한 결과를 웹앱으로 빠르게 구성할 수 있는 라이브러리가 shiny 이다. 웹 개발에 비해 상당히 간소화하여 구성하..
-
sql을 활용하기 위한 라이브러리 sqldfData Analysis/R 패키지 2022. 10. 26. 23:41
Table of Contents Introduction sqldf 라이브러리 Reference Introduction 대용량 데이터가 데이터베이스에 관리되고 있으며, 분석가들도 데이터베이스를 이용한 분석 사례가 늘고 있다. 이에 따라 분석가들에게도 SQL을 다루는 스킬이 반드시 필요한 시대가 되었다. 다만 데이터베이스를 설치하고 테이블을 설계하여 데이터를 적재하는 과정을 익히기 보다 SQL 자체를 익히기에 도움이 될 수 있는 라이브러리가 존재한다. 물론, 해당 라이브러리가 개발됐을 때에는 데이터베이스에서 데이터를 추출할때 SQL을 활용할 수 있도록 설계된 라이브러리이다. 다만, 데이터베이스에 연결하지 않더라도 SQL을 사용할 수 있기 때문에 해당 라이브러리는 R에서 SQL을 익히기에 적합한 라이브러리라고..
-
임의 추출을 위한 R 패키지 samplingData Analysis/R 패키지 2022. 10. 22. 18:44
Table of Contents Introduction sampling 라이브러리 Reference Introduction 오늘날과 같이 수 많은 데이터가 발생하는 과정에서 전수 조사가 어려운 경우가 발생하기도 한다. 이때, 모집단을 대표하는 표본을 대상으로 분석을 수행하는데 임의 추출을 사용한다. 임의 추출에는 단순 임의 추출, 층화 추출, 계통 추출이 있다. 단순 임의 추출의 경우에는 전체 데이터에서 모든 샘플 데이터가 동일한 확률로 추출하는 방법을 말한다. 층화 추출의 경우에는 모집단의 특성을 최대한 반영할 수 있도록 몇계의 층을 나누어 각 층별로 임의 표본 추출을 하는 것이다. 따라서 층화 추출의 경우에는 층 간 데이터의 성격이 이질적이며, 층 내에 데이터의 성격은 동질적이다. 마지막으로 계통 추..
-
[NLP] 자연어처리(Natural Language Processing)란?Data Analysis/Natural Language Processing 2021. 8. 22. 16:28
Table of ContentsIntroduction자연어처리(Natural Language Processing)란?자연어처리 프로세스Reference Introduction자연어 처리는 인간과 컴퓨터 간의 소통을 돕는 기술 중 하나로, 컴퓨터가 인간의 언어를 이해하고 생성하는 것을 가능하다. 예를 들어, 이제는 인공지능 스피커를 통해 음성 명령을 내리거나, 챗봇(Chat-bot)을 통해 대화를 나누는 것이 일상적인 일이 되었다. 이러한 기술이 가능한 것은 바로 자연어 처리 기술 덕분이다. 다만, 현재의 자연어 처리는 아직까지 높은 정확도를 보여주고 있지 않다. 컴퓨터가 미묘한 문장의 의미나 뉘앙스를 정확하게 파악하는 것은 어려운 일이기 때문이다. 이러한 한계를 극복하기 위해 연구가 지속적으로 이루어지..