-
임의 추출을 위한 R 패키지 samplingData Analysis/R 패키지 2022. 10. 22. 18:44반응형
Table of Contents
- Introduction
- sampling 라이브러리
- Reference
Introduction
오늘날과 같이 수 많은 데이터가 발생하는 과정에서 전수 조사가 어려운 경우가 발생하기도 한다. 이때, 모집단을 대표하는 표본을 대상으로 분석을 수행하는데 임의 추출을 사용한다. 임의 추출에는 단순 임의 추출, 층화 추출, 계통 추출이 있다. 단순 임의 추출의 경우에는 전체 데이터에서 모든 샘플 데이터가 동일한 확률로 추출하는 방법을 말한다. 층화 추출의 경우에는 모집단의 특성을 최대한 반영할 수 있도록 몇계의 층을 나누어 각 층별로 임의 표본 추출을 하는 것이다. 따라서 층화 추출의 경우에는 층 간 데이터의 성격이 이질적이며, 층 내에 데이터의 성격은 동질적이다. 마지막으로 계통 추출은 모집단을 구성하는 구성요소에 순번을 정하고 n배수 샘플 데이터를 추출하는 방법이다. 예를 들어서 1번과 11번 그리고 21번을 하나의 샘플로 추출하는 것을 의미한다.
sampling 라이브러리
Yves Tillé과 Alina Matei에 의해 구현된 라이브러리로 임의 추출을 하기 위해 만들어진 라이브러리이다. 임의 추출 중 층화 추출을 수행하기 위한 샘플 코드이다.
install.packages("sampling") library("sampling") x = strata(c("Species"), size=c(3,3,3), method="srswr", data=iris) getdata(iris, x)
층화 추출한 결과를 이미지로 확인해보면, 붓꽃의 종에 따라 임의 추출이 진행된 것을 확인할 수 있다. 층화 추출의 특징을 그대로 나타난 결과이다.
Reference
"sampling", Yves Tillé et al., https://cran.r-project.org/web/packages/sampling/sampling.pdf
반응형'Data Analysis > R 패키지' 카테고리의 다른 글
상관관계 시각화를 위한 라이브러리 corrgram (0) 2022.11.22 텍스트 시각화를 위한 라이브러리 wordcloud (0) 2022.11.13 특정 기준에 따라 집계하기 위한 라이브러리 doBy (0) 2022.11.06 인터랙티브 웹앱 위한 라이브러리 shiny (2) 2022.10.29 sql을 활용하기 위한 라이브러리 sqldf (0) 2022.10.26