RStudio
-
[R] xmlToDataFrame()을 이용하여 xml 문서 파싱하기Data Analysis/R 2024. 1. 21. 20:47
Table of ContentsIntroductionXML libraryxmlToDataFrame 함수Reference Introduction 웹에 게시된 데이터를 가져오기 위해 크롤러를 만들거나 API를 사용해서 데이터를 수집한 경우 xml 형태로 데이터가 오게 되고 이런 데이터를 깔끔하게 정리하지 않으면 바로 분석에 사용하기 어렵다. 따라서 xml을 테이블 형태로 파싱할 수 있는 기능을 구현해야 하지만 그 때 그때 만들기가 쉽지 않다. XML library 주로 XML 문서를 읽거나 생성하기 위해 많이 사용하는 라이브러리 중 하나로 R에서 데이터를 크롤링하여 사용하거나 API를 호출해서 데이터를 수집할 경우 데이터를 파싱하기 위해 사용하는 라이브러리 중 하나이다. CRAN Team이 주도하여 만들..
-
[R] WARNING: Rtools is required to build R packagesData Analysis/R 2023. 3. 29. 22:43
Table of ContentsIntroductionRtools 경고 메시지 원인조치 방법Reference Introduction 최초로 특정 환경에 설치한 후에 R패키지를 설치할 경우 다음과 같은 경고 메세지가 나타나는 것을 왕왕 본적이 있을 것이다. 일단, 경고는 에러든 빨간색 글씨만 나타나면 치를 떨고 꺼버리고 싶은 심경일 것이다. 대부분의 프로그래밍 언어는 해결하는 방식을 가이드하고 있다. 다만, 영어로 써있다는 점이 한국에서 코딩을 하는 사람들에게 굉장히 불편하게 다가오긴 한다. Rtools 경고 메시지 원인 Warning 뒤에 현재 R 버전에 맞게 동작하는 Rtools가 설치 되어 있지 않아서 설치해야만 한다고 나타난다. 현재 설치된 Rtools는 3.5이다. 이 글을 작성하고 있는 시점에..
-
머신 러닝을 위한 라이브러리 caretData Analysis/R 패키지 2023. 3. 26. 23:24
Table of Contents Introduction caret 라이브러리 Reference Introduction 2016년 3월 9일부터 10일, 12일, 13일, 15일까지 열린 5번 대결로 이세돌 9단과 구글 딥마인드에서 개발한 알파고의대결에서 승리한 알파고 덕에 인공지능에 대한 관심이 폭발적으로 늘기 시작했으며, 최근 오픈AI에서 개발한 Chatgpt로 한 차례 더 주목하기 시작했다. 이러한 인공지능을 구현하기 위해 다양한 머신러닝 알고리즘을 사용하는데, 이를 사용하기 위해서 R과 Python 등의 언어를 활용하여 수집한 데이터를 가공하여 학습 데이터와 검증용 데이터로 분류하고 문제에 맞는 머신러닝 알고리즘을 적용할 수 있다. 이때 사용하는 알고리즘에는 의사결정나무(Decision Trees)..
-
[R] 클립보드 활용하여 데이터 불러오기Data Analysis/R 2022. 5. 8. 15:32
Table of Contents Introduction 클립보드를 활용하여 데이터 불러오기 Reference Introduction 업무 하는 과정에서 정보를 수집하다보면, 웹에 게시된 테이블 형식의 데이터를 가져오기 위해 크롤러를 만들거나 복사해서 엑셀에 하나씩 붙여 넣고 수정해야 하는 경우 복잡하고 귀찮게 한다. 이를 보다 쉽게 처리하기 위해 클립보드에 있는 정보를 불러와서 처리할 수 있다. 클립보드를 활용하여 데이터 불러오기 국가코드를 활용하기 위해 위키피디아의 국가코드 목록을 접속한 뒤 복사할 대상을 지정하고 복사한다. 이후, 다음 코드를 입력하고 실행하면 복사된 내용이 클립보드에 저장되고 다시 R에서 해당 내용을 출력할 수 있게 된다. # windows용 read.table("clipboard"..
-
[R] R/R스튜디오 설치하기Data Analysis/R 2021. 8. 28. 20:50
Table of ContentsR 설치하기R 설치파일 다운로드 하기R 설치하기R 실행하기R스튜디오 설치하기R 스튜디오 설치파일 다운로드 하기R 스튜디오 설치하기 R 설치하기R을 사용하려면 PC에 R을 설치해야 합니다. R 공식 홈페이지에서는 관련된 최신 뉴스와 새로운 버전에 대한 릴리즈 노트를 제 공하고 있습니다. R과 관련된 최신 동향을 이해하기 위해 홈페이지에 방문하는 것 도 좋은 방법입니다. R 설치파일 다운로드 하기R 설치 파일은 R 공식 홈페이지의 CRAN Mirrors 페이지에서 다운로드 할 수 있습 니다. CRAN Mirrors 페이지는 지정된 국가별로 URL을 제공하고 있으며, 해당하는 국가 혹은 인접 국가의 페이지로 접속하여 다운로드 하는 것을 권장합니다.직접따라하기R 설치파일 다운..
-
[NLP] 자연어처리(Natural Language Processing)란?Data Analysis/Natural Language Processing 2021. 8. 22. 16:28
Table of ContentsIntroduction자연어처리(Natural Language Processing)란?자연어처리 프로세스Reference Introduction자연어 처리는 인간과 컴퓨터 간의 소통을 돕는 기술 중 하나로, 컴퓨터가 인간의 언어를 이해하고 생성하는 것을 가능하다. 예를 들어, 이제는 인공지능 스피커를 통해 음성 명령을 내리거나, 챗봇(Chat-bot)을 통해 대화를 나누는 것이 일상적인 일이 되었다. 이러한 기술이 가능한 것은 바로 자연어 처리 기술 덕분이다. 다만, 현재의 자연어 처리는 아직까지 높은 정확도를 보여주고 있지 않다. 컴퓨터가 미묘한 문장의 의미나 뉘앙스를 정확하게 파악하는 것은 어려운 일이기 때문이다. 이러한 한계를 극복하기 위해 연구가 지속적으로 이루어지..