Data Analysis
-
대형언어모델(Large Language Model, LLM)이란?Data Analysis/Natural Language Processing 2023. 10. 14. 14:21
Table of Contents Introduction 대형언어모델(Large Language Model, LLM)이란? 대형언어모델의 전망 Reference Introduction 한 동안 ChatGPT에 대한 광풍이 불면서, ChatGPT를 활용한 다양한 책들이 등장하기 시작했다. OpenAI에서 제공하는 ChatGPT-3는 Open AI 홈페이지에서 무료로 제공하고 있어, 사용자들이 손쉽게 접근 할 수 있다. 한때, ChatGPT를 사용해서 과제나 시험의 부정행위로 사용했던 부정적인 이면을 보였음에도 ChatGPT를 활용한 다양한 사용법들이 가이드되고 있다. 기업에서는 신입사원들의 업무 지원을 하기 위한 목적으로도 활용하기도 하고, 인생의 2막을 열기 위해 블로그를 작성하거나 책을 쓰기 위해 기초 ..
-
[Python]파이썬 자료 구조1(리스트편)Data Analysis/Python 2023. 9. 24. 12:17
Table of Contents 리스트(List) Reference 리스트(List) 리스트는 여러 요소를 갖는 집합으로 새로운 요소를 수정하거나 삭제가 가능한 자료 구조이다. 또한, 자유롭게 확장할 수 있는 동적 배열의 특성을 갖고 있다. 요소가 없는 빈 리스트를 할당할 경우에는 대괄호를 활용한다. 리스트를 생성할 때 각 요소는 서로 다른 타입이어도 생성이 가능하며, 콤마(,)를 이용하여 요소를 구분하게 된다. sample = [] sample = [1, "JAY", False] 생성한 리스트의 특정 요소를 선택하기 위해 인덱스를 활용하는데, R과 다르게 0부터 시작한다는 점이 특징이다. 다만, 파이썬에서 음수를 이용하여 인덱스가 가능하다. -1의 경우 가장 마지막 요소를 호출하게 되고, -2는 뒤에서..
-
[Python]파이썬 기초 문법Data Analysis/Python 2023. 8. 4. 23:10
Table of Contents 문자열 출력하기 사칙연산 사용하기 소괄호 사용하기 몫과 나머지 계산하기 변수 할당하기 reference 문자열 출력하기 문자열 Hello, guys를 출력하기 위해 print() 함수를 사용할 수 있다. 다만, 'Hello, guys'는 문자열이기 때문에 문자열 앞뒤로 따옴표를 감싸서 입력해주어야 한다. print('Hello, guys') 사칙연산 사용하기 다른 언어들과 동일하게 더하기 연산자는 + 기호를 사용한다. 3+2를 하게 되면 두 숫자의 합인 5를 출력하게 된다. 빼기 연산자는 - 기호를 사용하고, 3-2를 하면 1이 출력된다. 곱하기 연산자는 * 기호를 사용하고, 3*2를 입력하면 6이 출력된다. 나누기 연산자는 / 기호를 사용하고, 3/2를 하면 1.5가 출..
-
[SQL] 날짜 함수를 이용하여 특정 기간 데이터 조회하기Data Analysis/SQL 2023. 6. 16. 19:10
Table of Contents Introduction MySQL 날짜 함수 날짜 함수를 활용한 데이터 조회 Reference Introduction 데이터베이스에서 데이터를 조회하고 이를 분석하고자 하는 일련의 과정이 과거에 비해 자연스러워짐에 따라 기업 내부에서 SQL을 능동적으로 사용하고 있다. 과거에는 데이터 분석가에게 잘 가공된 데이터를 제공해서 분석을 수행하고 결과물을 받아왔다면, 최근에는 직접 데이터베이스에서 조회 할 수 있는 권한 만 부여 받아 데이터를 자유롭게 분석할 수 있도록 하고 있다. 이에 따라 데이터 분석가에게 요구하는 기술로 자리를 잡아가고 있다. 다만, SQL의 기본 구조는 알기 때문에 특정 데이터베이스에 위치한 테이블을 조회하는데에는 무리가 없으나 각 데이터베이스의 함수의 이..
-
[SQL] Windows에서 MariaDB root 계정 분실 시Data Analysis/SQL 2023. 4. 5. 22:47
Table of Contents Introduction MariaDB root 계정 분실 시 조치 방법 Reference Introduction 데이터베이스를 자주 사용하는 입장에서는 Root 계정이나 본인이 할당 받은 계정을 자주 사용하기 때문에 잊어버릴일이 없다. 다만, 로컬 환경에 설치해 놓은 데이터베이스를 가끔 사용하는 학생 또는 분석가들의 경우 잊어버린 계정을 찾기 위해 한참을 헤매고 있을 것이다. 특히, 무료로 이용 가능한 MariaDB를 사용한다면 계정을 분실했을 경우 조치 방법을 알아두는 것을 추천한다. MariaDB root 계정 분실 시 조치 방법 1. 제어판에서 Administrative Tools에 들어간 후 서비스에 접속해서 MariaDB의 서비스 상태를 종료해준다. 2. Wind..
-
[R] WARNING: Rtools is required to build R packagesData Analysis/R 2023. 3. 29. 22:43
Table of Contents Introduction Rtools 경고 메시지 원인 조치 방법 Reference Introduction 최초로 특정 환경에 설치한 후에 R패키지를 설치할 경우 다음과 같은 경고 메세지가 나타나는 것을 왕왕 본적이 있을 것이다. 일단, 경고는 에러든 빨간색 글씨만 나타나면 치를 떨고 꺼버리고 싶은 심경일 것이다. 대부분의 프로그래밍 언어는 해결하는 방식을 가이드하고 있다. 다만, 영어로 써있다는 점이 한국에서 코딩을 하는 사람들에게 굉장히 불편하게 다가오긴 한다. Rtools 경고 메시지 원인 Warning 뒤에 현재 R 버전에 맞게 동작하는 Rtools가 설치 되어 있지 않아서 설치해야만 한다고 나타난다. 현재 설치된 Rtools는 3.5이다. 이 글을 작성하고 있는 시..
-
머신 러닝을 위한 라이브러리 caretData Analysis/R 패키지 2023. 3. 26. 23:24
Table of Contents Introduction caret 라이브러리 Reference Introduction 2016년 3월 9일부터 10일, 12일, 13일, 15일까지 열린 5번 대결로 이세돌 9단과 구글 딥마인드에서 개발한 알파고의대결에서 승리한 알파고 덕에 인공지능에 대한 관심이 폭발적으로 늘기 시작했으며, 최근 오픈AI에서 개발한 Chatgpt로 한 차례 더 주목하기 시작했다. 이러한 인공지능을 구현하기 위해 다양한 머신러닝 알고리즘을 사용하는데, 이를 사용하기 위해서 R과 Python 등의 언어를 활용하여 수집한 데이터를 가공하여 학습 데이터와 검증용 데이터로 분류하고 문제에 맞는 머신러닝 알고리즘을 적용할 수 있다. 이때 사용하는 알고리즘에는 의사결정나무(Decision Trees)..
-
[SQL] SQL(Structured Query Language)이란?Data Analysis/SQL 2023. 3. 23. 23:27
Table of Contents Introduction SQL이란? Reference Introduction 데이터베이스는 비즈니스, 의료, 교육, 금융, 정부 등 다양한 산업과 분야에서 널리 사용되고 있다고 할 수 있다. 대량의 데이터를 저장하고 관리해야 하는 거의 모든 조직이나 애플리케이션은 데이터베이스를 사용하여 이점을 얻을 수 있다. 특히, 데이터베이스는 데이터를 저장하고 구성하여 검색할 수 있는 중앙 집중형 데이터 관리를 하고 있기 때문에 조직이 정보를 기반으로한 의사 결정을 내리고 운영을 개선하는데 도움을 준다. 이러한 모습은 그림1과 같이 소프트웨어 아키텍처의 일반적은 패턴으로 나타나며, 다양한 조직에서 해당 아키텍처를 적용하고 있다. 오늘날 디지털 시대에 데이터의 중요성이 커짐에 따라 데이..