-
[Tableau Tip] 태블로에서 정규표현식 활용하기Data Visualization/Tableau Dashboard(Tip) 2022. 10. 23. 15:12반응형
Table of Contents
- Introduction
- 태블로 정규표현식
- 태블로 정규표현식 활용 함수
- Reference
Introduction
다양한 텍스트 데이터가 수집함에 따라 유사한 패턴을 갖고 있는 텍스트만 발췌하여 분석을 하거나 시각화를 하려는 니즈가 늘어나고 있다. 이때, 유사한 패턴을 도출하기 위해 정규표현식을 사용하게 된다. 정규표현식이란 특정한 규칙을 가진 문자열의 집합을 표현하는데 사용하는 언어이다.
태블로 정규표현식
태블로에서 사용하고 있는 정규표현식은 Internation Components for Unicode에서 제공하고 있는 정규표현식을 따른다. 어떤 방식으로 정규표현식이 사용 가능한지 목록을 살펴보자. 먼저, 아래의 문자와 숫자 패턴을 정규표현식으로 사용할 경우 메타캐릭터(\d, \w)를 조합하여 사용할 수 있다.
구분 설명 \d 모든 숫자 \D 모든 숫자를 제외한 모든 값 \w 모든 문자 \W 문자 이외의 값 정규표현식에서도 다양한 연산자를 활용하여 패턴을 조합할 수 있다.
구분 설명 | or * 0회 이상 등장 + 1회 이상 등장 ? 0 또는 1회 등장 {n} 정확하게 n회 등장 {n,} n회 이상 반복하여 등장 {n, m} n ~ m번 반복하여 등장 메타캐릭터를 이용한 정규표현식 외에도 정규표현식을 사용하는 방법이 있다.
구분 설명 [abc] abc가 담긴 문자 [^abc] abc가 담긴 문자를 제외한 나머지 [A-M] A부터 M까지 사이에 포함된 문자 [a-z][A-Z][0-9] 모든 문자 [a-zA-Z0-9] 모든 문자 태블로 정규표현식 활용 함수
태블로에서 정규표현식을 적용하기 위한 함수는 크게 REGEXP_REPLACE, REGEXP_MATCH, REGEXP_EXTRACT, REGEXP_EXTRACT_NTH가 있다. 각 함수에 쓰여진 'string'에 정규표현식으로 탐색할 변수를 지정하고 'pattern'에 정규표현식을 입력하고, 'replacement'에는 대체할 문자열을 넣은다. index에는 인덱스 값을 지정하는데 인덱스 값에 0을 넣을 경우에는 정규표현식으로 태깅된 전체 값이 반환하게 된다.
구분 설명 REGEXP_REPLACE(string, pattern, replacement) 정규표현식으로 지정된 문자열을 대체하기 위해 사용하는 함수 REGEXP_MATCH(string, pattern) 정규표현식으로 지정된 문자열이 존재하는지 체크하는 함수 REGEXP_EXTRACT(string, pattern) 정규표현식으로 지정된 문자열이 존재하는 경우 해당 값을 반환하는 함수 REGEXP_EXTRACT_NTH(string, pattern, index) 정규표현식으로 지정된 문자열이 여러개 존재하는 경우 인덱스 값에 따라 해당 값을 반환하는 함수 Reference
"정규표현식", https://help.tableau.com/current/pro/desktop/ko-kr/functions_functions_additional.htm
"International Components for Unicode(ICU)", https://unicode-org.github.io/icu/userguide/strings/regexp.html
반응형'Data Visualization > Tableau Dashboard(Tip)' 카테고리의 다른 글
[Tableau Tip] 태블로 함수, 계산된 필드 사용하기 (2) 2023.05.17 [Tableau Tip] 태블로에서 매개 변수를 활용한 ONOFF 기능 구현하기 (3) 2023.05.13 [Tableau Tip] 태블로 퍼블릭에서 구글 드라이브 연동하기 (0) 2021.10.11 [Tableau Tip] Tabpy를 이용한 대시보드 구성하기 (0) 2021.08.22 [Tableau Tip] 대시보드에 글꼴 적용하기 (0) 2021.08.11