정규 표현식 (Regular Expression 또는 Regex)은 문자열에서 특정 패턴을 찾거나 대체, 추출하는데 사용되는 패턴 기반의 텍스트 처리도구이다.
정규 표현식은 문자열의 유효성 검사, 텍스트 검색 및 대체, 문자열 분할 등 다양한 문자열 작업에 유용하다.
정규 표현식은 패턴을 정의하는 문자열이다 이 패턴은 문자열의 일부 또는 전체와 일치하는 문자 조합을 표현한다.
패턴은 특정 문자, 문자 클래스,메타 문자, 반복, 그룹화 및 조건부 등을 포함할 수 있다
일반적으로 정규 표현식에서 사용되는 메타 문자 몇가지는 아래와 같다
' . ' (마침표): 어떤 문자 하나와 일치한다
' [] ' (문자 클래스): 괄호 내에 있는 어떤 문자와 일치한다.
' * ' (별표) : 앞의 요소가 0회 이상 반복되는 것과 일치한다.
' + ' (더하기) : 앞의 요소가 1회 이상 반복되는 것과 일치한다
' ? ' (물음표) : 앞의 요소가 0회 또는 1회 나타나는 것과 일치한다.
' () ' (그룹화) : 괄호 내에 있는 패턴을 그룹화하고 캡처한다.