반응형
포스트 목적
계속되는 구글링과 GPT 의 도움에서 벗어나기 위해, 정규표현식에 대표적으로 사용되는 기호와 그 기호를 이용한 몇 가지 예시를 정리하였습니다.
참고로 아래 예시는 / / 을 사용하지 않았습니다. 이에 대한 예는 다음에 따로 정리할 생각입니다.
여기서의 예시는 이러한 방식으로 사용되는 구나에 대한 참고 및 이해 용도로 보시는게 좋다고 봅니다.
대표적인 정규표현식 기호
/ | 정규표현식 패턴을 시작하는 기호입니다. |
^ | 문자열의 시작을 나타내는 기호입니다. 이 기호 뒤에 오는 패턴은 문자열의 시작 부분에서만 매칭됩니다. |
$ | 문자열의 끝을 나타내는 기호입니다. 이 기호 앞에 오는 패턴은 문자열의 끝 부분에서만 매칭됩니다. |
[ ] | 대괄호 안에 있는 문자 중 하나와 매칭되는지 검사하는 기호입니다. [abc]는 'a', 'b', 'c' 중 하나와 매칭됩니다. |
- | 대괄호 안에서 범위를 나타내는 기호입니다. [a-z]는 'a'부터 'z'까지의 문자 중 하나와 매칭됩니다. |
+ | 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 예를 들어, [a]+는 'a'가 하나 이상 연속해서 나타나는 문자열과 매칭됩니다. |
* | 바로 앞에 있는 패턴이 0개 이상 나타나는지 검사하는 기호입니다. [a]*는 'a'가 0개 이상 연속해서 나타나는 문자열과 매칭됩니다. |
? | 바로 앞에 있는 패턴이 0개 또는 1개 나타나는지 검사하는 기호입니다. [a]?는 'a'가 0개 또는 1개 나타나는 문자열과 매칭됩니다. |
. | 어떤 한 문자와 매칭되는지 검사하는 기호입니다. 예를 들어, .는 'a', 'b', 'c', ... , 'z', 'A', 'B', 'C', ... , 'Z' 등 어떤 한 문자와 매칭됩니다. |
() | 괄호 안에 있는 패턴을 그룹화하는 기호입니다. 이를 통해 논리적으로 묶여진 하위 패턴들을 더 복잡한 패턴으로 만들 수 있습니다. |
\ | 다른 문자와 결합하여 특별한 의미를 갖는 이스케이프 문자입니다. 예를 들어, \.은 점(.) 문자 자체를 검사할 수 있게 합니다. |
기호를 활용한 예시
[0-9]+ | 하나 이상의 숫자와 매칭되는 정규표현식입니다. 예를 들어, "123", "4567"과 같은 문자열과 매칭됩니다. |
[0-9] : 0부터 9까지의 숫자 중 하나와 매칭됩니다. + : 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 하나 이상의 숫자가 연속해서 나타나는 문자열과 매칭됩니다. |
|
^[a-zA-Z]+$ | 알파벳 대소문자로만 이루어진 문자열과 매칭되는 정규표현식입니다. |
^: 문자열의 시작을 나타내는 기호입니다. [a-zA-Z]: 알파벳 대소문자 중 하나와 매칭됩니다. +: 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 알파벳 대소문자가 하나 이상 연속해서 나타나는 문자열과 매칭됩니다. $: 문자열의 끝을 나타내는 기호입니다. |
|
\d{3}-\d{4} | 전화번호 형식(XXX-XXXX)의 문자열과 매칭되는 정규표현식입니다. |
\d: 0부터 9까지의 숫자 중 하나와 매칭됩니다. { 3 }: 앞의 패턴이 3번 반복되는지 검사하는 기호입니다. 이 경우, 숫자가 3번 반복되는지 검사하므로, 'XXX'와 매칭됩니다. - : 하이픈(-) 문자와 매칭됩니다. (즉, 정규표현식의 타겟은 무조건 - 을 포함하고 있어야 합니다.) { 4 }: 앞의 패턴이 4번 반복되는지 검사하는 기호입니다. 이 경우, 숫자가 4번 반복되는지 검사하므로, 'XXXX'와 매칭됩니다. |
|
[a-z0-9._%+-] + @ [a-z0-9.-] + \.[a-z]{2,} |
이메일 주소 형식의 문자열과 매칭되는 정규표현식입니다. |
[a-z0-9._%+-]: 알파벳 소문자, 숫자, 특정 기호 중 하나와 매칭됩니다. +: 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 이메일 주소의 로컬 파트([a-z0-9._%+-])에 해당하는 부분이 하나 이상의 문자로 이루어져 있어야 합니다. @: '@' 문자와 매칭됩니다. [a-z0-9.-]: 알파벳 소문자, 숫자, 하이픈(-), 마침표(.) 중 하나와 매칭됩니다. + : 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 이메일 주소의 도메인 파트에 해당하는 부분([a-z0-9.-])이 하나 이상의 문자로 이루어져 있어야 합니다. \. : 백슬래시()를 이용하여 마침표(.) 문자를 이스케이프 처리한 것입니다. 이메일 주소에서 마침표는 도메인의 구분 기호로 사용되므로, 검사 대상이 아니라 이스케이프 처리해야 합니다. [a-z]{2,}: 알파벳 소문자가 2번 이상 연속해서 나타나는지 검사하는 패턴입니다. 이 경우, 이메일 주소의 도메인 파트에서 최소 2글자 이상으로 이루어져 있어야 합니다. |
반응형
'정규표현식' 카테고리의 다른 글
[정규표현식] 자주 쓰이는 플래그 유형 (0) | 2023.03.09 |
---|