본문 바로가기

정규표현식

[정규표현식] 대표적인 기호와 예시

반응형

포스트 목적

계속되는 구글링과 GPT 의 도움에서 벗어나기 위해, 정규표현식에 대표적으로 사용되는 기호와 그 기호를 이용한 몇 가지 예시를 정리하였습니다.

 

참고로 아래 예시는 /  / 을 사용하지 않았습니다. 이에 대한 예는 다음에 따로 정리할 생각입니다.  

 

여기서의 예시는 이러한 방식으로 사용되는 구나에 대한 참고 및 이해 용도로 보시는게 좋다고 봅니다.


대표적인 정규표현식 기호

/ 정규표현식 패턴을 시작하는 기호입니다.
^ 문자열의 시작을 나타내는 기호입니다. 이 기호 뒤에 오는 패턴은 문자열의 시작 부분에서만 매칭됩니다.
$ 문자열의 끝을 나타내는 기호입니다. 이 기호 앞에 오는 패턴은 문자열의 끝 부분에서만 매칭됩니다.
[ ] 대괄호 안에 있는 문자 중 하나와 매칭되는지 검사하는 기호입니다. [abc]는 'a', 'b', 'c' 중 하나와 매칭됩니다.
- 대괄호 안에서 범위를 나타내는 기호입니다. [a-z]는 'a'부터 'z'까지의 문자 중 하나와 매칭됩니다.
+ 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 예를 들어, [a]+는 'a'가 하나 이상 연속해서 나타나는 문자열과 매칭됩니다.
* 바로 앞에 있는 패턴이 0개 이상 나타나는지 검사하는 기호입니다. [a]*는 'a'가 0개 이상 연속해서 나타나는 문자열과 매칭됩니다.
?  바로 앞에 있는 패턴이 0개 또는 1개 나타나는지 검사하는 기호입니다. [a]?는 'a'가 0개 또는 1개 나타나는 문자열과 매칭됩니다.
. 어떤 한 문자와 매칭되는지 검사하는 기호입니다. 예를 들어, .는 'a', 'b', 'c', ... , 'z', 'A', 'B', 'C', ... , 'Z' 등 어떤 한 문자와 매칭됩니다.
() 괄호 안에 있는 패턴을 그룹화하는 기호입니다. 이를 통해 논리적으로 묶여진 하위 패턴들을 더 복잡한 패턴으로 만들 수 있습니다.
\ 다른 문자와 결합하여 특별한 의미를 갖는 이스케이프 문자입니다. 예를 들어, \.은 점(.) 문자 자체를 검사할 수 있게 합니다.

 

기호를 활용한 예시

[0-9]+ 하나 이상의 숫자와 매칭되는 정규표현식입니다. 예를 들어, "123", "4567"과 같은 문자열과 매칭됩니다.
[0-9] : 0부터 9까지의 숫자 중 하나와 매칭됩니다.

+ : 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 하나 이상의 숫자가 연속해서 나타나는 문자열과 매칭됩니다.
^[a-zA-Z]+$ 알파벳 대소문자로만 이루어진 문자열과 매칭되는 정규표현식입니다.
^: 문자열의 시작을 나타내는 기호입니다.

[a-zA-Z]: 알파벳 대소문자 중 하나와 매칭됩니다.

+: 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 알파벳 대소문자가 하나 이상 연속해서 나타나는 문자열과 매칭됩니다.

$: 문자열의 끝을 나타내는 기호입니다.
\d{3}-\d{4} 전화번호 형식(XXX-XXXX)의 문자열과 매칭되는 정규표현식입니다.
\d: 0부터 9까지의 숫자 중 하나와 매칭됩니다.

{ 3 }: 앞의 패턴이 3번 반복되는지 검사하는 기호입니다. 이 경우, 숫자가 3번 반복되는지 검사하므로, 'XXX'와 매칭됩니다.

- : 하이픈(-) 문자와 매칭됩니다. (즉, 정규표현식의 타겟은 무조건 - 을 포함하고 있어야 합니다.)

{ 4 }: 앞의 패턴이 4번 반복되는지 검사하는 기호입니다. 이 경우, 숫자가 4번 반복되는지 검사하므로, 'XXXX'와 매칭됩니다.
[a-z0-9._%+-]
+
@
[a-z0-9.-]
+
\.[a-z]{2,}
이메일 주소 형식의 문자열과 매칭되는 정규표현식입니다.
[a-z0-9._%+-]: 알파벳 소문자, 숫자, 특정 기호 중 하나와 매칭됩니다.
  
+: 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 이메일 주소의 로컬 파트([a-z0-9._%+-])에 해당하는 부분이 하나 이상의 문자로 이루어져 있어야 합니다.

@: '@' 문자와 매칭됩니다.

[a-z0-9.-]: 알파벳 소문자, 숫자, 하이픈(-), 마침표(.) 중 하나와 매칭됩니다.

+ : 바로 앞에 있는 패턴이 하나 이상 나타나는지 검사하는 기호입니다. 이 경우, 이메일 주소의 도메인 파트에 해당하는 부분([a-z0-9.-])이 하나 이상의 문자로 이루어져 있어야 합니다.

\. : 백슬래시()를 이용하여 마침표(.) 문자를 이스케이프 처리한 것입니다. 이메일 주소에서 마침표는 도메인의 구분 기호로 사용되므로, 검사 대상이 아니라 이스케이프 처리해야 합니다.

[a-z]{2,}: 알파벳 소문자가 2번 이상 연속해서 나타나는지 검사하는 패턴입니다. 이 경우, 이메일 주소의 도메인 파트에서 최소 2글자 이상으로 이루어져 있어야 합니다.

 

반응형

'정규표현식' 카테고리의 다른 글

[정규표현식] 자주 쓰이는 플래그 유형  (0) 2023.03.09