정규식의 멀티라인 expressions 활용

멀티라인 표현식의 활용법, Dotall (Single Line) 모드, Multi Line 모드, Non-Dotall 모드의 차이점, 여러 줄을 처리하는 방법 정규식의 멀티라인 표현식이란? 정규식(Regular Expression, Regex)은 텍스트 패턴을 검색하거나 조작할 때 강력한 도구로 사용됩니다. 특히 멀티라인 표현식은 여러 줄에 걸친 텍스트를 처리할 때 유용하며, 줄바꿈(\n)을 포함한 패턴 매칭을 가능하게 합니다. 이번 포스트에서는 멀티라인 표현식의 활용법, Dotall (Single Line) 모드, Multi Line 모드, Non-Dotall 모드의 차이점, 여러 줄을 처리하는 방법, 그리고 특정 패턴(예: start로 시작하고 end로 끝나는 패턴) 매칭 방법 등을 다룹니다. 또한, /s, /S, /w, /W, .|\n의 모드별 동작 차이를 설명합니다. ...

July 1, 2025 · Byung Kyu KIM

정규식 탐색 기법 - 전방탐색, 부정형 전방탐색, 후방탐색, 부정형 후방탐색

정규식 탐색 기법: 전방탐색과 후방탐색 정규식 탐색 기법 요약 정규식(Regular Expression)은 텍스트 패턴 매칭에 강력한 도구. **전방탐색(Lookahead)**과 **후방탐색(Lookbehind)**은 특정 조건을 만족하는 패턴을 찾되, 그 조건 자체는 결과에 포함시키지 않는 고급 기법 기법 문법 설명 전방탐색 (?=패턴) 패턴이 앞에 있을 때 매칭 부정형 전방탐색 (?!패턴) 패턴이 앞에 없을 때 매칭 후방탐색 (?<=패턴) 패턴이 뒤에 있을 때 매칭 부정형 후방탐색 (?<!패턴) 패턴이 뒤에 없을 때 매칭 왜 전방탐색과 후방탐색이 필요한가? 전방탐색과 후방탐색은 매칭 조건을 설정하지만, 해당 조건은 최종 결과에 포함되지 않습니다. 이는 URL, 로그, 텍스트 파싱에서 특정 패턴의 주변 정보만 필요할 때 유용합니다. 주요 장점: ...

June 20, 2025 · Byung Kyu KIM

정규 표현식(BRE, ERE, PCRE) 기능 비교 및 명령어 지원 가이드

정규 표현식(BRE, ERE, PCRE) 기능 비교 및 명령어 지원 가이드 1. 정규 표현식이란? 정규 표현식(Regular Expression, Regex)은 텍스트 패턴을 검색, 치환, 검증하는 데 사용되는 강력한 도구입니다. POSIX 기반의 BRE(Basic Regular Expressions), ERE(Extended Regular Expressions), 그리고 Perl 호환 PCRE(Perl-Compatible Regular Expressions)는 각각 다른 기능과 지원 범위를 제공합니다. 이 글에서는 각 정규 표현식 유형의 특징과 grep, egrep, sed, ripgrep, awk 같은 도구에서의 지원 옵션을 정리합니다. 2. 정규 표현식 유형별 기능 기능 BRE (Basic) ERE (Extended) PCRE (Perl) 기본 메타문자 ., *, ^, $, [], [^ ] BRE + +, ?, ` , {n,m}` 그룹화 \(\) () (), 이름 붙은 그룹 지원 백레퍼런스 \1, \2 \1, \2 \1, \2, 이름 참조 가능 반복 *, \{n,m\} *, +, ?, {n,m} *, +, ?, {n,m}, *?, +? 고급 기능 없음 없음 전방 탐색((?=...)), 후방 탐색((?<=...)) 예시 a\(b*\)c → abbbc `a(b+ c)d→abbd, acd` 제한점 +, ?, |는 이스케이프 필요 비탐욕적 매칭, 전방/후방 탐색 미지원 POSIX 도구에서 제한적 지원 2.1 기본 정규 표현식 (BRE) 설명: POSIX 표준의 기본 정규 표현식, 가장 제한적. 주요 기능: 메타문자(., *, ^, $, []), 그룹화(\(\)), 백레퍼런스(\1, \2). 제한점: +, ?, |는 이스케이프(\+, \?, \|) 필요. 2.2 확장 정규 표현식 (ERE) 설명: POSIX 확장 표준, BRE보다 간결하고 표현력 높음. 주요 기능: 추가 메타문자(+, ?, |, {n,m}), 그룹화(()). 제한점: 비탐욕적 매칭이나 전방/후방 탐색 미지원. 2.3 Perl 호환 정규 표현식 (PCRE) 설명: Perl 기반, 가장 강력한 정규 표현식. 주요 기능: 비탐욕적 매칭(*?, +?), 전방/후방 탐색, 유니코드 지원. 제한점: POSIX 도구에서 제한적 지원. 3. 명령어별 정규 표현식 지원 옵션 명령어 BRE ERE PCRE grep 기본 (옵션 없음) -E -P (GNU grep만) egrep - 기본 (옵션 없음) - sed 기본 (옵션 없음) -r (GNU) / -E (BSD) - ripgrep - 기본 (옵션 없음) 기본 (옵션 없음) awk 기본 (옵션 없음) - - (gawk는 제한적 PCRE 지원) 4. 모범 사례 POSIX 우선: 이식성을 위해 BRE/ERE 사용. ...

May 20, 2025 · Byung Kyu KIM

sed - pattern capture substitute 활용

sed 명령어: 텍스트 패턴 캡처와 치환 활용법 sed는 파일이나 텍스트 스트림의 내용에서 특정 패턴을 찾아 변경하는 데 유용한 **스트림 편집기(Stream Editor)**입니다. 특히 정규 표현식 기능을 통해 텍스트의 특정 부분을 캡처하고 치환하는 기능이 강력합니다. 이번 글에서는 -E 및 -r 옵션을 사용하여 더 간편하게 캡처 그룹을 생성하고 치환하는 방법을 소개하겠습니다. 1. sed 명령어 정의 및 용도 sed는 파일이나 텍스트를 자동으로 조작하는 명령어로, 주로 Linux 및 Unix 환경에서 사용됩니다. sed는 스크립트 없이도 다양한 텍스트 처리 작업을 쉽게 수행할 수 있는 장점이 있으며, 주요 용도는 다음과 같습니다: ...

October 25, 2024 · Byung Kyu KIM