본문 바로가기

Pandas/응용

정규표현식 - 원하는 문자열이 있는 행만 남기기 : re.compile, re.search

반응형

 

 

데이터 불러오기

 

 

 

위 데이터프레임에서

 

한글, 영문(대/소문자), -, 공백

만 있는 행만 살려보자

(1, 2, 3번 행)

 

 

 

 

 

re.compile

 

 

한글, 영문, 공백과 - 이 아닌 문자열을 찾는 표현식이다.

 

 

 

 

 

메타캐릭터에 대한 내용은 아래 포스팅 참조

 

https://steadiness-193.tistory.com/203

 

정규표현식 - re.sub : 원하는 문자만 남기고 제거하기

re.sub('찾을 패턴', '찾은 패턴을 변경할 내용', '원본') 주어진 문자열(찾을 패턴)에서 일치하는 모든 패턴을 (변경할 내용으로)바꾼다. 두번째 인자는 특정 문자열이거나 함수가 될 수도 있다. 메�

steadiness-193.tistory.com

 

 

 

 

 

re.search

 

 

첫번째 행의 문자열은 Abc!&* 이다.

 

search는 여기서 처음으로 해당하지 않는 문자열을 찾는다.

 

 

search

첫번째로 패턴을 찾으면 match 객체를 반환

패턴을 못찾으면 None 반환

 

 

 

 

 

 

 

 

 

--------------------------------------------참고--------------------------------------------

 

!를 얻고 싶다면 group메서드 이용

 

---------------------------------------------------------------------------------------------------

 

 

 

 

 

 

 

 

 

가나다 인 경우에는 모두 만족하는 문자열이므로 아무 결과도 나오지 않는다.

 

즉, None이 맞냐는 조건에 True를 반환하게 된다.

 

 

 

 

 

 

--------------------------------------------참고--------------------------------------------

 

findall은 None으로 해도 다 False가 나온다.

 

---------------------------------------------------------------------------------------------------

 

 

 

 

 

 

함수 정의해서 조건으로 필터링

 

 

이제 원하는 문자열이 있는 행만 추출 되었다.

 

 

반응형