데이터 불러오기
위 데이터프레임에서
한글, 영문(대/소문자), -, 공백
만 있는 행만 살려보자
(1, 2, 3번 행)
re.compile
한글, 영문, 공백과 - 이 아닌 문자열을 찾는 표현식이다.
메타캐릭터에 대한 내용은 아래 포스팅 참조
https://steadiness-193.tistory.com/203
re.search
첫번째 행의 문자열은 Abc!&* 이다.
search는 여기서 처음으로 해당하지 않는 문자열을 찾는다.
search
첫번째로 패턴을 찾으면 match 객체를 반환
패턴을 못찾으면 None 반환
--------------------------------------------참고--------------------------------------------
!를 얻고 싶다면 group메서드 이용
---------------------------------------------------------------------------------------------------
가나다 인 경우에는 모두 만족하는 문자열이므로 아무 결과도 나오지 않는다.
즉, None이 맞냐는 조건에 True를 반환하게 된다.
--------------------------------------------참고--------------------------------------------
findall은 None으로 해도 다 False가 나온다.
---------------------------------------------------------------------------------------------------
함수 정의해서 조건으로 필터링
이제 원하는 문자열이 있는 행만 추출 되었다.
'Pandas > 응용' 카테고리의 다른 글
판다스 - map : dict.get (0) | 2020.08.09 |
---|---|
판다스 - map (0) | 2020.08.09 |
정규표현식 - re.sub : 원하는 문자만 남기고 제거하기 (0) | 2020.08.02 |
판다스 - groupby : set_index와 사용자 정의 함수로 그룹핑 (0) | 2020.07.20 |
판다스 - groupby : 집계함수를 활용한 뒤 데이터프레임 분석 (0) | 2020.07.15 |