카테고리 없음

[python] 데이터프레임 특정 값이 포함된 값 추출 contains() 함수

렁다이쿤 2022. 11. 15. 23:05
728x90

다음과 같은 데이터가 있다고 해봅시다!

테스트_데이터_1
 
나라이름                                         학생수                         대학교_등급         대표대학교_이름
한국 100 1 한국대
영국 200 2 영국대
미국 300 3 미국대
한국 200 1 서울대
중국 100 2 중국대
미국 400 3 아메리카대
싱가폴 150 1 싱가폴대

 

 

여기서 대표대학교_이름 컬럼이 '국대'만 들어간 컬럼만 불러오고 싶다면?

 

 

condition을 굳이 쓰지않고 바로 코딩해도 되지만, 가독성을 위해 조건문이 길다면 condition으로 걸고 하는 것을 추천드립니다!

condition = 테스트_데이터_1['대표대학교_이름'].str.contains('국대')

테스트_데이터_1[condition]

 

 
나라이름                                    학생수                                    대학교_등급        대표대학교_이름
한국 100 1 한국대
영국 200 2 영국대
미국 300 3 미국대
중국 100 2 중국대

 

국대만 포함된 변수들만 추출이 됐죠잉

 

 

한가지만 더 해볼게요 이해를 돕기 위해

 

condition_2 = 테스트_데이터_1['나라이름'].str.contains('싱가')

테스트_데이터_1[condition_2]
 
나라이름                                             학생수                           대학교_등급       대표대학교_이름
싱가폴 150 1 싱가폴대

 

모두들 고수되세요잉~~