ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터프레임 정렬하기 sort_values() 함수
    카테고리 없음 2022. 11. 17. 22:46
    728x90

    다음과 같은 데이터가 있다고 합시다!

    테스트_데이터_1
    
     
     
    나라이름                                         학생수                         대학교_등급    대표대학교_이름
    한국 100 1 한국대
    영국 200 2 영국대
    미국 300 3 미국대
    한국 200 1 서울대
    중국 100 2 중국대
    미국 400 3 아메리카대
    싱가폴 150 1 싱가폴대



     

    만약 이 데이터를 대학교 등급별로 정렬을 하고싶다면?

     

    테스트_데이터_1.sort_values('대학교_등급')
    
    나라이름                                        학생수                         대학교_등급    대표대학교_이름
    한국 100 1 한국대
    한국 200 1 서울대
    싱가폴 150 1 싱가폴대
    영국 200 2 영국대
    중국 100 2 중국대
    미국 300 3 미국대
    미국 400 3 아메리카대

    데이터가 대학교_등급으로 정렬된 것을 확인할 수 있죠?

     

    여기서 더 나아가 대학교_등급, 그리고 학생수 까지 정렬을 하고싶다면?

     

     
    테스트_데이터_1.sort_values(['대학교_등급', '학생수'])
    

    나라이름                                        학생수                          대학교_등급  대표대학교_이름

    한국 100 1 한국대
    싱가폴 150 1 싱가폴대
    한국 200 1 서울대
    중국 100 2 중국대
    영국 200 2 영국대
    미국 300 3 미국대
    미국 400 3 아메리카대

    리스트 값으로 두가지를 넣으면 대학교_등급으로 정렬이 먼저 된 후, 그 후 학생수로 정렬이 됩니다!

     

    * 추가적으로 오름차순이 아니라 내림차순으로 정렬하고 싶다면 df.sort_values(정렬할 변수명, ascending = False)를 실행하시면 됩니당

     

    모두들 고수되세용!!

    댓글

Designed by Tistory.