drop_duplicates()
-
[python] 중복제거 drop_duplicates()Python_AI and Bigdata 2022. 9. 28. 00:02
drop_duplicates()함수는 중복을 제거할 때 사용하는 함수입니다. 다음 예제를 통해 이해해 봅시다! 여기서 만약 key값을 "a"로 잡고 drop_duplicates("a")를 실행시키면, a값이 공통인 애들을 한개씩만 남기고 모두 제거합니다. 다음 결과를 보면 a값이 1행,2행,3행 모두 1값으로 동일하므로, 가장 첫 행만 남기고 모두 제거됩니다. key값을 "a"와 "b"로 한다면? a의 값이 같으면서 b의값도 같은 행을 제거합니다 즉 a,b값만 보면 1,2행이 모두 같죠? 1행만 남기고 나머지를 모두 지웁니다. 중복제거 함수인 drop_duplicates()는 데이터 분석하는 데 있어서 굉장히 많이 쓰이는 함수이므로 꼭 기억하세요!