Python_AI and Bigdata
-
[python] 데이터프레임 조건 추출Python_AI and Bigdata 2022. 11. 15. 01:08
우선, 구조는 다음과 같습니다. df[df['컬럼명'] == 조건] Species가 Setosa인 녀석들만 불러와라~! Species 앞글자가 set으로 시작하는 애들만 불러와라~! Sepal.Length가 5이하인 값을 불러와라! 여러분 그리고 꿀팁 드리자면 데이터프레임 선언 후 Tab누르면 자동 완성돼요 ㅎㅎ iris 전부 다 치지 마시고 i 까지만 치고 탭 눌러도 iris가 자동완성 된답니다 또, 변수명도 적용 가능! iris['Sepcies'] 전부 다 치지 마시고 iris['Sp' 까지만 입력하시고 탭 누르면 자동완성 됩니당 (여기서 키보드 위치?는 p와 ' 사이에 두셔야해요 ㅎㅎ) 모두들 고수되세용~
-
[python] JupyterLab과 JupyterNotebook 6가지 필수 단축키Python_AI and Bigdata 2022. 10. 15. 12:05
단축키 아는거 간단하게 정리해보려고 해요! 단축키를 실제로 실행해보시면 후회안하실거에요 먼저 주석 1. ctrl + / : # 주석 처리 (여러 행 드래그하면 여러 행도 가능) 2. ctrl + 좌/우 방향키 : 한칸씩 이동이 아닌 구분 단위로 이동 3. "# 주석내용 " 입력 + esc + 1 : 주석 내용으로 큰 글씨를 만들어 구분됨(필수) 4. 셀 위치 클릭 + esc + a/b : 셀 위치에서 위/아래 새로운 셀 생성 5. 셀 위치 클릭 + esc + d + d : 선택한 셀 삭제 6. shift + home/end : 복사/잘라내기/삭제하고 싶은 글자가 있다면, 글자에 커서를 클릭하고 shift end/home을 사용하면 내용 끝까지 셀이 선택됩니다! > 2번내용과 6번내용을 섞어 쓰면 ctrl..
-
[python] 변수명 변경 rename() 함수Python_AI and Bigdata 2022. 10. 13. 23:29
변수명을 바꾸고 싶을 때 어떻게 하시나요? iris데이터를 예로 들게요 원래의 붓꽃 데이터입니다 만약 Sepal.Width의 이름을 SW로 바꾸려면 다음과 같이 변경하는 방법이 있습니다. 하지만, 모든 변수를 다시 입력해줘야 하는 번거로움이 있기 때문에 rename함수를 사용하는 것이 편리하고 좋습니다. 붗꽃 데이터를 rename함수를 사용하여 다시 원래의 변수명으로 돌려보겠습니다. rename함수를 쓰면 쉽게 변수명을 바꿀 수 있습니다!
-
[python] NA값 포함된 제거하기 dropna() 함수Python_AI and Bigdata 2022. 9. 30. 00:12
a,b,c,d가 다음과 같이 있다고 합시다! 여기서 만약에 NaN값이 필요 없어 NaN값을 빼고 싶다면 어떻게 해야 할까요? 다음의 코드를 실행하시면 됩니다! dropna()함수는 default값이 axis =0라서 NaN가 포함된 행 정보가 삭제됩니다. 만약 df.dropna(axis = 1) 으로 실행한다면 d 열이 삭제되겠죠!? ㅎㅎ 실습해보는 것 만큼 기억에 남는 것이 없으니 직접 실행해보세요!
-
[python] 중복제거 drop_duplicates()Python_AI and Bigdata 2022. 9. 28. 00:02
drop_duplicates()함수는 중복을 제거할 때 사용하는 함수입니다. 다음 예제를 통해 이해해 봅시다! 여기서 만약 key값을 "a"로 잡고 drop_duplicates("a")를 실행시키면, a값이 공통인 애들을 한개씩만 남기고 모두 제거합니다. 다음 결과를 보면 a값이 1행,2행,3행 모두 1값으로 동일하므로, 가장 첫 행만 남기고 모두 제거됩니다. key값을 "a"와 "b"로 한다면? a의 값이 같으면서 b의값도 같은 행을 제거합니다 즉 a,b값만 보면 1,2행이 모두 같죠? 1행만 남기고 나머지를 모두 지웁니다. 중복제거 함수인 drop_duplicates()는 데이터 분석하는 데 있어서 굉장히 많이 쓰이는 함수이므로 꼭 기억하세요!
-
[python] 유일값 보기 unique() 함수Python_AI and Bigdata 2022. 9. 25. 01:32
변수의 유일값들을 보고 싶다면 unique()함수를 쓰시면 됩니다. 데이터 분석할 때 정~~말 많이 쓰이는 함수입니다. iris["Species"].unique() Out[75]: array(['setosa', 'versicolor', 'virginica'], dtype=object) Iris 종은 총 setosa, versicolor, virginica 3 종류가 있는 것을 확인할 수 있습니다. iris["Species"].nunique() Out[78]: 3 nunique()함수를 쓰면 총 유일값이 몇개인지 확인할 수 있습니다!