전체 글
-
[python] 데이터프레임 일치하는 값 불러오기 isin()함수카테고리 없음 2022. 11. 17. 22:36
데이터가 다음과 같이 있다고 봅시다! 여기서 만약 나라이름이 한국, 미국을 불러오고 싶다면? 테스트_데이터_1 나라이름 학생수 대학교_등급 대표대학교_이름 한국 100 1 한국대 영국 200 2 영국대 미국 300 3 미국대 한국 200 1 서울대 중국 100 2 중국대 미국 400 3 아메리카대 싱가폴 150 1 싱가폴대 테스트_데이터_1[테스트_데이터_1['나라이름'].isin(['한국','미국'])] 나라이름 학생수 대학교_등급 대표대학교_이름 한국 100 1 한국대 미국 300 3 미국대 한국 200 1 서울대 미국 400 3 아메리카대 다음과 같이 나라이름이 한국, 미국인 데이터가 뽑혔습니다!
-
[python] 인덱스(index) 초기화하기 reset_index() 함수카테고리 없음 2022. 11. 15. 23:12
테스트_데이터_1 다음과 같은 데이터가 있다고 합시다! condition = 테스트_데이터_1['대표대학교_이름'].str.contains('국대') 테스트_데이터_1[condition] 다음과 같은 조건문으로 추출하게 되면 다음과 같이 결과가 나오고 index가 일정하기 않은 것을 확인할 수 있습니다. index 초기화를 원한다면? 다음과 같이 코드를 작성하시면 되고, 대신 index column이 생성됩니다. 만약 데이터프레임 자체에 index에 숫자가 아닌 의미있는 값이 있다면 다음과 같은 코드를 작성하시면 되고, 만약 위 예처럼 의미가 없다고 한다면 다음과 같이 drop=True를 기입해주어 인덱스만 초기화하시면 됩니다 모두 고수되세요~~
-
[python] 데이터프레임 특정 값이 포함된 값 추출 contains() 함수카테고리 없음 2022. 11. 15. 23:05
다음과 같은 데이터가 있다고 해봅시다! 테스트_데이터_1 나라이름 학생수 대학교_등급 대표대학교_이름 한국 100 1 한국대 영국 200 2 영국대 미국 300 3 미국대 한국 200 1 서울대 중국 100 2 중국대 미국 400 3 아메리카대 싱가폴 150 1 싱가폴대 여기서 대표대학교_이름 컬럼이 '국대'만 들어간 컬럼만 불러오고 싶다면? condition을 굳이 쓰지않고 바로 코딩해도 되지만, 가독성을 위해 조건문이 길다면 condition으로 걸고 하는 것을 추천드립니다! condition = 테스트_데이터_1['대표대학교_이름'].str.contains('국대') 테스트_데이터_1[condition] 나라이름 학생수 대학교_등급 대표대학교_이름 한국 100 1 한국대 영국 200 2 영국대 미국..
-
[python] 폴더에 있는 이름 불러오기 os.listdir() 함수Python_AI and Bigdata 2022. 11. 15. 22:59
폴더 경로를 path로 저장해주고, os.listdir()함수를 써서 불러오면 됩니다! import os path = 'C:/Users/JSD/Desktop/렁다이쿤/' lst = os.listdir(path) lst ['테스트_데이터_1.csv', '테스트_데이터_2.csv', '테스트_데이터_3.csv', '테스트_데이터_4.csv', '테스트_데이터_5.csv'] 한가지 꿀팁! 하나하나 언제 불러오나 할 때 다음 코드를 작성해보세요 이 코드를 실행시키면, .csv를 제외한 이름(ex, 테스트_데이터_1)으로 데이터 프레임을 모두 만듭니다. for i in lst: globals()[i[:-4]] = pd.read_csv(path + i) 하나 실행시켜봅시다! 하나 하나 불러오면 어느 세월에~~ ㅋㅋ..
-
[python] 코드 구분하고 가독성 높이기카테고리 없음 2022. 11. 15. 01:19
파이썬에서 코드들의 구분 없이 계속 만들면 너무 눈에 들어오지 않겠죵? 가독성을 위해서는 반드시 필요한 작업입니다. 만약 A 알고리즘이 500줄, B 알고리즘이 500줄이라고 친다면 어디가 어딘지 구분이 어렵겠죠? A 알고리즘 - 500줄 B알고리즘 - 500줄 그래서 보통은 코드 작성을 할 때 다음과 같이 작업합니다. ================================================ A알고리즘 시작 ================================================: A 알고리즘 - 500줄 ================================================ B알고리즘 시작 ======================================..
-
[python] 데이터프레임 조건 추출Python_AI and Bigdata 2022. 11. 15. 01:08
우선, 구조는 다음과 같습니다. df[df['컬럼명'] == 조건] Species가 Setosa인 녀석들만 불러와라~! Species 앞글자가 set으로 시작하는 애들만 불러와라~! Sepal.Length가 5이하인 값을 불러와라! 여러분 그리고 꿀팁 드리자면 데이터프레임 선언 후 Tab누르면 자동 완성돼요 ㅎㅎ iris 전부 다 치지 마시고 i 까지만 치고 탭 눌러도 iris가 자동완성 된답니다 또, 변수명도 적용 가능! iris['Sepcies'] 전부 다 치지 마시고 iris['Sp' 까지만 입력하시고 탭 누르면 자동완성 됩니당 (여기서 키보드 위치?는 p와 ' 사이에 두셔야해요 ㅎㅎ) 모두들 고수되세용~
-
[python] 데이터프레임 다루기 df.str 함수카테고리 없음 2022. 11. 15. 00:58
데이터프레임에서 특정 변수의 값의 앞에 n개의 값을 가져오고 싶거나 끝의 n개를 가져올 때 str. 함수를 사용합니다. > 이 함수는 L 대기업 코딩테스트 문제에 나왔고, 현업에서도 하루에 5~10번은 사용하니 무조건 외우시길 추천드립니다. str[:3] : 0~3개를 골라와라~! iris["Species"].str[:3] : 0 set 1 set 2 set 3 set 4 set ... 145 vir 146 vir 147 vir 148 vir 149 vir Name: Species, Length: 150, dtype: object 끝 3개를 골라와라~! iris["Species"].str[-3:] 0 osa 1 osa 2 osa 3 osa 4 osa ... 145 ica 146 ica 147 ica 14..
-
loc, iloc 함수카테고리 없음 2022. 10. 28. 23:56
데이터프레임에서 원하는 index 혹은 변수명을 통해 추출하는 함수입니다. loc 구조 df.loc[인덱스입력] 역시 예시가 최고겠죠? 다음 코드를 보면서 공부해보세요 iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 setosa 4.6 3.1 1.5 0.2 setosa 5.0 3.6 1.4 0.2 setosa ... ... ... ... ... 6.7 3.0 5.2 2.3 virginica 6.3 2.5 5.0 1.9 virginica 6.5 3.0 5.2 2.0 virginica 6.2 3.4 5.4 2.3 virginica 5...