Python_AI and Bigdata
-
[python] 데이터프레임 행,열 확인하기 shape() 함수Python_AI and Bigdata 2022. 9. 22. 21:59
데이터의 행정보와 열정보를 보고싶다면? df.shape 함수를 쓰시면 됩니다 iris.shape Out[51]: (150, 5) 총 150개의 행과 5개의 열이 있습니다. iris 실제 값입니다! 행정보와 열정보를 각각 뽑고 싶다? print("iris 행 정보 : ", iris.shape[0]) print("iris 열 정보 : ", iris.shape[1]) iris 행 정보 : 150 iris 열 정보 : 5 참 쉽죠잉!
-
[python] 데이터프레임을 볼 수 있는 행/열 개수 지정하기Python_AI and Bigdata 2022. 9. 22. 01:15
데이터를 불러온 후, 데이터를 찍으면 다음과 같이 나타납니다. iris 모든 행을 보고 싶거나, 볼 수 있는 행/열의 개수를 늘리고 싶으면 어떻게 해야할까요? import pandas as pd pd.set_option("display.max_row",150) 위 코드를 실행하면, 행을 최대 150개까지 출력할 수 있습니다. 200으로 설정하면 200, 5000으로 설정하면 5000개까지 볼 수 있습니다! 만약 column의 수를 늘리고 싶다면 pd.set_option("display.max_column", 원하는 개수)를 입력하면 되겠죠? 모두들 오늘도 화이팅!
-
[python] 데이터프레임 기본정보 확인하기 info() 함수Python_AI and Bigdata 2022. 9. 20. 00:50
오늘은 데이터의 변수별, null값, 그리고 type을 간략하게 볼 수 있는 info()함수입니다. df.info() 를 실행하면 간략한 정보를 볼 수 있습니다! 참쉽죠! 현업에서 사용하는 꿀팁을 드리자면, notepad ++ 에 위 결과를 복사한 후, 엑셀 파일로 옮겨 붙이면 바로 옮겨집니다. 현업에서는 테이블명, 변수명, 변수 타입, 결측값, max, min, unique값 등의 정보를 엑셀로 관리하는 것이 편리하고 공유하기에도 좋습니다!
-
현업에서 자주 쓰는 시각화(matplotlib.pyplot)Python_AI and Bigdata 2022. 9. 14. 00:57
현업에서 자주 쓰는 시각화에 관해 포스팅합니다. from matplotlib import pyplot as plt 먼저, 히스토그램! 변수 각각이 어떤 분포를 띠고 있는지 보고 싶을 경우, 혹은 빈도수가 어떻게 나뉘는 지 보고 싶을 경우 사용됩니다. 역시나 iris데이터로 시작합니다 plt.hist(iris["Sepal.Length"]) Out[6]: (array([ 9., 23., 14., 27., 16., 26., 18., 6., 5., 6.]), array([4.3 , 4.66, 5.02, 5.38, 5.74, 6.1 , 6.46, 6.82, 7.18, 7.54, 7.9 ]), ) 다음으로 plot입니다. plot은 제가 보통 쓰는 방식으로 포스팅 되었고, 각자에게 맞는 방식을 찾으시길 바랍니다. ..