빅데이터 김교수의 "AI노마드연구소" AI로 열어가는 노마드 세상!

빅데이터 김교수의 "AI노마드연구소" AI로 열어가는 노마드 세상입니다. AI 코딩작성, SNS 분석, AI업무자동화 컨설팅 0507-1419-0222

자세히보기

교육/파이썬빅데이터분석교육

파이썬 판다스 이해1-데이터보기

빅데이터 김교수 2022. 12. 9. 13:55

데이터 보기

DataFrame의 빠른 개요를 얻기 위해 가장 많이 사용되는 방법 중 하나는 head()방법입니다.

 head()메서드는 맨 위에서 시작하여 헤더와 지정된 수의 행을 반환합니다.

예시

DataFrame의 처음 10개 행을 인쇄하여 빠른 개요를 얻으십시오.

 
import pandas as pd

df = pd.read_csv('data.csv')

print(df.head(10))

예제에서는 'data.csv'라는 CSV 파일을 사용합니다.

data.csv 를 다운로드 하거나 브라우저에서 data.csv 를 엽니다 .

참고: 행 수가 지정되지 않은 경우 head()메서드는 상위 5개 행을 반환합니다.

예시

DataFrame의 처음 5개 행을 인쇄합니다.

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head())
 
 DataFrame 의 마지막tail() 행을 보는 방법도 있습니다 .

 tail()메서드는 맨 아래부터 시작하여 헤더와 지정된 수의 행을 반환합니다.

예시

DataFrame의 마지막 5개 행을 인쇄합니다.

print(df.tail())  

데이터에 대한 정보

info()DataFrames 객체에는 데이터 세트에 대한 자세한 정보를 제공하는 이라는 메서드가 있습니다.

예시

데이터에 대한 정보 인쇄:

print(df.info()) 

결과

  <클래스 'pandas.core.frame.DataFrame'>
  RangeIndex: 169 항목, 0 ~ 168
  데이터 열(총 4개 열):
   # 열 Null이 아닌 개수 Dtype  
  --- ------ -------------- -----  
   0 기간 169 null이 아닌 int64  
   1 펄스 169 null이 아닌 int64  
   2 Maxpulse 169 null이 아닌 int64  
   3칼로리 164 non-null float64
  dtypes: float64(1), int64(3)
  메모리 사용량: 5.4KB
  없음
    

결과 설명

결과는 169개의 행과 4개의 열이 있음을 알려줍니다.

  RangeIndex: 169 항목, 0 ~ 168
  데이터 열(총 4개 열):

데이터 유형이 있는 각 열의 이름:

   # 열 Null이 아닌 개수 Dtype  
  --- ------ -------------- -----  
   0 기간 169 null이 아닌 int64  
   1 펄스 169 null이 아닌 int64  
   2 Maxpulse 169 null이 아닌 int64  
   3칼로리 164 non-null float64

Null 값

 info()방법은 또한 각 열에 얼마나 많은 Null이 아닌 값이 있는지 알려주며, 데이터 세트에서 "칼로리" 열에 Null이 아닌 값이 169개 중 164개 있는 것처럼 보입니다.

즉, 어떤 이유로든 "칼로리" 열에 값이 전혀 없는 행이 5개 있다는 의미입니다.

빈 값 또는 Null 값은 데이터를 분석할 때 좋지 않을 수 있으므로 빈 값이 있는 행을 제거하는 것을 고려해야 합니다. 이것은 정리 데이터 라고 하는 단계이며 다음 장에서 이에 대해 자세히 알아볼 것입니다.