데이터 보기
DataFrame의 빠른 개요를 얻기 위해 가장 많이 사용되는 방법 중 하나는 head()방법입니다.
이 head()메서드는 맨 위에서 시작하여 헤더와 지정된 수의 행을 반환합니다.
예시
DataFrame의 처음 10개 행을 인쇄하여 빠른 개요를 얻으십시오.
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head(10))
예제에서는 'data.csv'라는 CSV 파일을 사용합니다.
data.csv 를 다운로드 하거나 브라우저에서 data.csv 를 엽니다 .
참고: 행 수가 지정되지 않은 경우 head()메서드는 상위 5개 행을 반환합니다.
예시
DataFrame의 처음 5개 행을 인쇄합니다.
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head())
이 tail()메서드는 맨 아래부터 시작하여 헤더와 지정된 수의 행을 반환합니다.
예시
DataFrame의 마지막 5개 행을 인쇄합니다.
데이터에 대한 정보
info()DataFrames 객체에는 데이터 세트에 대한 자세한 정보를 제공하는 이라는 메서드가 있습니다.
예시
데이터에 대한 정보 인쇄:
결과
<클래스 'pandas.core.frame.DataFrame'>
RangeIndex: 169 항목, 0 ~ 168
데이터 열(총 4개 열):
# 열 Null이 아닌 개수 Dtype
--- ------ -------------- -----
0 기간 169 null이 아닌 int64
1 펄스 169 null이 아닌 int64
2 Maxpulse 169 null이 아닌 int64
3칼로리 164 non-null float64
dtypes: float64(1), int64(3)
메모리 사용량: 5.4KB
없음
결과 설명
결과는 169개의 행과 4개의 열이 있음을 알려줍니다.
RangeIndex: 169 항목, 0 ~ 168
데이터 열(총 4개 열):
데이터 유형이 있는 각 열의 이름:
# 열 Null이 아닌 개수 Dtype
--- ------ -------------- -----
0 기간 169 null이 아닌 int64
1 펄스 169 null이 아닌 int64
2 Maxpulse 169 null이 아닌 int64
3칼로리 164 non-null float64
Null 값
이 info()방법은 또한 각 열에 얼마나 많은 Null이 아닌 값이 있는지 알려주며, 데이터 세트에서 "칼로리" 열에 Null이 아닌 값이 169개 중 164개 있는 것처럼 보입니다.
즉, 어떤 이유로든 "칼로리" 열에 값이 전혀 없는 행이 5개 있다는 의미입니다.
빈 값 또는 Null 값은 데이터를 분석할 때 좋지 않을 수 있으므로 빈 값이 있는 행을 제거하는 것을 고려해야 합니다. 이것은 정리 데이터 라고 하는 단계이며 다음 장에서 이에 대해 자세히 알아볼 것입니다.
'교육 > 파이썬빅데이터분석교육' 카테고리의 다른 글
py-script 실습 (0) | 2022.12.20 |
---|---|
Python REQUEST 모듈 (0) | 2022.12.13 |
파이썬 판다스의 이해4 - pandas plotting (0) | 2022.12.08 |
파이썬 판다스의 이해2 - Pandas Cleaning (0) | 2022.12.08 |
파이썬 판다스의 이해0 - 데이터유형 (1) | 2022.12.08 |