Road to Data Scientist

데이터 탐색_EDA_.head/.describe/.info/.dtype/.isna/.unique/.nunique 본문

코딩 테스트/Python

데이터 탐색_EDA_.head/.describe/.info/.dtype/.isna/.unique/.nunique

ShazelP 2024. 3. 26. 13:29

 

Kaggle Titanic Data 활용

Data 불러오기

#pandas 불러오기
import pandas as pd

data = pd.read_csv("파일 경로")

 

Data 보기

#첫 10열 보기
data.head()

#첫 n열 보기
data.head(n)

 

첫 3열 (data.head(3)) 결과

 

#마지막 10열 보기
data.tail()

#마지막 n열 보기
data.tail(n)

마지막 3열 (data.tail(3)) 결과

Data 정보 보기

data.info()

결과

 

Data 통계 정보보기

data.describe()

- 따로 설정하지 않을 시 숫자형 값을 갖고 있는 열과 null값을 제외한 결과를 보여준다.

#모든 열, null값 포함한 통계 결과 보기
data.describe(include='all')

#include='원하는데이터타입' 으로 원하는 열만 보기
data.describe(include='object')

 

#exclude='제외할데이터타입'
data.describe(exclude='object')

 

Data 데이터 타입 보기

data.dtype

 

Null값 확인하기

#Null = True / 값 있으면 = False 로 반환
data.isna()

 

#null값 개수 세기
data.isna().sum()

 

데이터 값 확인하기

#특정 column 값 개수 확인
data['Parch'].value_counts()

#몇개의 고유의 값 있는지 확인
data['Parch'].unique()

#몇개의 고유의 값 있는지 개수 확인
data['Parch'].nunique()

첫 번째 코드 결과
두 번째 코드 결과