Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- SQL
- EDA
- Data Analysis
- 프로그래머스
- kaggle
- dataframe
- 데이터구조
- machinelearning
- numpy
- 데이터분석
- 코딩테스트
- 연산자
- Python
- 데이터 전처리
- code
- 데이터사이언스
- 아마존
- 데이터과학
- mysql
- get_dummies
- 머신러닝
- 캐글
- pandas
- 파이썬
- 불리언
- data science
- 데이터전처리
- 코테
- 전처리
- 시각화
Archives
- Today
- Total
Road to Data Scientist
데이터 탐색_EDA_.head/.describe/.info/.dtype/.isna/.unique/.nunique 본문
코딩 테스트/Python
데이터 탐색_EDA_.head/.describe/.info/.dtype/.isna/.unique/.nunique
ShazelP 2024. 3. 26. 13:29
Data 불러오기
#pandas 불러오기
import pandas as pd
data = pd.read_csv("파일 경로")
Data 보기
#첫 10열 보기
data.head()
#첫 n열 보기
data.head(n)

#마지막 10열 보기
data.tail()
#마지막 n열 보기
data.tail(n)

Data 정보 보기
data.info()

Data 통계 정보보기
data.describe()

- 따로 설정하지 않을 시 숫자형 값을 갖고 있는 열과 null값을 제외한 결과를 보여준다.
#모든 열, null값 포함한 통계 결과 보기
data.describe(include='all')

#include='원하는데이터타입' 으로 원하는 열만 보기
data.describe(include='object')

#exclude='제외할데이터타입'
data.describe(exclude='object')

Data 데이터 타입 보기
data.dtype

Null값 확인하기
#Null = True / 값 있으면 = False 로 반환
data.isna()

#null값 개수 세기
data.isna().sum()

데이터 값 확인하기
#특정 column 값 개수 확인
data['Parch'].value_counts()

#몇개의 고유의 값 있는지 확인
data['Parch'].unique()
#몇개의 고유의 값 있는지 개수 확인
data['Parch'].nunique()


'코딩 테스트 > Python' 카테고리의 다른 글
| 데이터 탐색 및 시각화_EDA_Visualization (0) | 2024.03.26 |
|---|---|
| 데이터 전처리_Data Preprocessing(get_dummies)_IBM DATA SCIENCE (0) | 2024.01.28 |
| 데이터 전처리_Data Preprocessing_IBM DATA SCIENCE (1) | 2024.01.27 |
| 데이터 불러오기_Data Load/Read_IBM DATA SCIENCE (0) | 2024.01.27 |