반응형
* dropna의 parameter 값 들이다
def dropna(axis: Axis=0, how: str='any', thresh=None, subset=None, inplace: bool=False)
1. library 호출
import numpy as np
import pandas as pd
2. 데이터 구조 만들어서 판다스 형태로 저장
df = pd.DataFrame({'A':[1,2,np.nan],
'B':[5,np.nan,np.nan],
'C':[1,2,3]})
3. 결측치 값 모두 삭제. 영구 삭제하려면 (inplace = True), 대소문자 주의
df.dropna()
4. 행말고 열삭제
df.dropna(axis=1)
5. thresh: NA가 아닌 값을 말한다. na가 없는 값이 총 몇 개가 되어 달라 라는 뜻.
df.dropna(thresh=3)
na가 없이 총 3개의 데이터 값이 나오도록 만들어 달라.
6. subset 해당 열의 값의 NA만 신경씀
df.dropna(subset=['A'])
7. NA값 채우기
df.fillna(value='FILL VALUE')
8. 채우는데 평균값으로 채움
df.fillna(df.mean())
df['A'].fillna(value=df['A'].mean())
반응형
'Python' 카테고리의 다른 글
Colab 에서 현재 경로 설정, google Drive 연결, 특정 위치의 데이터 가지고 올 때 (0) | 2022.04.17 |
---|---|
Colab font 변경. 코랩 쓸 때 폰트체 변경하기 (0) | 2022.04.15 |
pandas groupby 파라미터(parameter) (0) | 2022.04.15 |
Pandas DataFrame parameter값, 데이터 프레임 파라미터, 판다스 (0) | 2022.04.15 |
회귀 및 의사결정나무, Random Forest, Gradient Boost 모형 모델 평가하기 (0) | 2022.02.05 |