Python(Colab) 데이터프레임 결측값(isna,isnull,notnull,fillna,dropna)
2023. 6. 8. 15:51ㆍ파이썬
#isna() - 결측값이 있는지 True/False로 반환
df.isna()
#isnull()-결측값이 있는지 True/False로 반환
df.isnull()
data:image/s3,"s3://crabby-images/dafe0/dafe0d3e852e9f4e0d261d3f3d4340e50cdf6a36" alt=""
1. 조건: group의 결측값이 있는 사람 찾기
df[df['group'].isna()]
data:image/s3,"s3://crabby-images/c2aa8/c2aa804be212e588ef62ab138cfa27a719f7ce4f" alt=""
2. 조건: group의 결측값이 있는 사람의 인덱스와 이름만 가져오기
df['name'][df['group'].isna()]
data:image/s3,"s3://crabby-images/5b47e/5b47e5c130ba2ccc88c3a329e28da5d77fd60c86" alt=""
3. 조건 : group의 null이 아닌 사람만 찾기
df[df['group'].notnull()]
data:image/s3,"s3://crabby-images/949ba/949ba2e91b9c6e5aafabede0a62e0e0195af497a" alt=""
4 조건: 그룹이 있는 연예인의 name,height,BT을 loc를 사용해서 출력
df.loc[:,['name','height','BT']][df['group'].notnull()]
df.loc[df['group'].notnull(),['name','height','BT']]
data:image/s3,"s3://crabby-images/117a0/117a0eca5cc781550aad9d06065608449d4b37bb" alt=""
결측값 채우기
fillna(): 결측값을 채워주는 함수
조건1 height의 결측값이 있는 사람을 0으로 채우기
df['height'].fillna(0,inplace=True)
data:image/s3,"s3://crabby-images/a9171/a9171319b4334ec3eeae78a4aac366055ec5a96a" alt=""
조건2. 키의 평균을 구해서 height 결측값의 대입
height = df2['height'].mean()
df2['height'] = df2['height'].fillna(height)
df2['height']
결측값있는 행 제거하기
dropna(): 결측값을 value로 가지고 있는 행을 제거
# dropna() - 결측값이 한개라도 있는 경우 행을 삭제 (인플레이스 X)
df.dropna()
# 결측값이 있는 열을 제거하기 (거의안씀)
df.dropna(axis=1)
data:image/s3,"s3://crabby-images/dd21b/dd21b57c0796c78d077dd049d9ef18a9a67cdf43" alt=""
728x90
'파이썬' 카테고리의 다른 글
Python(Colab) 데이터프레임 통계 값 다루기 (0) | 2023.06.08 |
---|---|
Python(Colab) 데이터프레임 행렬 추가 or 제거하기 (0) | 2023.06.08 |
Python(Colab) 데이터프레임 인덱싱(loc,iloc,boolean) (0) | 2023.06.08 |
Python Pandas 기초 (0) | 2023.06.08 |
Python Numpy 모듈 (0) | 2023.05.29 |