Python(Colab) 데이터프레임 select_dtypes,원 핫 인코딩
2023. 6. 8. 17:24ㆍ파이썬
#문자열 컬럼만 가져오기
df.select_dtypes(include='object')
#문자열 컬럼만 빼고 가져오기
df.select_dtypes(exclude='object')
#문자가 아닌 컬럼에만 10을 더해주고 싶을 경우
df.select_dtypes(exclude='object') + 10
#문자열을 가지고 있는 경우만 저장하고 싶을 경우
str_cols = df.select_dtypes(include='object').columns
df[str_cols]
원 핫 인코딩(One hot Encoding)
한개의 요소는 1 나머지 요소는 0을 만들어 카테고리 형태를 표현하는 방법
A형: 1 , B형: 2, O형은 3일 때 A형 + B형 = O형이 나오지 않게 관계성을 끊는다
따라서 별도의 Column들을 형성해주고 1개의 column에는 1 나머지는 0
728x90
'파이썬' 카테고리의 다른 글
Python(Colab) 형태소 분석 KoNLPy (0) | 2023.06.09 |
---|---|
Python(Colab) 데이터프레임 시각화 Matplotlib 라이브러리 (0) | 2023.06.09 |
Python(Colab) 데이터프레임 등수매기기,타입변경,날짜,apply,map (1) | 2023.06.08 |
Python(Colab) 데이터프레임 합치기 (0) | 2023.06.08 |
Python(Colab) 데이터프레임 통계 값 다루기 (0) | 2023.06.08 |