Python(Colab) 데이터프레임 select_dtypes,원 핫 인코딩

2023. 6. 8. 17:24파이썬

#문자열 컬럼만 가져오기
df.select_dtypes(include='object')
 
#문자열 컬럼만 빼고 가져오기
df.select_dtypes(exclude='object')
 

 

#문자가 아닌 컬럼에만 10을 더해주고 싶을 경우
df.select_dtypes(exclude='object') + 10

 

#문자열을 가지고 있는 경우만 저장하고 싶을 경우
str_cols = df.select_dtypes(include='object').columns
 
df[str_cols]
 

원 핫 인코딩(One hot Encoding)

한개의 요소는 1 나머지 요소는 0을 만들어 카테고리 형태를 표현하는 방법

 

A형: 1 , B형: 2, O형은 3일 때  A형 + B형 = O형이 나오지 않게 관계성을 끊는다

 

따라서 별도의 Column들을 형성해주고 1개의 column에는 1 나머지는 0

 

728x90