Pandas(10)
-
Python(Colab) 데이터프레임 행렬 추가 or 제거하기
기본적 * dict 형태의 데이터를 만들고 append()함수를 사용하여 데이터를 추가함 * 반드시 ignore_index = True 옵션을 추가해야 에러가 발생하지 않음 추가할 데이터 작성하기 dic1 = { "이름": "김사과", "그룹": "애플", "소속사": "apple", "성별": "여자", "생년월일": "2000-01-01", "키": 160, "혈액형": "A", "브랜드평판지수":987654321 } #append() 추가하기 (인플레이스 X) df.append(dic1,ignore_index=True) # 원본에 인플레이스 하기 df =df.append(dic1,ignore_index=True) 열 추가하기 조건 1 모든 데이터에 국적:대한민국 추가하기 df['국적'] = '대한민..
2023.06.08 -
Python(Colab) 데이터프레임 결측값(isna,isnull,notnull,fillna,dropna)
#isna() - 결측값이 있는지 True/False로 반환 df.isna() #isnull()-결측값이 있는지 True/False로 반환 df.isnull() 1. 조건: group의 결측값이 있는 사람 찾기 df[df['group'].isna()] 2. 조건: group의 결측값이 있는 사람의 인덱스와 이름만 가져오기 df['name'][df['group'].isna()] 3. 조건 : group의 null이 아닌 사람만 찾기 df[df['group'].notnull()] 4 조건: 그룹이 있는 연예인의 name,height,BT을 loc를 사용해서 출력 df.loc[:,['name','height','BT']][df['group'].notnull()] df.loc[df['group'].notnull..
2023.06.08 -
Python(Colab) 데이터프레임 인덱싱(loc,iloc,boolean)
loc : 컬럼으로 인덱싱 하는 법 여러개의 컬럼을 가져올시 무조건 list화 시키기 #loc 인덱싱 : 레이블(이름)으로 인덱싱 하는 법 #행과 열이 모두 인덱싱과 슬라이싱이 가능하다. #모든 행의 name값을 가져오기 df.loc[:,'name'] #여러개의 레이블을 출력하기 df.loc[:,['name','gender','height']] #인덱스 2번부터 5번까지 불러오기(5번을 포함 !) df.loc[2:5,'name'] # column 슬라이싱도 가능함! # name부터 gender까지 뽑아오기 (인덱스 3번부터 8번까지) df.loc[3:8,'name':'gender'] iloc : 인덱스로 인덱싱 하는 법 여러개의 컬럼을 가져올시 무조건 list화 시키기 df.iloc[:,[0,2]] #'..
2023.06.08 -
Python Pandas 기초
http://bigdata.dongguk.ac.kr/lectures/Python/_book/pandas.html#pandas-dataframe 5 장 Pandas | 파이썬 프로그래밍 기초 Pandas 데이터 처리와 분석을 위한 라이브러리 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있음 대용량의 데이터들을 처리하는데 매우 편리 pandas 자료구조 Series: 1차원 DataFrame: 2차원 Panel: bigdata.dongguk.ac.kr 사용 Tool : Google Colab 기초 설정 ! pip install pandas import pandas as pd 1-1 Series와 DataFrame * 2차원 표 데이터를 데이터 프레임 / 데이터 :values / 표의 행: index /..
2023.06.08