Python(Colab) 상권 별 업종 밀집 통계 주물럭거리기
2023. 6. 9. 17:21ㆍ실습 및 과제
목표: csv 데이터를 가지고 여러가지 기준으로 시각화해서 만들어보기
1. 기초설정
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt #그래프로 확인하기 위한 시각화 라이브러리
import seaborn as sns #matplotlib 기반으로 만들어진 시각화 라이브러리
2. csv파일 shop변수에 저장
shop = pd.read_csv('/content/drive/MyDrive/KDT-1/데이터분석/shop_201806_01.csv')
shop
3. shop 데이터 기초 파악
pd.set_option('display.max_columns',40)
shop.info()
4.사용할 컬럼만 확인 후 재정렬
view_columns = ['상호명', '지점명', '상권업종대분류명', '상권업종중분류명', '상권업종소분류명', '표준산업분류명',
'시도명', '시군구명', '행정동명', '법정동명', '지번주소', '도로명', '도로명주소', '경도', '위도']
shop = shop[view_columns]
5. 사용할 컬럼의 결측치 확인
shop.isnull().sum()
6. 도로명 주소를 가지고 서울인 지점만 분류하기
str.startiwith()사용!
~ 반대를 의미한다 !
# 도로명 주소가 서울인 곳만 분리
shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul
# 서울 이외는 따로 분리
shop_except_seoul = shop.loc[~shop['도로명주소'].str.startswith('서울')] # 반대는 ~ 표시
shop_except_seoul
7. 도로명 주소가 서울인 곳 시각화 해보기
scatter 표는 이렇게 점으로 표시된다.
경도,위도는 shop_seoul의 컬럼
shop_seoul.plot.scatter (x='경도',y='위도',grid=True,figsize=(10,8))
8. 시군구명을 기준으로 데이터 시각화 2
hue를 사용하면 해당 데이터의 컬럼을 범례처럼 사용 가능 / hue를 기준으로 색상이 다르게 표시
plt.rc('font',family='NanumGothicCoding')
plt.figure(figsize=(14,10))
sns.scatterplot(data=shop_seoul,x='경도',y='위도',hue='시군구명')
9. 서울에 있으며 , 상권업종대분류명중 학문/교육만 따로 분리
shop_seoul_edu= shop_seoul[shop_seoul['상권업종대분류명'] == '학문/교육']
shop_seoul_edu
10. 서울에 있으며 , 상권업종대분류명중 학문/교육 시각화 하기
plt.figure(figsize=(14,10))
sns.scatterplot(data=shop_seoul_edu, x='경도',y='위도', hue='상권업종중분류명')
728x90
'실습 및 과제' 카테고리의 다른 글
Python(Colab) 전국 도시공원 데이터 주물럭거리기 (0) | 2023.06.11 |
---|---|
JavaScripts _ 기초 간단 프로그램(성인 구별) (0) | 2023.04.05 |
CSS+VSCODE 카페 메인 페이지 만들기 (0) | 2023.04.04 |