Python(Colab) 상권 별 업종 밀집 통계 주물럭거리기

2023. 6. 9. 17:21실습 및 과제

목표: csv 데이터를 가지고 여러가지 기준으로 시각화해서 만들어보기

 

1. 기초설정 

 

import pandas as pd
 
import numpy as np 
 
import matplotlib.pyplot as plt  #그래프로 확인하기 위한 시각화 라이브러리
 
import seaborn as sns #matplotlib 기반으로 만들어진 시각화 라이브러리

 

2. csv파일 shop변수에 저장

 

shop = pd.read_csv('/content/drive/MyDrive/KDT-1/데이터분석/shop_201806_01.csv')
 
shop
 

 

3. shop 데이터 기초 파악 

 

pd.set_option('display.max_columns',40)
 
shop.info()
 

 

4.사용할 컬럼만 확인 후 재정렬 

 

view_columns =  ['상호명', '지점명',  '상권업종대분류명', '상권업종중분류명', '상권업종소분류명', '표준산업분류명',
       '시도명',  '시군구명',  '행정동명', '법정동명', '지번주소', '도로명', '도로명주소', '경도', '위도']
 
shop = shop[view_columns]
 

 

5. 사용할 컬럼의 결측치 확인

 

shop.isnull().sum()
 

 

6. 도로명 주소를 가지고 서울인 지점만 분류하기 

str.startiwith()사용!

~ 반대를 의미한다 !

# 도로명 주소가 서울인 곳만 분리
shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul
 
 
# 서울 이외는 따로 분리
shop_except_seoul = shop.loc[~shop['도로명주소'].str.startswith('서울')] # 반대는 ~ 표시
shop_except_seoul
 

 

7. 도로명 주소가 서울인 곳 시각화 해보기

 

scatter 표는 이렇게 점으로 표시된다.

경도,위도는 shop_seoul의 컬럼

shop_seoul.plot.scatter (x='경도',y='위도',grid=True,figsize=(10,8))
 

 

8. 시군구명을 기준으로 데이터 시각화 2

 

hue를 사용하면 해당 데이터의 컬럼을 범례처럼 사용 가능 / hue를 기준으로 색상이 다르게 표시

plt.rc('font',family='NanumGothicCoding')
plt.figure(figsize=(14,10))
sns.scatterplot(data=shop_seoul,x='경도',y='위도',hue='시군구명')
 

 

 

9. 서울에 있으며 , 상권업종대분류명중 학문/교육만 따로 분리

 

shop_seoul_edu= shop_seoul[shop_seoul['상권업종대분류명'] == '학문/교육']
shop_seoul_edu
 

 

10. 서울에 있으며 , 상권업종대분류명중 학문/교육 시각화 하기

 

plt.figure(figsize=(14,10))
sns.scatterplot(data=shop_seoul_edu, x='경도',y='위도', hue='상권업종중분류명')
 

 

728x90