파이썬(36)
-
Python(Colab) 타이타닉 데이터 셋 (Titanic data set)(LabelEncoder)
1. 기초 설정 import numpy as np import pandas as pd df = pd.read_csv('https://bit.ly/fc-ml-titanic') df.head() 2. 데이터 정보 확인 df.info() 3. 데이터 셋 컬럼 설명 * PassengerId : 승객 아이디 * Survived : 생존 여부 * Pclass : 좌석 등급 * Name : 이름 * Sex : 성별 * Age : 나이 * SibSp : 형제자매 배우자수 * Parch : 부모 자식 수 * Ticket: 티켓번호 * Fare: 요금 * Cabin: 선실번호 * Embarked : 탑승 항구 4. 학습 데이터와 검증 데이터 나누기 독립변수 column : 성별, 요금, 나이, 좌석등급 종속변수 colum..
2023.06.12 -
Python(Colab) 아이리스 데이터 셋 (Iris data set)(Scikit-Learn)
🔴 주의점 > 검증 데이터와 학습 데이터에서 겹치는 데이터가 존재시 과대적합(overfitting)이 발생한다 > 그래서 검증데이터랑 학습데이터에는 겹치는게 있으면 X 1. 기초 설정 from sklearn.datasets import load_iris iris = load_iris() 2. 데이터셋 설명 보기 print(iris['DESCR']) 3. 데이터 셋 설명 요약 4. 데이터 셋 key + value찾기 iris.keys() # data, target, frame, target_names, DESCR, feature_names, filename,data_module 8개 존재 5. data 키만 뽑아서 변수의 저장하기 data = iris['data'] 6. 데이터 프레임에 사용할 target..
2023.06.12 -
Python(Colab) 사이킷 런 모듈(Scikit-learn Module)
Scikit-learn Module (사이킷 런) - 대표적인 파이썬 머신러닝 모듈 - 다양한 머신러닝 알고리즘을 제공 - 다양한 샘플 데이터를 제공 - 머신러닝 결과 검증하는 기능을 제공 - BSD 라이센스이여서, 무료로 사용 및 배포 가능 (BSD 라이센스: Bekeley Software Distribution 소프트웨어의 무료 사용, 수정 및 배포를 허용한 오픈 라이센스) https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 1.2.2 documentation Model selection Comparing, validating and choosing parameters and models. Ap..
2023.06.11 -
Python(Colab) 머신러닝 개념 및 기초
✔️머신러닝 데이터를 기반으로 학습하는 기계 ✔️딥러닝 머신러닝의 한 분야로써 깊은(deep) 신경망 구조의 머신러닝 ✔️배경 과거) 컴퓨터로 데이터를 읽어들이고, 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업이 있었다(패턴인식이라 부름) 현재) 데이터를 대량으로 수집,처리할 수 있는 환경이 구축되어 할 수 있는 일이 多 --> 머신 러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이다. 따라서 데이터가 가장 중요하다. ✔️머신러닝 정의 무엇(X)으로 무엇(Y)을 예측이 가능한 함수(f)를 찾아내는 것 X: 데이터(입력변수, 독립변수, 원인) Y: 답(출력변수, 종속변수, 결과) f: 모형(머신러닝의 알고리즘) ✔️머신러닝 분류 1. 회귀(Regression) - 시계열(시간적인 변화를 연속적으로 관..
2023.06.11 -
Python(Colab) 상권 별 업종 밀집 통계 주물럭거리기
목표: csv 데이터를 가지고 여러가지 기준으로 시각화해서 만들어보기 1. 기초설정 import pandas as pd import numpy as np import matplotlib.pyplot as plt #그래프로 확인하기 위한 시각화 라이브러리 import seaborn as sns #matplotlib 기반으로 만들어진 시각화 라이브러리 2. csv파일 shop변수에 저장 shop = pd.read_csv('/content/drive/MyDrive/KDT-1/데이터분석/shop_201806_01.csv') shop 3. shop 데이터 기초 파악 pd.set_option('display.max_columns',40) shop.info() 4.사용할 컬럼만 확인 후 재정렬 view_..
2023.06.09 -
Python(Colab) folium
folium 라이브러리란? - leaflet.js 기반으로 만들어진 라이브러리 - 지도위에 데이터를 표현해주는 대표적인 지도 시각화 라이브러리 기초설정 !pip install folium import folium from folium.features import CustomIcon # 아이콘 변경시 사용함 from folium.plugins import MarkerCluster # 마커 클러스터라는 모양을 가진 지도 표시할 라이브러리 1. folium.Map(location= [위도,경도], zoom_start=배율) 지도를 띄운다 2. folium.Marker(location=[위도,경도],max_width= 최대 크기) 지도에 마커를 표시하는 기능 3. folium.Popup('내용') 마커 선택시 ..
2023.06.09