코랩(19)
-
Python(Colab) 파이토치(Pytorch) + 다항 선형회귀 해보기
1. 기초설정 #데이터 설정 x_train = torch.FloatTensor([[73,80,75], [93,88,93], [89,91,90], [96,98,100], [73,66,70]]) y_train = torch.FloatTensor([[152],[185],[180],[196],[142]]) print(x_train) print(x_train.shape) print('------------------') print(y_train) print(y_train.shape) 2. 모델 설정 model = nn.Linear(3,1) # 3개가 들어가서 1개가 나온다 print(model) print(list(model.parameters())) 3. 학습하기 optimizer = optim.SGD(mode..
2023.06.20 -
Python(Colab) 파이토치(Pytorch) + 단항 선형회귀 해보기
1개 입력 / 1개 출력 참고사이트 https://rabo0313.tistory.com/entry/pytorch-torchmanualseed [Pytorch] torch.manual_seed() random seed 란 ? numpy 에서도 사용했던 random seed 5개의 난수를 생성 한다고 하면 우리는 np.random.rand(5)로 난수를 생성한다. 연달아서 np.random.rand(5)를 실행한다면 아래처럼, 생성할때마다 매번 서로 다 rabo0313.tistory.com 1. 기초설정 import torch import torch.nn as nn #신경망 모듈 import torch.optim as optim # 기울기와 절편을 학습시키는 알고리즘 import matplotlib.pypl..
2023.06.18 -
Python(Colab) 파이토치(Pytorch)
✔️ 파이토치(Pytorch) - 텐서플로우와 함께 머신러닝, 딥러닝에서 가장 널리 사용되고 있는 프레임워크 - 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들었다. - 후에 파이썬 기반으로 변경한 것이 Pytorch이다. 1. 파이토치 사용하기 import torch 2. 파이토치 버전 확인하기 print(torch.__version__) ✔️ 스칼라: 하나의 상수를 의미 var1 = torch.tensor([1]) var2 = torch.tensor([6.5]) print(var1) print(type(var1)) # 두 스칼라의 연산 print(var1+ var2) print(var1- var2) print(var1* var2) print(var1/ var2) ✔️ 백터:상수가 2개이상 나..
2023.06.18 -
Python(Colab) 서포트 백터 머신 (Support Vector Machine)
✔ 서포트 백터 머신 (Support Vector Machine) - 두 클래스로부터 최대한 멀리 떨어져 있는 결정 경계를 찾는 분류기 - 특정 조건에 만족하는 동시에 클래스를 분류하는 것을 목표 데이터로 실습 1. 기초설정 from sklearn.datasets import load_digits #샘플 데이터 import numpy as np digits = load_digits() digits.keys() 2. 데이터만 분리하기( 샘플데이터에서) 독립변수로 사용예정 data = digits['data'] data.shape 3. target 데이터 변수의 저장하기 종속변수로 사용예정 target = digits['target'] target.shape 4. 시각화 해서 데이터 확인 하기 import ..
2023.06.15 -
Python(Colab) 의사 결정 나무(Decision Tree)
✔ 의사 결정 나무 - 데이터를 분석하여 그 사이에 존재하는 패턴을 예측 가능한 규칙들의 조합으로 나타내며 그 모양이 나무와 유사하다하여 의사 결정 나무라고 부른다. 특징) 1. 분류와 회귀 모두 가능하다. 2. 지니계수(Gennie Index) : 0에 가까울수록 클래스에 속한 불순도가 낮다 3. 엔트로피(Entropy): 결정을 내릴만한 충분한 정보의 데이터가 없다고 보는 것 4. 과대적합(overfitting): 훈련데이터에서는 정확하나, 테스트 데이터에서는 성과가 나쁜 현상 훈련 데이터가 적거나, 노이즈가 있을 때 또는 알고리즘 자체가 나쁠때 발생 의사 결정 나무에서는 나무 가지가 많거나, 크기가 클 때 발생 cf) 과대 적합을 회피하기 위한 대책 1) 사전 가지치기: 나무가 다 자라기전에 알고리..
2023.06.13 -
Python(Colab) 워드클라우드(WordCloud)
워드 클라우드 - 핵심 단어를 시각화 하는 기번 - 문서의 키워드, 개념 등을 직관적으로 파악할 수 있게 핵심 단어를 시각적으로 돋보이게 하는 기법 기초 설정 ! pip install wordcloud from wordcloud import WordCloud generate(): 단어별 출현 빈도수를 비율로 반환하는 객체를 생성 .words_: 단어에 대한 비율을 반환 wordcloud.words_ 글자수 데로 정렬하기 noun_text.sort(key=lambda x : len(x)) print(noun_text) 불용어말고 알고리즘으로 제외 시키기 #STOPWORDS말고 알고리즘으로 제외 시키기 stop_words = ['함','것','제','정','바','그'] noun_text = [each_wo..
2023.06.09