ML (MachineLearning) 17

DTree(Decision Tree) 알고리즘으로 새로운 데이터 카테고리 분류하기

머신러닝의 지도학습에 속하는 Classfication(분류) - Logistic Regression (로지스틱 회귀) - KNN(K nearest neighbor) 알고리즘, - SVC(Support Vector Machine) 알고리즘, - DT(Decision Tree) 알고리즘 네 가지 방법 중에 정확도가 더 높은 방법으로 알고리즘을 선택하여 사용한다 import numpy as np import matplotlib.pyplot as plt import pandas as pd DT(Decision Tree) 의사결정 나무는 흐름도이며 이전 경험을 바탕으로 의사결정을 내리는 데 도움을 주는 것이다. df User ID Gender Age EstimatedSalary Purchased 0 1562451..

SVM(Support Vector Machine) 알고리즘으로 새로운 데이터 카테고리 분류하기

머신러닝의 지도학습에 속하는 Classfication(분류) - Logistic Regression (로지스틱 회귀) - KNN(K nearest neighbor) 알고리즘, - SVC(Support Vector Machine) 알고리즘, - DT(Decision Tree) 알고리즘 네 가지 방법 중에 정확도가 더 높은 방법으로 알고리즘을 선택하여 사용한다 SVM(Support Vector Machine) SVC (Support Vector Classifier): SVC는 분류 문제를 해결하기 위한 SVM의 변형이다 이것은 주어진 데이터를 분류하기 위해 최적의 분리 초평면을 찾는다 SVC는 클래스 간의 경계를 분리하기 위해 최적의 초평면을 찾는 것이 목표 SVR (Support Vector Regress..

KNN(K nearest neighbor) 알고리즘으로 새로운 데이터 카테고리 분류하기

머신러닝의 지도학습에 속하는 Classfication(분류) - Logistic Regression (로지스틱 회귀) - KNN(K nearest neighbor) 알고리즘, - SVC(Support Vector Machine) 알고리즘, - DT(Decision Tree) 알고리즘 네 가지 방법 중에 정확도가 더 높은 방법으로 알고리즘을 선택하여 사용한다 import numpy as np import matplotlib.pyplot as plt import pandas as pd df User ID Gender Age EstimatedSalary Purchased 0 15624510 Male 19 19000 0 1 15810944 Male 35 20000 0 2 15668575 Female 26 430..

데이터 불균형이 발생할 때, 데이터 리샘플링하기

import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as sb #당뇨병을 분류하는 모델 df Preg Plas Pres skin test mass pedi age class 0 6 148 72 35 0 33.6 0.627 50 1 1 1 85 66 29 0 26.6 0.351 31 0 2 8 183 64 0 0 23.3 0.672 32 1 3 1 89 66 23 94 28.1 0.167 21 0 4 0 137 40 35 168 43.1 2.288 33 1 ... ... ... ... ... ... ... ... ... ... 763 10 101 76 48 180 32.9 0.171 63 0 764 2 1..

Logistic Regression (로지스틱 회귀)

머신러닝의 지도학습에 속하는 Classfication(분류) - Logistic Regression (로지스틱 회귀) - KNN(K nearest neighbor) 알고리즘, - SVC(Support Vector Machine) 알고리즘, - DT(Decision Tree) 알고리즘 네 가지 방법 중에 정확도가 더 높은 방법으로 알고리즘을 선택하여 사용한다 로지스틱 회귀란 ? - 분류 문제를 해결하는것을 목표로 합니다 - 연속적인 결과를 예측하는 선형회귀와 다르게 범주형 결과를 예측하여 이를 수행합니다 - 가장 간단한 방법이 이항이라고 불리는 두가지 결과가 있는데 그 예로 암이 악성인지 양성인지 예측하는 것입니다 Confusion Matrix 대부분의 경우, C가 더 중요하다 오탐지의 경우 맞은것을 못찾..

Linear regression을 사용하여 신규 데이터 입력 시, 데이터 기반 예측 값 알려주기

Simple linear regression 하나의 변수로 X -> y를 알아낸다 Multiple linear regression 여러개의 변수로 X1, X2, X3 ... -> y를 알아낸다 여기서는 Multiple linear regression로 데이터 기반 예측값을 알아보도록 하겠다. import numpy as np import matplotlib.pyplot as plt import pandas as pd 여러개의 데이터를 기반으로 Profit (수익)을 예측하려 한다. df R&D Spend Administration Marketing Spend State Profit 0 165349.20 136897.80 471784.10 New York 192261.83 1 162597.70 151377..

Regressor(회귀모델) 생성하고, MSE(평균제곱오차)구하는 방법

Prediction - regressor (회귀모델) 머신러닝 regressor는 지도(학습)모델로 과거 데이터를 입력시켜주면 그에 대한 예측값을 알려주는 모델이다. 회귀 모델은 주로 예측하려는 값이 연속형 데이터인 경우에 사용되며 특정한 데이터에 대한 패턴을 학습하고, 그 패턴을 기반으로 새로운 입력에 대한 값을 예측한다 import numpy as np import matplotlib.pyplot as plt import pandas as pd 문제 ) 머신러닝을 통해 Purchased 값을 알고싶다. df Country Age Salary Purchased 0 France 44.000000 72000.000000 No 1 Spain 27.000000 48000.000000 Yes 2 Germany ..