'ML (MachineLearning)' 카테고리의 글 목록

프로펫(Prophet) 라이브러리 사용하기

install : pip install prophet위 에러 발생시 : conda install -c conda-forge prophet 임포트하기 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport randomimport seaborn as snsfrom prophet import Prophet 아보카도 데이터 프로펫 분석을 위해, 두개의 컬럼만 가져오기 ('Date', 'AveragePrice') avocado_prophet_df = df[['Date','AveragePrice']] avocado_prophet_df DateAveragePrice02015-01-041.3312015-01-041.3522015..

ML (MachineLearning) 2024.04.23

데이터 제너레이터를 통해 이미지를 증강하고 Transfer Learning하기

BASE MODEL HEAD MODEL - 트랜스퍼 러닝은, 학습이 잘 된 모델을 가져와서 우리의 문제에 맞게 활용하는 것이므로 학습이 잘 된 모델의 base model만 가져온다 즉, head모델은 빼고 가져와서 사용자가 직접 head모델을 예측하는 것이다. 트랜스퍼 러닝의 과정은 다음과 같다 설치하기 !pip install tensorflow-gpu==2.0.0.alpha0 !pip install tqdm Dogs vs Cats dataset 다운로드받기 !wget --no-check-certificate \ https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip \ -O ./cats_and_dogs_filtered.zip 임..

ML (MachineLearning) 2024.04.22

딥러닝 : CNN(합성곱 신경망, Convolutional Neural Network), 컬러사진 식별하기

CNN은 컨볼루션 계층(convolutional layer)과 풀링 계층(pooling layer)으로 구성된 신경망이다. 1. 컨볼루션 계층은 입력 이미지에 대해 필터(또는 커널)를 사용하여 입력 데이터를 변환하는 계층이다. 이 필터는 입력 이미지의 특정 패턴을 감지하는 역할을 합니다. 예를 들어, 가장자리, 질감, 색상 등을 감지할 수 있다. 2. 풀링 계층은 출력의 공간 크기를 줄이는 역할을 한다. 일반적으로 최대 풀링(max pooling)이나 평균 풀링(average pooling)을 사용하여 출력을 각 영역에서 가장 큰 값 또는 평균 값으로 대체한다. 이는 공간 해상도를 감소시키고, 계산량을 줄이며, 불필요한 정보를 제거하여 특징을 보다 강조한다. CNN은 이러한 컨볼루션 계층과 풀링 계층을 ..

ML (MachineLearning) 2024.04.18

tensorflow(텐서플로우)에서 def를 저장하고 불러오는 방법

import numpy as npimport tensorflow as tffrom tensorflow.keras.datasets import fashion_mnist# 데이터 불러오기(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data() sklearn과 저장방식의 차이점 sklearn => joblib .pkltensorflow => save .h5 def 생성하기 def build_model(): model = Sequential() model.add( Flatten() ) model.add( Dense(128, 'relu') ) model.add( Dense(10, 'softmax')) model.compile('..

ML (MachineLearning) 2024.04.18

흑백 이미지 데이터셋을 AI에게 판별시켜, 카테고리의 정답을 맞추는 머신러닝 기법

https://www.tensorflow.org/datasets/catalog/fashion_mnist?hl=ko 패션_엠니스트 | TensorFlow Datasets 이 페이지는 Cloud Translation API를 통해 번역되었습니다. 패션_엠니스트 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요. Fashion-MNIST는 60,000개의 예제로 구성된 www.tensorflow.org import numpy as np import tensorflow as tf from tensorflow.keras.datasets import fashion_mnist #fashion_mnist 사용 (X_train, y_train), (X_test, y_test) = fashion..

ML (MachineLearning) 2024.04.18

GridSearch 를 이용한 최적의 하이퍼 파라미터 찾기

https://www.tensorflow.org/api_docs/python/tf/keras?_gl=1*7074vd*_up*MQ..*_ga*MjEzMDk5NTY2NC4xNzEzNDg3ODQ0*_ga_W0YLR4190T*MTcxMzQ4Nzg0NC4xLjAuMTcxMzQ4Nzg0NC4wLjAuMA.. Module: tf.keras | TensorFlow v2.16.1 DO NOT EDIT. www.tensorflow.org ! pip install scikeras from scikeras.wrappers import KerasClassifier from sklearn.model_selection import GridSearchCV from keras.models import Sequential from ke..

ML (MachineLearning) 2024.04.17

딥러닝 : Neural Networks 으로 Classification(분류) 하기

딥러닝은 이미지 인식, 자연어 처리, 음성 인식 등 다양한 영역에서 매우 성공적으로 사용되고 있다. 딥러닝은 히든레이어가 많다는 것이 특징이다 - 딥러닝에서 "히든 레이어"는 입력층(input layer)과 출력층(output layer) 사이에 있는 중간 레이어를 가리킨다. 히든 레이어가 많을수록, 모델은 더 복잡한 패턴이나 관계를 학습할 수 있게 된다. 이는 입력과 출력 간의 복잡한 비선형 관계를 모델링하는 데 도움이 됩니다. - 더 많은 히든 레이어를 가진 신경망은 더 많은 파라미터를 가지기 때문에, 더 많은 데이터와 연산 리소스를 필요로 한다. 그러나 충분한 데이터와 리소스가 제공된다면, 깊은 신경망은 매우 복잡한 문제를 해결하는 데 효과적일 수 있다. 금융상품 갱신(0 또는 1) 여부 예측하는 ..

ML (MachineLearning) 2024.04.16

머신러닝 알고리즘 개념 요약

- 평균 중앙값 모드 (평균 값, 중간점 값, 가장 일반적인 값) - 표준편차 : 값이 얼마나 분산되어 있는지를 나타내는 숫자 - 백분위수 : 통계에서 특정 값이 백분율이 더 낮은 값 - 데이터배포 : 빅데이터 세트를 어떻게 얻는지 - 정규 데이터 분포 : 주어진 값 주위에 값이 집중되는 배열을 만드는 방법 - 산포도 : 데이터 세트에서 각 값이 점으로 표시되는 다이어그램 - 선형회귀 : 변수간의 관계를 찾으려고 할 때 사용 - 다항식 회귀 : 데이터 포인트가 선형(모든 데이터 포인트를 통과하는 직선)에 맞지 않으면 다항식 회귀를 사용 - 다중회귀 : 선형회귀와 비슷하지만 두개 이상의 독립적인 값 즉, 두개 이상의 변수를 기반으로 값을 예측하기 위함 - 규모 : 스케일 기능 (데이터 값이 다르면 비교하기..

ML (MachineLearning) 2024.04.16

하이라키 클러스터링(Hierarchical Clustering) : 계층적 군집

머신러닝의 비지도(unsupervised)학습 1. 평할/분할 기반의 군집 (Partition-based Clustering)- 비슷한 특징을 갖는 데이터끼리 묶는것이다- 주어진 데이터에 대해 미리 정의된 수의 군집을 형성하며, 데이터를 해당 군집에 할당하는 방식으로 동작한다ex ) K-Means Clustering 2. 계층적 군집 (Hierarchical Clustering)- 데이터를 순차적 또는 계층적으로 그룹화하는 알고리즘- 데이터 포인트 간의 거리 또는 유사도를 기반으로 계층 구조를 형성하여 군집을 형성- 계층적인 구조를 가지고 있어 군집화 결과를 다양한 수준에서 살펴볼 수 있으며, 시각적으로 표현하기 쉽다- 사전에 군집의 개수를 지정할 필요가 없어 편리- 큰 데이터셋에 대해서는 계산 비용..

ML (MachineLearning) 2024.04.16

K-Means 알고리즘

머신러닝의 비지도(unsupervised)학습 1. 평할/분할 기반의 군집 (Partition-based Clustering) - 비슷한 특징을 갖는 데이터끼리 묶는것이다 - 주어진 데이터에 대해 미리 정의된 수의 군집을 형성하며, 데이터를 해당 군집에 할당하는 방식으로 동작한다 ex ) K-Means Clustering 2. 계층적 군집 (Hierarchical Clustering) - 데이터를 순차적 또는 계층적으로 그룹화하는 알고리즘 - 데이터 포인트 간의 거리 또는 유사도를 기반으로 계층 구조를 형성하여 군집을 형성 - 계층적인 구조를 가지고 있어 군집화 결과를 다양한 수준에서 살펴볼 수 있으며, 시각적으로 표현하기 쉽다 - 사전에 군집의 개수를 지정할 필요가 없어 편리 - 큰 데이터셋에 대해서는..

ML (MachineLearning) 2024.04.16

Rabbit's efficient coding 🖥️🐇 & 금융

ML (MachineLearning) 17

티스토리툴바