딥러닝 : CNN(합성곱 신경망, Convolutional Neural Network), 컬러사진 식별하기

ML (MachineLearning)

딥러닝 : CNN(합성곱 신경망, Convolutional Neural Network), 컬러사진 식별하기

567Rabbit 2024. 4. 18. 18:09

CNN은 컨볼루션 계층(convolutional layer)과 풀링 계층(pooling layer)으로 구성된 신경망이다.

1. 컨볼루션 계층은 입력 이미지에 대해 필터(또는 커널)를 사용하여 입력 데이터를 변환하는 계층이다. 이 필터는 입력 이미지의 특정 패턴을 감지하는 역할을 합니다. 예를 들어, 가장자리, 질감, 색상 등을 감지할 수 있다.

2. 풀링 계층은 출력의 공간 크기를 줄이는 역할을 한다. 일반적으로 최대 풀링(max pooling)이나 평균 풀링(average pooling)을 사용하여 출력을 각 영역에서 가장 큰 값 또는 평균 값으로 대체한다. 이는 공간 해상도를 감소시키고, 계산량을 줄이며, 불필요한 정보를 제거하여 특징을 보다 강조한다.

CNN은 이러한 컨볼루션 계층과 풀링 계층을 여러 층으로 쌓아서 구성된다. 이후에는 일반적으로 완전 연결된계층으로 연결하여 최종 분류나 예측을 수행한다.

이러한 아키텍처는 이미지나 비디오와 같은 고차원 데이터의 특징을 추출하는 데 매우 효과적이며 음성 인식, 자연어 처리, 게임 인공지능 등 다양한 분야에서도 사용되고 있다.

1. 컨볼루션 계층

필터는 입력 이미지 위를 슬라이딩하면서 각 위치에서 입력 데이터와 필터의 요소 간의 곱을 계산하고, 이를 모두 합산하여 출력값을 생성한다

'relu'는 0 이하의 값들을 모두 0으로 만들어준다

아래는 최종으로 만들어진 필터(커널) 이다.

2. 풀링 계층

아래는 최대풀링(max pooling)으로, 필터를 데이터에 적용한 후, 간격에서 가장 높은값을 가지는 값으로 데이터화하는 것이다. 실무에서는 대부분 max pooling을 사용한다.

평균 풀링(average pooling)을 사용하면 간격에서 평균값을 구해, 그 값으로 데이터화하는 것이다.

데이터에 적용해보기

import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

#데이터 가져오기
(X_train, y_train),(X_test, y_test)= fashion_mnist.load_data()

데이터는 fashon_mnist 데이터를 로드하여 사용한다.

<피처스케일링>

X_train = X_train / 255.0

X_test = X_test / 255.0

<reshape>

- 칼라이미지이든 그레이스케일 이미지든 전부 처리할 수 있는 인공지능 개발 위해 4차원으로 reshape 한다.

X_train.shape

(60000, 28, 28)

X_test.shape

(10000, 28, 28)

X_train = X_train.reshape(60000, 28, 28, 1) #1 : grayscale, 3 : colorscale(rgb이므로 3)

X_test = X_test.reshape(10000, 28, 28, 1)

<모델링하기>

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense  #convolution2D

from typing import Sequence

def build_model():
  model = Sequential()
  model.add( Conv2D( filters=64, kernel_size=(3,3), activation='relu' , input_shape=(28,28,1) ) ) #kernel(=filter)을 3행 3열로
  model.add( MaxPooling2D(pool_size=(2,2), strides=2) )
  model.add( Conv2D( filters=64, kernel_size=(2,2), activation='relu' ) )
  model.add( MaxPooling2D(pool_size=(2,2), strides=2) )
  model.add( Flatten() )                 #입력레이어
  model.add( Dense(128, 'relu') )        #은닉레이어
  model.add( Dense(10, 'softmax') )      #출력레이어
  model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])  #컴파일
  return model

model = build_model()
from tensorflow.keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(monitor='val_accuracy', patience=10)

epoch_history = model.fit(X_train, y_train, epochs=1000, validation_split=0.2, callbacks=[early_stopping])

<평가하기>

model.evaluate(X_test, y_test)

 [==============================] - 1s 3ms/step - loss: 0.4803 - accuracy: 0.9096

[0.48025116324424744, 0.909600019454956]

<confusion_matrix>

from sklearn.metrics import confusion_matrix

import numpy as np

confusion_matrix(y_test, y_pred)

array([[843,   1,  13,  13,   7,   1, 117,   0,   5,   0],
       [  1, 980,   0,  10,   4,   0,   3,   0,   2,   0],
       [ 17,   0, 802,   8,  81,   0,  92,   0,   0,   0],
       [ 19,   3,   7, 909,  17,   0,  42,   0,   2,   1],
       [  3,   1,  20,  23, 878,   0,  75,   0,   0,   0],
       [  0,   0,   0,   0,   0, 977,   0,  12,   1,  10],
       [ 83,   1,  38,  22,  55,   0, 796,   0,   5,   0],
       [  0,   0,   0,   0,   0,   5,   0, 970,   0,  25],
       [  1,   0,   1,   6,   3,   4,   8,   4, 973,   0],
       [  0,   0,   0,   0,   0,   4,   2,  26,   0, 968]])

저작자표시 비영리 변경금지 (새창열림)

'ML (MachineLearning)' 카테고리의 다른 글

프로펫(Prophet) 라이브러리 사용하기 (0)	2024.04.23
데이터 제너레이터를 통해 이미지를 증강하고 Transfer Learning하기 (2)	2024.04.22
tensorflow(텐서플로우)에서 def를 저장하고 불러오는 방법 (0)	2024.04.18
흑백 이미지 데이터셋을 AI에게 판별시켜, 카테고리의 정답을 맞추는 머신러닝 기법 (0)	2024.04.18
GridSearch 를 이용한 최적의 하이퍼 파라미터 찾기 (0)	2024.04.17

현재글딥러닝 : CNN(합성곱 신경망, Convolutional Neural Network), 컬러사진 식별하기

Rabbit's efficient coding 🖥️🐇 & 금융