Глубокое обучение 100 примеров - распознавание цветов сверточной нейронной сетью (CNN) День 4

глубокое обучение

1. Предварительная работа

В этой статье CNN будет использоваться для распознавания цветов.

моя среда:

  • Язык: Python3.6.5
  • Компилятор: Jupyter Notebook
  • Среда глубокого обучения: TensorFlow2
  • Адрес данных:【Портал】

? Из рубрики:【100 случаев глубокого обучения】

1. Настройте графический процессор

Если вы используете ЦП, вы можете пропустить этот шаг.

import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")

if gpus:
    gpu0 = gpus[0]                                        #如果有多个GPU,仅使用第0个GPU
    tf.config.experimental.set_memory_growth(gpu0, True)  #设置GPU显存用量按需使用
    tf.config.set_visible_devices([gpu0],"GPU")

2. Скачать данные

import matplotlib.pyplot as plt
import numpy as np
import os
import PIL
import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers,models

import pathlib
dataset_url = "https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz"

data_dir = tf.keras.utils.get_file(fname    = 'flower_photos', # 下载到本地后的文件名称
                                   origin   = dataset_url,     # 数据集(Dataset)的URL路径;
                                   untar    = True,            # 是否解压文件
                                   cache_dir= 'D:/jupyter notebook/DL-100-days')

data_dir = pathlib.Path(data_dir)
data_dir
WindowsPath('D:/jupyter notebook/DL-100-days/datasets/flower_photos')

Последние данные сохраняются вD:\jupyter notebook\DL-100-days\datasets\flower_photosПод содержанием

3. Проверьте данные

Набор данных разделен наdaisy,dandelion,roses,sunflowers,tulipsПять категорий, хранящихся в пяти подпапках в папке flower_photo.

image_count = len(list(data_dir.glob('*/*.jpg')))

print("图片总数为:",image_count)
图片总数为: 3670
roses = list(data_dir.glob('roses/*'))
PIL.Image.open(str(roses[0]))

在这里插入图片描述

2. Предварительная обработка данных

1. Загрузите данные

использоватьimage_dataset_from_directoryметод загрузки данных с диска вtf.data.Datasetсередина

batch_size = 32
img_height = 180
img_width = 180
"""
关于image_dataset_from_directory()的详细介绍可以参考文章:https://mtyjkh.blog.csdn.net/article/details/117018789
"""
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="training",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)
Found 3670 files belonging to 5 classes.
Using 2936 files for training.
"""
关于image_dataset_from_directory()的详细介绍可以参考文章:https://mtyjkh.blog.csdn.net/article/details/117018789
"""
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
    data_dir,
    validation_split=0.2,
    subset="validation",
    seed=123,
    image_size=(img_height, img_width),
    batch_size=batch_size)
Found 3670 files belonging to 5 classes.
Using 734 files for validation.

Мы можем вывести метки набора данных через class_names. Метки будут соответствовать в алфавитном порядке именам каталогов.

class_names = train_ds.class_names
print(class_names)
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

2. Визуализируйте данные

plt.figure(figsize=(20, 10))

for images, labels in train_ds.take(1):
    for i in range(20):
        ax = plt.subplot(5, 10, i + 1)

        plt.imshow(images[i].numpy().astype("uint8"))
        plt.title(class_names[labels[i]])
        
        plt.axis("off")

在这里插入图片描述

3. Проверьте данные еще раз

for image_batch, labels_batch in train_ds:
    print(image_batch.shape)
    print(labels_batch.shape)
    break
(32, 180, 180, 3)
(32,)
  • Image_batchявляется тензором формы (32, 180, 180, 3). Это пакет из 32 изображений размером 180x180x3 (последний размер относится к цветовому каналу RGB).
  • Label_batch— тензор формы (32,), эти метки соответствуют 32 изображениям

4. Настройте набор данных

  • shuffle(): скремблировать данные Подробное описание этой функции см. в:zhuanlan.zhihu.com/p/42417456
  • prefetch(): Предварительная выборка данных, ускорение работы

prefetch()Детали функции: Когда ЦП готовит данные, ускоритель находится в состоянии ожидания. Вместо этого ЦП простаивает, пока ускоритель обучает модель. Следовательно, время, необходимое для обучения, равно сумме времени предварительной обработки ЦП и времени обучения ускорителя.prefetch()Перекрывайте предварительную обработку шага обучения и процесса выполнения модели. Пока ускоритель выполняет N-й шаг обучения, ЦП подготавливает данные для N+1-го шага. Это не только минимизирует время этапа обучения (а не общее время), но также сокращает время, необходимое для приема и преобразования данных. если не использоватьprefetch(), CPU и GPU/TPU большую часть времени бездействуют:在这里插入图片描述использоватьprefetch()Значительно сокращает время простоя:在这里插入图片描述

  • cache(): кэшируйте набор данных в память, чтобы ускорить операцию.
AUTOTUNE = tf.data.AUTOTUNE

train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

3. Построение сети CNN

Входные данные для сверточной нейронной сети (CNN) находятся в форме тензора.(image_height, image_width, color_channels), который содержит информацию о высоте, ширине и цвете изображения. Ввод не требуетсяbatch size. color_channels — это (R, G, B), соответствующие трем цветовым каналам RGB соответственно. В этом примере наш ввод CNN, изображение из набора данных fashion_mnist, имеет форму(28, 28, 1)то есть изображение в градациях серого. Нам нужно присвоить форму параметру при объявлении первого слояinput_shape.

num_classes = 5

"""
关于卷积核的计算不懂的可以参考文章:https://blog.csdn.net/qq_38251616/article/details/114278995
"""

model = models.Sequential([
    layers.experimental.preprocessing.Rescaling(1./255, input_shape=(img_height, img_width, 3)),
    
    layers.Conv2D(16, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)), # 卷积层1,卷积核3*3
    layers.MaxPooling2D((2, 2)),                   # 池化层1,2*2采样
    layers.Conv2D(32, (3, 3), activation='relu'),  # 卷积层2,卷积核3*3
    layers.MaxPooling2D((2, 2)),                   # 池化层2,2*2采样
    layers.Conv2D(64, (3, 3), activation='relu'),  # 卷积层3,卷积核3*3
    
    layers.Flatten(),                       # Flatten层,连接卷积层与全连接层
    layers.Dense(128, activation='relu'),   # 全连接层,特征进一步提取
    layers.Dense(num_classes)               # 输出层,输出预期结果
])

model.summary()  # 打印网络结构
Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
rescaling_1 (Rescaling)      (None, 180, 180, 3)       0         
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 178, 178, 16)      448       
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 89, 89, 16)        0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 87, 87, 32)        4640      
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 43, 43, 32)        0         
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 41, 41, 64)        18496     
_________________________________________________________________
flatten_1 (Flatten)          (None, 107584)            0         
_________________________________________________________________
dense_2 (Dense)              (None, 128)               13770880  
_________________________________________________________________
dense_3 (Dense)              (None, 5)                 645       
=================================================================
Total params: 13,795,109
Trainable params: 13,795,109
Non-trainable params: 0
_________________________________________________________________

В-четвертых, компилировать

Прежде чем модель будет готова к обучению, необходимо выполнить еще несколько настроек. На этапе компиляции модели было добавлено следующее:

  • Функция потерь (loss): используется для измерения точности модели во время обучения.
  • Оптимизатор: определяет, как модель обновляется на основе данных, которые она видит, и собственной функции потерь.
  • Метрики: используются для отслеживания этапов обучения и тестирования. В следующих примерах используется точность, которая представляет собой соотношение правильно классифицированных изображений.
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

5. Обучение модели

history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=10
)
Epoch 1/10
92/92 [==============================] - 9s 29ms/step - loss: 1.7851 - accuracy: 0.3435 - val_loss: 1.0564 - val_accuracy: 0.5640
Epoch 2/10
92/92 [==============================] - 1s 11ms/step - loss: 1.0037 - accuracy: 0.5867 - val_loss: 1.0490 - val_accuracy: 0.5708
Epoch 3/10
92/92 [==============================] - 1s 11ms/step - loss: 0.8206 - accuracy: 0.6746 - val_loss: 0.9763 - val_accuracy: 0.6158
Epoch 4/10
92/92 [==============================] - 1s 12ms/step - loss: 0.6061 - accuracy: 0.7864 - val_loss: 0.9745 - val_accuracy: 0.6158
Epoch 5/10
92/92 [==============================] - 1s 12ms/step - loss: 0.3319 - accuracy: 0.8929 - val_loss: 1.2550 - val_accuracy: 0.6076
Epoch 6/10
92/92 [==============================] - 1s 11ms/step - loss: 0.1607 - accuracy: 0.9473 - val_loss: 1.4897 - val_accuracy: 0.6172
Epoch 7/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0864 - accuracy: 0.9757 - val_loss: 1.5388 - val_accuracy: 0.6226
Epoch 8/10
92/92 [==============================] - 1s 12ms/step - loss: 0.0621 - accuracy: 0.9818 - val_loss: 2.0122 - val_accuracy: 0.6008
Epoch 9/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0390 - accuracy: 0.9893 - val_loss: 1.9353 - val_accuracy: 0.6267
Epoch 10/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0061 - accuracy: 0.9995 - val_loss: 2.1597 - val_accuracy: 0.6335

6. Оценка модели

plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0.5, 1])
plt.legend(loc='lower right')
plt.show()

test_loss, test_acc = model.evaluate(val_ds, verbose=2)

在这里插入图片描述

23/23 - 0s - loss: 2.1597 - accuracy: 0.6335

Из вышеизложенного видно, что по мере увеличения количества итераций разрыв между точностью обучения и точностью проверки постепенно увеличивается.Это связано с переоснащением.Пожалуйста, обратитесь к моей следующей статье для решения.

print("验证准确率为:",test_acc)
验证准确率为: 0.6335150003433228

? Из рубрики:【100 случаев глубокого обучения】