1. Предварительная работа
В этой статье CNN будет использоваться для распознавания цветов.
моя среда:
- Язык: Python3.6.5
- Компилятор: Jupyter Notebook
- Среда глубокого обучения: TensorFlow2
- Адрес данных:【Портал】
? Из рубрики:【100 случаев глубокого обучения】
1. Настройте графический процессор
Если вы используете ЦП, вы можете пропустить этот шаг.
import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")
if gpus:
gpu0 = gpus[0] #如果有多个GPU,仅使用第0个GPU
tf.config.experimental.set_memory_growth(gpu0, True) #设置GPU显存用量按需使用
tf.config.set_visible_devices([gpu0],"GPU")
2. Скачать данные
import matplotlib.pyplot as plt
import numpy as np
import os
import PIL
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers,models
import pathlib
dataset_url = "https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz"
data_dir = tf.keras.utils.get_file(fname = 'flower_photos', # 下载到本地后的文件名称
origin = dataset_url, # 数据集(Dataset)的URL路径;
untar = True, # 是否解压文件
cache_dir= 'D:/jupyter notebook/DL-100-days')
data_dir = pathlib.Path(data_dir)
data_dir
WindowsPath('D:/jupyter notebook/DL-100-days/datasets/flower_photos')
Последние данные сохраняются вD:\jupyter notebook\DL-100-days\datasets\flower_photos
Под содержанием
3. Проверьте данные
Набор данных разделен наdaisy
,dandelion
,roses
,sunflowers
,tulips
Пять категорий, хранящихся в пяти подпапках в папке flower_photo.
image_count = len(list(data_dir.glob('*/*.jpg')))
print("图片总数为:",image_count)
图片总数为: 3670
roses = list(data_dir.glob('roses/*'))
PIL.Image.open(str(roses[0]))
2. Предварительная обработка данных
1. Загрузите данные
использоватьimage_dataset_from_directory
метод загрузки данных с диска вtf.data.Dataset
середина
batch_size = 32
img_height = 180
img_width = 180
"""
关于image_dataset_from_directory()的详细介绍可以参考文章:https://mtyjkh.blog.csdn.net/article/details/117018789
"""
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
data_dir,
validation_split=0.2,
subset="training",
seed=123,
image_size=(img_height, img_width),
batch_size=batch_size)
Found 3670 files belonging to 5 classes.
Using 2936 files for training.
"""
关于image_dataset_from_directory()的详细介绍可以参考文章:https://mtyjkh.blog.csdn.net/article/details/117018789
"""
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
data_dir,
validation_split=0.2,
subset="validation",
seed=123,
image_size=(img_height, img_width),
batch_size=batch_size)
Found 3670 files belonging to 5 classes.
Using 734 files for validation.
Мы можем вывести метки набора данных через class_names. Метки будут соответствовать в алфавитном порядке именам каталогов.
class_names = train_ds.class_names
print(class_names)
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']
2. Визуализируйте данные
plt.figure(figsize=(20, 10))
for images, labels in train_ds.take(1):
for i in range(20):
ax = plt.subplot(5, 10, i + 1)
plt.imshow(images[i].numpy().astype("uint8"))
plt.title(class_names[labels[i]])
plt.axis("off")
3. Проверьте данные еще раз
for image_batch, labels_batch in train_ds:
print(image_batch.shape)
print(labels_batch.shape)
break
(32, 180, 180, 3)
(32,)
-
Image_batch
является тензором формы (32, 180, 180, 3). Это пакет из 32 изображений размером 180x180x3 (последний размер относится к цветовому каналу RGB). -
Label_batch
— тензор формы (32,), эти метки соответствуют 32 изображениям
4. Настройте набор данных
- shuffle(): скремблировать данные Подробное описание этой функции см. в:zhuanlan.zhihu.com/p/42417456
- prefetch(): Предварительная выборка данных, ускорение работы
prefetch()
Детали функции: Когда ЦП готовит данные, ускоритель находится в состоянии ожидания. Вместо этого ЦП простаивает, пока ускоритель обучает модель. Следовательно, время, необходимое для обучения, равно сумме времени предварительной обработки ЦП и времени обучения ускорителя.prefetch()
Перекрывайте предварительную обработку шага обучения и процесса выполнения модели. Пока ускоритель выполняет N-й шаг обучения, ЦП подготавливает данные для N+1-го шага. Это не только минимизирует время этапа обучения (а не общее время), но также сокращает время, необходимое для приема и преобразования данных. если не использоватьprefetch()
, CPU и GPU/TPU большую часть времени бездействуют:использовать
prefetch()
Значительно сокращает время простоя:
- cache(): кэшируйте набор данных в память, чтобы ускорить операцию.
AUTOTUNE = tf.data.AUTOTUNE
train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)
3. Построение сети CNN
Входные данные для сверточной нейронной сети (CNN) находятся в форме тензора.(image_height, image_width, color_channels)
, который содержит информацию о высоте, ширине и цвете изображения. Ввод не требуетсяbatch size
. color_channels — это (R, G, B), соответствующие трем цветовым каналам RGB соответственно. В этом примере наш ввод CNN, изображение из набора данных fashion_mnist, имеет форму(28, 28, 1)
то есть изображение в градациях серого. Нам нужно присвоить форму параметру при объявлении первого слояinput_shape
.
num_classes = 5
"""
关于卷积核的计算不懂的可以参考文章:https://blog.csdn.net/qq_38251616/article/details/114278995
"""
model = models.Sequential([
layers.experimental.preprocessing.Rescaling(1./255, input_shape=(img_height, img_width, 3)),
layers.Conv2D(16, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)), # 卷积层1,卷积核3*3
layers.MaxPooling2D((2, 2)), # 池化层1,2*2采样
layers.Conv2D(32, (3, 3), activation='relu'), # 卷积层2,卷积核3*3
layers.MaxPooling2D((2, 2)), # 池化层2,2*2采样
layers.Conv2D(64, (3, 3), activation='relu'), # 卷积层3,卷积核3*3
layers.Flatten(), # Flatten层,连接卷积层与全连接层
layers.Dense(128, activation='relu'), # 全连接层,特征进一步提取
layers.Dense(num_classes) # 输出层,输出预期结果
])
model.summary() # 打印网络结构
Model: "sequential_1"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
rescaling_1 (Rescaling) (None, 180, 180, 3) 0
_________________________________________________________________
conv2d_3 (Conv2D) (None, 178, 178, 16) 448
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 89, 89, 16) 0
_________________________________________________________________
conv2d_4 (Conv2D) (None, 87, 87, 32) 4640
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 43, 43, 32) 0
_________________________________________________________________
conv2d_5 (Conv2D) (None, 41, 41, 64) 18496
_________________________________________________________________
flatten_1 (Flatten) (None, 107584) 0
_________________________________________________________________
dense_2 (Dense) (None, 128) 13770880
_________________________________________________________________
dense_3 (Dense) (None, 5) 645
=================================================================
Total params: 13,795,109
Trainable params: 13,795,109
Non-trainable params: 0
_________________________________________________________________
В-четвертых, компилировать
Прежде чем модель будет готова к обучению, необходимо выполнить еще несколько настроек. На этапе компиляции модели было добавлено следующее:
- Функция потерь (loss): используется для измерения точности модели во время обучения.
- Оптимизатор: определяет, как модель обновляется на основе данных, которые она видит, и собственной функции потерь.
- Метрики: используются для отслеживания этапов обучения и тестирования. В следующих примерах используется точность, которая представляет собой соотношение правильно классифицированных изображений.
model.compile(optimizer='adam',
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=['accuracy'])
5. Обучение модели
history = model.fit(
train_ds,
validation_data=val_ds,
epochs=10
)
Epoch 1/10
92/92 [==============================] - 9s 29ms/step - loss: 1.7851 - accuracy: 0.3435 - val_loss: 1.0564 - val_accuracy: 0.5640
Epoch 2/10
92/92 [==============================] - 1s 11ms/step - loss: 1.0037 - accuracy: 0.5867 - val_loss: 1.0490 - val_accuracy: 0.5708
Epoch 3/10
92/92 [==============================] - 1s 11ms/step - loss: 0.8206 - accuracy: 0.6746 - val_loss: 0.9763 - val_accuracy: 0.6158
Epoch 4/10
92/92 [==============================] - 1s 12ms/step - loss: 0.6061 - accuracy: 0.7864 - val_loss: 0.9745 - val_accuracy: 0.6158
Epoch 5/10
92/92 [==============================] - 1s 12ms/step - loss: 0.3319 - accuracy: 0.8929 - val_loss: 1.2550 - val_accuracy: 0.6076
Epoch 6/10
92/92 [==============================] - 1s 11ms/step - loss: 0.1607 - accuracy: 0.9473 - val_loss: 1.4897 - val_accuracy: 0.6172
Epoch 7/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0864 - accuracy: 0.9757 - val_loss: 1.5388 - val_accuracy: 0.6226
Epoch 8/10
92/92 [==============================] - 1s 12ms/step - loss: 0.0621 - accuracy: 0.9818 - val_loss: 2.0122 - val_accuracy: 0.6008
Epoch 9/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0390 - accuracy: 0.9893 - val_loss: 1.9353 - val_accuracy: 0.6267
Epoch 10/10
92/92 [==============================] - 1s 11ms/step - loss: 0.0061 - accuracy: 0.9995 - val_loss: 2.1597 - val_accuracy: 0.6335
6. Оценка модели
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0.5, 1])
plt.legend(loc='lower right')
plt.show()
test_loss, test_acc = model.evaluate(val_ds, verbose=2)
23/23 - 0s - loss: 2.1597 - accuracy: 0.6335
Из вышеизложенного видно, что по мере увеличения количества итераций разрыв между точностью обучения и точностью проверки постепенно увеличивается.Это связано с переоснащением.Пожалуйста, обратитесь к моей следующей статье для решения.
print("验证准确率为:",test_acc)
验证准确率为: 0.6335150003433228
? Из рубрики:【100 случаев глубокого обучения】