Deep Interest | 05 Шумоподавление изображения с помощью автоэнкодера

искусственный интеллект глубокое обучение Keras
Deep Interest | 05 Шумоподавление изображения с помощью автоэнкодера

Введение

AutoEncoder — это своего рода неконтролируемая модель обучения в глубоком обучении, которая состоит из кодировщика и декодера.

  • Кодер кодирует исходное представление в представление скрытого слоя.
  • декодер декодирует представление скрытого слоя в исходное представление
  • Цель обучения — свести к минимуму ошибку реконструкции.
  • Размер объекта скрытого слоя обычно ниже, чем размер исходного объекта, и при уменьшении размера изучается более плотное и значимое представление.

Автоэнкодер — это в основном идея, кодировщик и декодер могут быть реализованы с помощью таких моделей, как полносвязные слои, CNN или RNN.

Используйте следующееKeras, используя CNN для реализации автоэнкодера, и завершите задачу шумоподавления изображения, изучив отображение зашумленного изображения в исходное изображение.

去噪效果图

Подготовить

Используемые данныеMNIST, набор данных для распознавания рукописных цифр, поставляется с Keras

В тренировочном наборе 5 Вт и в тестовом наборе 1 Вт, все они28*28изображение в градациях серого

Здесь мы используемIPythonПишите код, потому что некоторые места нужно отображать интерактивно

Запустите следующую команду в пути к проекту, чтобы начатьIPython

jupyter notebook

загрузить библиотеку

# -*- coding: utf-8 -*-

from keras.datasets import mnist
import numpy as np

Загрузите данные MNIST без соответствующих меток, нормализуйте значения пикселей от 0 до 1, измените форму наN*1*28*28Четырехмерный тензор, то есть тензор, 1 представляет цветовой канал, то есть изображение в градациях серого.

(x_train, _), (x_test, _) = mnist.load_data()
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = np.reshape(x_train, (len(x_train), 28, 28, 1))
x_test = np.reshape(x_test, (len(x_test), 28, 28, 1))

Добавьте случайный белый шум и ограничьте значение пикселя после того, как шум все еще находится в диапазоне от 0 до 1.

noise_factor = 0.5
x_train_noisy = x_train + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_train.shape) 
x_test_noisy = x_test + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_test.shape) 
x_train_noisy = np.clip(x_train_noisy, 0., 1.)
x_test_noisy = np.clip(x_test_noisy, 0., 1.)

Взгляните на эффект после добавления шума

import matplotlib.pyplot as plt
%matplotlib inline

n = 10
plt.figure(figsize=(20, 2))
for i in range(n):
    ax = plt.subplot(1, n, i + 1)
    plt.imshow(x_test_noisy[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
plt.show()

加噪后的效果

Реализация модели

Определите входные данные для модели

from keras.layers import Input, Dense, Conv2D, MaxPooling2D, UpSampling2D
from keras.models import Model, load_model

input_img = Input(shape=(28, 28, 1,))

Реализуйте часть энкодера, которая состоит из двух3*3*32Свертка и два2*2Максимальный состав пула

x = Conv2D(32, (3, 3), padding='same', activation='relu')(input_img)
x = MaxPooling2D((2, 2), padding='same')(x)
x = Conv2D(32, (3, 3), padding='same', activation='relu')(x)
encoded = MaxPooling2D((2, 2), padding='same')(x)

Реализовать часть декодера, которая состоит из двух3*3*32Свертка и два2*2Апсемплинг композиции

# 7 * 7 * 32
x = Conv2D(32, (3, 3), padding='same', activation='relu')(encoded)
x = UpSampling2D((2, 2))(x)
x = Conv2D(32, (3, 3), padding='same', activation='relu')(x)
x = UpSampling2D((2, 2))(x)
decoded = Conv2D(1, (3, 3), padding='same', activation='sigmoid')(x)

Соедините вход и выход, чтобы сформировать автоэнкодер иcompile

autoencoder = Model(input_img, decoded)
autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')

использоватьx_trainВ качестве входных и выходных данных для обучения используйтеx_testчек

autoencoder.fit(x_train_noisy, x_train,
                epochs=100,
                batch_size=128,
                shuffle=True,
                validation_data=(x_test_noisy, x_test))

autoencoder.save('autoencoder.h5')

Обучение на CPU идет относительно медленно, если есть возможность, можно использовать GPU, который в десятки раз быстрее.

Обученная модель сохраняется здесь и может быть загружена и использована позже или в другом месте.

Используйте пару автоэнкодераx_test_noisyПредскажите, нарисуйте результат предсказания и сравните его с исходным зашумленным изображением, чтобы получить эффект начального сравнения.

autoencoder = load_model('autoencoder.h5')

decoded_imgs = autoencoder.predict(x_test_noisy)

n = 10
plt.figure(figsize=(20, 4))
for i in range(n):
    # display original
    ax = plt.subplot(2, n, i + 1)
    plt.imshow(x_test_noisy[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
 
    # display reconstruction
    ax = plt.subplot(2, n, i + 1 + n)
    plt.imshow(decoded_imgs[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
plt.show()

Ссылаться на

видеоурок

Глубоко и интересно (1)