Медицинское изображение | Сегментация DualGAN и педиатрической эхокардиографии | MICCAI

искусственный интеллект
  • Статья перенесена из публичного аккаунта WeChat: «Алхимия машинного обучения».

  • Автор: Alchemy Brother (авторизованный)

  • Контактное лицо: WeChat cyx645016617 (приглашаем к общению и совместному прогрессу)

  • Название статьи: «Двойные сетевые генеративные состязательные сети для сегментации педиатрической эхокардиографии»

0 Подготовка

0.1 Новые слова

  • Педиатрическая детская
  • Педиатрическая эхокардиография детская эхокардиография
  • ИБС: врожденный порок сердца

0.2

1 Обзор

Для получения качественных результатов сегментации текущая клиническая сегментация педиатрической эхокардиографии в основном выполняется сонографистами вручную, что занимает много времени и сил и сильно зависит от профессионального уровня сонографистов. Для решения этих проблем в этой статье предлагается новая структура сверточной нейронной сети (CNN), называемая двойной сетью General Adversarial Network (DNGAN). DNGAN состоит из генератора и двух дискриминаторов. Генератор использует параллельную двойную сеть для извлечения дополнительных полезных функций для повышения производительности. Мы используем двойной дискриминатор, чтобы заставить генератор изучать больше пространственных признаков и более точно сегментировать левоцентрированные края.

2 заданных вопроса

在这里插入图片描述На рисунке показана сегментационная метка левого желудочка и левого предсердия сердца ребенка, можно обнаружить, что:Изменения в левом предсердии более выражены, будет нечеткость внутренней стенки., поэтому текущая четырехкамерная сегментация имеет следующие проблемы: 1) границы, возникающие из-за шума и размытия, нечеткие; (2) Размер сердца у разных людей разный; (3) Изменения предсердия и желудочка различны в каждом сердечном цикле.

3 Структура модели

在这里插入图片描述

Структура этой DNGAN показана выше: она содержит генератор и два дискриминатора.

3.1 generator

Он состоит из U-сети и FCN, параллельно извлекающих два типа признаков из входного изображения соответственно, а затем признаки умножаются на пиксели.

Карта объектов, выводимая FCN,f1f_1, карта объектов, выводимая U-net,f2f_2, то результат сегментации изображения, выдаваемый генератором, будетFG=f1×f2F_G = f_1 \times f_2.

3.2 discriminator

является шестислойной полностью сверточной сетью, а затем использует 7, 5 и 3 в качестве размера ядра свертки. За сверточным слоем следуют слой BN и слой активации LeakReLU.

Используется многомасштабная потеря L1, аналогичная сети Richer для сегментации изображений в 2014 году.

4 поражения

4.1 Потери генератора

Давайте сначала рассмотрим функцию потерь общего GAN:在这里插入图片描述В формуле:

  • х реальное изображение
  • z - случайный импорт для генератора
  • G(z) — сгенерированная маска
  • D(x) — вероятность того, что x верно.

Давайте посмотрим на функцию потерь DNGAN:在这里插入图片描述

  • N – количество образцов;
  • xnx_nДля четырехкамерной эхокардиограммы ребенка,yny_n- соответствующая основная истина;
  • lml_mЯвляется ли средняя абсолютная ошибка, то есть мы говорим L1Loss;

在这里插入图片描述Это видно,fD(x)f_D(x)- это признак, извлеченный дискриминатором, L представляет количество слоев дискриминатора, поэтомуfDi(x)f_D^i(x)Представляет карту объектов, извлеченную i-м слоем дискриминатора.

  • lcosl_{cos}Ее часто называют перекрестной энтропией;
  • lD2l_{D_2}Это функция потерь второго дискриминатора, которая также является более сложной.Давайте посмотрим.Эта функция потерь различает:Является ли ввод сгенерированной маской или реальной маской.

5 Описание данных

  • Набор данных содержит 87 эхокардиограмм детей;
  • Детский сбор от 0 до 10 лет, каждое видео содержит не менее 24 кадров и завершенный сердечный цикл;
  • Случайным образом было выбрано 67 видеороликов, в качестве обучающей выборки выбрано 1765 изображений, из оставшихся 20 видеороликов в качестве тестовой выборки выбрано 451 видео;
  • Разрешение исходной картинки 1016х708 или 636х432, а все картинки становятся 704х704 и 448х448 после обрезки по центру;

6 Резюме

1. Есть сомнения в результатах и ​​процессе этой статьи.В формуле в статье есть подозрение на символьную ошибку.在这里插入图片描述

2. В статье не приводится причина, по которой потеря второго дискриминатора использует среднее значение MSE и BCE.Я не уверен, есть ли статьи, в которых обсуждались преимущества этого раньше. Судя по результатам, улучшение, вызванное использованием структуры GAN для обучения, невелико, но в центре внимания повышения точности сегментации должно быть слияние функций и увеличение ширины сети сегментации. 3. Отправная точка статьи о применении GAN при ультразвуковом исследовании сердца у детей очень хороша, и есть надежда, что это может помочь большему количеству детей избавиться от врожденных пороков сердца.