Генеративно-состязательные сети в действии [1]: введение

искусственный интеллект алгоритм Microsoft робот

введение

В марте 2016 года родилась AlphaGO, победившая лучших профессиональных шахматистов и взорвавшая бум искусственного интеллекта. После этого AlphaGO Master и AlphaGO Zero безжалостно раздавили шахматистов-людей, и люди, наконец, поняли, что люди встретили страшного противника. До этого у людей еще была небольшая иллюзия, что некий герой появится, как того требует время, и будет сражаться за людей, но реальность была жестокой. Самая пугающая часть искусственного интеллекта заключается в том, что его развитие происходит быстро, и после преодоления узкого места он вызовет расщепление.

Появление искусственного интеллекта также в целом вызвало страх у людей. Например, знаменитый «Железный человек» основатель Tesla Маск прямо сказал: «ИИ станет самым большим риском для человеческой цивилизации". А обычных людей больше волнует, что искусственный интеллект заменит людей, и каждый год будет"10 профессий, которые заменит ИИ, и 10 профессий, которые не заменит"Такая тема.

При обсуждении человеческих профессий, которые нельзя заменить искусственным интеллектом, обычно соглашаются с тем, что творческие профессии не будут заменены искусственным интеллектом, например, писатели, художники и художники. Однако так ли это на самом деле? Посмотрите на набор сообщений.

22 марта 2016 года издание Kyodo News сообщило, что роман «День, когда робот пишет роман», созданный с помощью искусственного интеллекта, вошел в шорт-лист предварительного рассмотрения третьей японской «Литературной премии Хоши Шиничи». Премия названа в честь писателя-фантаста Шиничи Хоши, известного как «отец японской микрофантастики». Представление романа представляет команда «Я писатель своенравного искусственного интеллекта» (далее именуемая «Я писатель»). Руководителем проектной группы является Хитоси Мацубара, профессор государственного университета Хакодате Мирай.

Источник: «Колонка», выпуск 1, 2017 г., «Коммуникация Китайской компьютерной федерации».

По данным Gigazine, исследовательская группа NVIDIA разрабатывает автоматический генератор «портретов знаменитостей», который позволяет ИИ изучать большое количество изображений через GAN. Чтобы обеспечить постепенный рост как сети генератора, так и сети дискриминатора, разработанной в эксперименте, она предназначена для создания сначала только мозаичных изображений с низким разрешением и постепенного создания изображений с высоким разрешением по мере обучения.

Источник: Сеть обучения искусственному интеллекту.

В развлекательном шоу «Outstanding Wit» чат-бот Microsoft Xiaobing «почти победил» своего оппонента-человека с песней в китайском стиле «Peach Blossom Dream». Когда певец поет старомодное изречение «В необъятной ночи и дожде, прошлое подобно ветру, цветы персика смеются на весеннем ветру, и мы с тобой встречаемся во сне», многие зрители думают, что это сделано люди.

Источник: Синьхуанет

Пишу стихи, сочиняю, рисую, весна создания искусственного интеллекта тихо наступает...

Генеративно-состязательные сети (GAN)

В последние годы быстрое развитие искусственного интеллекта неотделимо от глубоких нейронных сетей.Основная идея глубокого обучения заключается в постоянном повышении уровня и глубины модели.Он широко используется в контролируемых областях обучения, таких как изображения классификация, распознавание речи и текста, но это далеко не творчество.

Но с появлением генеративно-состязательных сетей (GAN) все изменилось. GAN использует полуконтролируемый подход к обучению, который автоматически учится на исходных данных. Извлеките профессиональные знания из статей Википедии, а затем напишите научно-популярную статью, понятную обычным людям, подражая работам известных художников и изучая их стили для воссоздания.Похоже, это то, что могут сделать только люди.Искусственный интеллект действительно может сделать это сейчас!

Когда GAN был впервые предложен, не было непонятного математического вывода.Это можно представить как игру в кошки-мышки между фальшивомонетчиками и полицией.Фальшивомонетчики пытаются создать поддельные монеты, похожие на настоящие, а полиция пытается найти эти поддельные монеты.уровень был улучшен.

ГАН соответствует диаграмме Тайцзи в восточной философии — все вещи развиваются во взаимном росте и взаимном сдерживании. «Тай-чи рождает два инструмента», «два инструмента» подобны генераторам и дискриминаторам, генератор отвечает за порождение, дискриминатор отвечает за угасание, и между жизнью и угасанием есть все. Генератор порождает все осязаемое в изначальном хаосе, а дискриминатор отсеивает и фильтрует все осязаемое, играя роль судного дня.

Состав ГАН

Основная структура GAN показана на следующем рисунке:

Он включает в себя генератор (Generator) и дискриминатор (Discriminator) из двух частей. Среди них генератор принимает случайный шум в качестве входных данных и пытается сгенерировать выборочные данные. Дискриминатор принимает реальные или сгенерированные данные в качестве входных данных и пытается предсказать, являются ли текущие входные данные реальными или сгенерированными данными. Генератор и дискриминатор - пара "врагов": генератор создает выборки, чтобы максимально запутать дискриминатор, в то время как дискриминатор пытается максимально идентифицировать выборки из генератора. В идеале генератор и дискриминатор в конечном итоге достигнут баланса, при котором оба будут идеальными.

Учебный процесс ГАН

При специальном обучении генератор и дискриминатор оптимизируются поочередно.

  1. При обучении дискриминатора сначала зафиксируйте генератор G, затем используйте генератор для случайного моделирования и генерации выборок G(z) в качестве отрицательных выборок и выборки из набора реальных данных для получения положительных выборок X; введите эти положительные и отрицательные выборки в дискриминатор D , потери вычисляются в соответствии с выходными данными дискриминатора (т.е. D(X) и D(G(Z))) и метками выборки; наконец, параметры дискриминатора D обновляются в соответствии с обратным распространением алгоритм.

  1. При обучении генератора сначала зафиксируйте дискриминатор D; затем используйте текущий генератор G для случайной генерации выборок G(z) и ввода их в дискриминатор D; в соответствии с выходными данными дискриминатора D(G(Z)) и метками выборок для вычисления потери и, наконец, использовать алгоритм обратного распространения для обновления параметров генератора G.

резюме

В принципе, GAN относительно легко понять.На самом деле, GAN все еще имеет математическую теоретическую основу, но считается, что ее трудно понять людям без определенной математической основы. С инженерной точки зрения, я все же хочу обсудить его реализацию и применение в реальности.

В последующих статьях я начну с простейшей генерации рукописных цифр и рассмотрю применение GAN, которое, как ожидается, будет включать следующее:

  • Использование DCGAN (глубоких сверточных генеративно-состязательных сетей) для оптимизации генерации рукописных цифр.
  • Генерация изображений с использованием SSGAN (Semi-Supervised Learning Generative Adversarial Networks)
  • Генерация модных гардеробов с использованием CGAN (условно-генеративно-состязательных сетей)
  • Передача стиля изображения с использованием CycleGAN (Cyclic Consistent Generation Network)
  • Создавайте фотореалистичные изображения из текста

Мои математические способности ограничены, поэтому я в основном сосредотачиваюсь на примерах кода, не слишком углубляясь в теорию, так что следите за обновлениями.

image