Введение
Фальшивые новости могут использовать мультимедийный контент, чтобы вводить читателей в заблуждение и распространять информацию, негативно влиять на публичные события и даже манипулировать ими.Как идентифицировать возникающие события как фейковые новости в социальных сетях — это новая и уникальная задача. В этой статье предлагается комплексная структура под названием Event Adversarial Neural Network (EANN) для обнаружения поддельных новостей на основе мультимодальных функций. Вдохновленный состязательными сетями, EANN включает дискриминаторы событий на этапе обучения для прогнозирования вспомогательных меток событий, а соответствующие потери можно использовать для оценки несхожести представлений признаков между разными событиями.
EANN состоит из трех основных частей: мультимодального экстрактора признаков, детектора фейковых новостей и дискриминатора событий. Средство извлечения мультимодальных признаков взаимодействует с детектором фальшивых новостей для выполнения основной задачи распознавания фейковых новостей, в то время как средство извлечения мультимодальных признаков пытается обмануть средство распознавания событий, чтобы изучить инвариантные представления событий. Автоматическое извлечение признаков из текстового и визуального контента статей с использованием сверточных нейронных сетей (CNN).
содержание исследования
Обзор модели
Целью модели является изучение переносимых и различимых представлений признаков для обнаружения фальшивых новостей.Для достижения этого модель EANN объединяет три основных компонента: мультимодальный экстрактор признаков, детектор фальшивых новостей и дискриминатор событий, как показано на рисунке 1. :
- Поскольку сообщения в социальных сетях часто содержат различные формы информации (например, текстовые сообщения и прикрепленные изображения), мультимодальные экстракторы признаков (включая экстракторы текстовых и визуальных признаков) используются для обработки различных типов входных данных.
- После изучения текстовых и визуальных представлений скрытых признаков они объединяются вместе, чтобы сформировать окончательное представление многомодальных признаков, и как детектор фальшивых новостей, так и распознаватель событий строятся поверх средства извлечения многомодальных признаков.
- Детектор фейковых новостей принимает в качестве входных данных представление изученной функции и предсказывает подлинность публикации. Распознаватель событий идентифицирует тег события каждого сообщения на основе этого скрытого представления.
Мультимодальный экстрактор признаков
Извлечение текстовых признаков
Входными данными экстрактора текстовых признаков является последовательный список слов в статье, а сверточные нейронные сети (CNN) используются в качестве основного модуля экстрактора текстовых признаков.
Как показано на рис. 1, модифицированная модель CNN под названием Text-CNN, архитектура которой показана на рис. 2, использует несколько фильтров с окнами разного размера для захвата признаков с разной степенью детализации для выявления поддельных новостей.
Конкретные шаги экстрактора текстовых признаков заключаются в представлении каждого слова в тексте в виде вектора встраивания слова. первое в предложениисоответствует словуВектор встраивания размерного слова может быть выражен как:, так что один содержитСловосочетание может быть выражено следующим образом:
Представляет операцию конкатенации векторов. Размер окнаФильтр свертки преобразует последовательные предложения в предложениепоследовательность слов в качестве ввода и вывода функции дляпоследовательные слова, начинающиеся сВозьмем в качестве примера последовательность слов, операция фильтрации может быть выражена как:
в,функция активации ReLU,Представляет вес фильтра. Примените операцию ко всем словам предложения, чтобы получить вектор признаков этого предложения:
заИспользуйте операцию max pooling, чтобы получить максимальное значение, тем самым извлекая наиболее важную информацию.
Для извлечения текстовых признаков разной степени детализации применяются окна разных размеров. Для определенного размера окна естьразные фильтры. Предположим, естьвозможные размеры окон, всегофильтр. Текстовые функции, полученные после операции максимального объединения, могут быть выражены как, и, наконец, полносвязный слой используется для получения окончательного представления текстовых функций (спредставление), а текстовый элемент и представление визуального элемента имеют одинаковую размерность (обозначается как):
— весовая матрица полносвязного слоя.
Извлечение визуальных признаков
Образец входного изображения экстрактора визуальных признаков обозначается как, предварительно обработанный VGG19 используется для извлечения визуальных признаков.На последнем слое сети VGG19 добавляется полносвязный слой для настройки размера окончательного представления визуальных признаков до. определениеРазмерные визуальные признаки выражаются как, операция последнего слоя в экстракторе визуальных признаков может быть выражена как:
представляет собой представление визуального признака, полученное из предварительно обученного VGG19,— вес полносвязного слоя в экстракторе визуальных признаков.
текстовые функциии визуальные особенностибудут объединены в мультимодальное представление объекта, записанное как:
Определите экстрактор мультимодальных признаков как,представляет собой набор текстовых и визуальных образцов сообщений, является входом для экстрактора мультимодальных функций ипредставляет параметр обучения.
детектор фейковых новостей
Детектор поддельных новостей развертывает полносвязный слой с использованием softmax для прогнозирования подлинности содержимого сообщения, чьи входные данные являются выходными данными мультимодального экстрактора признаков.. Определите детектор поддельных новостей как:,Указывает все параметры. Включаем детекторы фейковых новостейРезультат предсказания поста определяется как, то вероятность того, что пост является фейковой новостью, равна:
использоватьПредставляет набор образцовых меток и использует кросс-энтропию для расчета потерь при прогнозировании:
Найдя оптимальные параметрыминимизировать функцию потерь.
Основная проблема в обнаружении фальшивых новостей связана с событиями, не охваченными обучающим набором данных, что требует от учащегося способности учитьсяПереносимые функции представления возникающих событий. Однако прямая минимизация потерь при обнаружении может помочь обнаружить только ложные новости о событиях, содержащихся в обучающем наборе данных, так что учащийся может получить только знания, относящиеся к конкретному событию (например, ключевые слова) или шаблоны, в то время как нам нужно позволить модели узнать больше, чем может захватитьПредставление общего свойства для общих свойств во всех событиях, это представление должно иметьинвариантность событий, и не содержит свойств, специфичных для события.
Для достижения вышеуказанной цели необходимо снять уникальность каждого события, а именно:Измеряйте непохожесть представлений объектов между разными событиями и удаляйте их, чтобы зафиксировать инвариантные к событиям представления объектов..
дискриминатор событий
Дискриминатор событий — это нейронная сеть, состоящая из двух полносвязных слоев и соответствующих функций активации, целью которых является корректная классификация постов какодно из этих событий, определяя дискриминатор событий как,представляет его параметры. Определим потерю дискриминатора событий с кросс-энтропией:
Цель дискриминатора событий — найти параметрыминимизировать функцию потерь.
Используется для оценки разницы в распределении разных событий. Большая потеря означает, что распределения, представленные разными событиями, похожи, а изученные признаки не зависят от событий. Для устранения уникальности каждого события необходимо искать параметрымаксимизировать.
Это отражаетВраждебная сеть, с одной стороны, мультимодальный экстрактор признаков пытается обмануть дискриминатор событий, чтобы максимизировать потери различения, а с другой стороны, дискриминатор событий стремится обнаружить специфичную для события информацию, содержащуюся в представлении признаков, тем самым идентифицируя событие.
интеграция модели
На этапе обучения:
- Мультимодальный экстрактор признаков:, который нужно совместить с детектором новостейчтобы свести к минимуму потери при обнаружении
- Мультимодальный экстрактор признаков:, попробуйте обмануть дискриминатор событийРазличение потерь путем максимизации событийобмануть дискриминатор событий
- дискриминатор событийНа основе мультимодального представления признаков каждое событие идентифицируется при минимальной потере идентификации события.
Подводя итог, определим окончательный проигрыш этого противостояния как:
Контроль компромисса между целевой функцией обнаружения фейковых новостей и целевой функцией распознавания событий (статья).
Для параметров оптимизации EANN пытается найти одну из конечных целевых функцийточка перевала, что возможно для оптимальной точки:
Вышеупомянутая проблема решается стохастическим градиентным спуском.
Здесь используется слой обращения градиента (GRL), который играет роль тождественной функции на прямой стадии, а градиент умножается на, а затем передать результат предыдущему слою на этапе обратного распространения. GRL можно удобно добавить между многомодальным экстрактором признаков и дискриминатором событий, как показано на обратном уровне, показанном на рисунке 1.
Чтобы стабилизировать процесс обучения, уменьшайте скорость обучения следующим образом.:
представляет собой линейное изменение, соответствующее прогрессу обучения от 0 до 1.
Подробные шаги событийно-состязательной нейронной сети (EANN) обобщены в алгоритме 1: