Как глубокое обучение использует данные для прогнозирования инвестиций?

В предыдущей статье "Приведет ли появление глубокого обучения к новому витку технологической революции по сравнению с традиционными количественными методами инвестирования?«В середине мы говорили об использовании методов глубокого обучения и можем судить о доходности будущих акций по некоторым фундаментальным характеристикам компании, а модель глубокого обучения предоставляет средства для исправления важных отношений. Сегодня мы специально поговорим о глубоком обучении, как решить эту проблему.

【Выберите цель глубокого обучения для прогнозирования будущего】

Во-первых, мы должны установить дискриминационную цель для системы машинного обучения. Когда инвестор решает, стоит ли инвестировать в акции, в первую очередь инвестора беспокоит будущее компании. Инвесторы покупают будущие результаты компании, но будущее неизвестно, поэтому вопрос, который мы должны решить, заключается в том, можем ли мы использовать существующие данные для прогнозирования будущего. Конечно, мы должны ответить на очень ключевой вопрос, а именно, способны ли данные в наших руках и наши существующие методы обработки данных предсказывать будущее. Если полученные данные не связаны внутренне с будущим компании, даже самые лучшие методы обработки данных не смогут найти взаимосвязь, которой изначально не существует.

Применяя новые технологические инструменты для инвестирования, люди в первую очередь думают о краткосрочной торговле: например, после выхода новостей о компании система машинного обучения может за несколько миллисекунд интерпретировать, хорошие новости или плохие. транзакция завершается в течение одной секунды, по сравнению с ручным управлением, чтение статьи вручную занимает несколько минут, а ручная транзакция занимает еще несколько минут.Очевидно, что в период высокочастотной торговли люди ушли с арены конкуренции с машинами, а машины имеют безусловные преимущества. С другой стороны, есть хорошие статистические данные, доказывающие, что в долгосрочной перспективе долгосрочная тенденция стоимости акций компании в значительной степени связана с ее развивающимися фундаментальными показателями. Можно сказать, что сила фундаментальных показателей компании является основным фактором, определяющим долгосрочный тренд стоимости акций компании. Нобелевский лауреат Роберт Шиллер и бог акций Баффет оба считают, что цены на фондовом рынке сильно колеблются в краткосрочной перспективе и имеют низкую предсказуемость, в то время как долгосрочная тенденция стоимости акций тесно связана с ее фундаментальными факторами и имеет высокую предсказуемость.

Во-вторых, мы должны выбрать цель предсказания. В этом реальном примере мы используем глубокую нейронную сеть, чтобы предсказать, будут ли акции работать выше или ниже медианы рынка в течение одного года. Прогнозирование динамики акций на предстоящий год является долгосрочной инвестиционной целью для многих инвесторов, и в то же время мы располагаем достаточным объемом данных, чтобы извлечь уроки из этого периода времени.

В 1962 году некоторые базы данных начали содержать высококачественные данные об основных принципах деятельности компаний, и к настоящему времени они содержат данные примерно за 55 лет. Если бы мы пытались предсказать поведение акций за пятилетний период, наш процесс обучения имел бы только 11 отдельных периодов времени, что, вероятно, недостаточно для обучения системы машинного обучения; если бы наш период времени составлял один месяц, у нас было бы 660 независимых периодов времени. Хотя для машинного обучения полезно больше периодов времени, экзогенные факторы с большей вероятностью будут доминировать в движении цен акций на месячном временном интервале, а фундаментальные данные, вероятно, не будут доминирующим фактором, поэтому мы считаем, что в это время месяца Основы акций Duan не обязательно могут предсказать цены акций. Таким образом, мы решили предсказать поведение цены акций в следующем году; Период в один год является подходящим компромиссом между более длительным периодом (5 лет) и более коротким периодом (1 месяц).

【Выберите набор инструментов для глубокого обучения】

Методы машинного обучения часто могут быть реализованы на таких языках программирования, как Python, R, C++ и т. д. Конечно, более крупные компании могут предпочесть собственную разработку, но для большинства пользователей сторонние пакеты могут использоваться бесплатно, если они присоединяются к сообществу разработчиков. В последние годы количество пакетов машинного обучения значительно увеличилось, и пользователи могут быстро приступить к разработке проекта, просто выбрав соответствующий пакет с открытым исходным кодом.

На рисунке выше перечислены наиболее распространенные пакеты машинного обучения с открытым исходным кодом, доступные сегодня. Машинное обучение имеет сотни часто используемых алгоритмов, которые можно сгруппировать в разные типы в зависимости от того, как они работают. Например, алгоритм регрессии (Regression) используется для моделирования взаимосвязи между переменными; алгоритм дерева решений (Decision Tree) строит модели решений и используется для решения таких задач, как классификация или регрессия. Поскольку наши входные данные представляют собой временные ряды, наиболее часто используемым пакетом R является подключаемый модуль «rnn», который можно загрузить из Интернета. В этом практическом случае нашей моделью прогнозирования является рекуррентная нейронная сеть RNN.

【Первоначальная настройка решения для глубокого обучения】

В этой настройке мы передаем данные в нашу модель с интервалом в один месяц. Это означает, что на каждом временном шаге (месяце) модель сопоставляет существующие данные с 12 временными шагами (один год) будущих цен на акции с целью прогнозирования того, что произойдет с ценами на акции в течение одного года. Мы используем следующий рисунок, чтобы проиллюстрировать процесс этой установки.Фундаментальные данные компании используются в качестве входных данных, и через сеть RNN производится прогноз эффективности акций в следующие 12 месяцев, и прогнозируемый результат сравнивается с фактическая производительность запаса через 12 месяцев.

Во-первых, нам нужно построить входную последовательность, которая представляет эволюцию основных показателей компании с течением времени, причем каждый элемент в последовательности представляет собой комбинацию данных компании/месяца (назовем ее элемент данных "компания-месяц"). Кроме того, каждый элемент данных «компания-месяц» также соответствует целевому результату, который представляет собой динамику цены акций компании в момент времени следующего года. В этом случае в каждый момент времени мы рассчитываем годовую доходность всех акций, а затем вычисляем медианную доходность, если годовая доходность цены акции больше, чем медиана годовой доходности всех акций, то мы will Его целевому выходному результату присваивается +1. И наоборот, если годовая доходность цены акции меньше средней годовой доходности всех акций, то мы присваиваем ее целевому выпуску -1. Таким образом, мы можем видеть соответствующие столбцы данных ввода/вывода, как показано на рисунке ниже.

В приведенной выше таблице данных каждая строка представляет момент времени в исторической последовательности развития компании, а входные данные соответствуют целевым выходным данным для облегчения обучения модели. Используя машинное обучение, преобразуйте трудночитаемый финансовый отчет компании в вероятность того, что акции вернутся в категорию +1 (превзойдя средний показатель) в течение следующего года. Эта простая и понятная интерпретация, хотя и небольшая цель для машинного обучения, может оказать огромную помощь инвесторам при принятии инвестиционных решений. В качестве альтернативы инвесторы могут использовать эту интерпретацию в качестве отправной точки для продолжения построения других, более совершенных портфелей.

На приведенном выше рисунке фундаментальные данные в момент времени «t» являются входными данными, а фактический вывод модели — это вероятность того, что результат в момент времени «t + 12» относится к категории +1. Эта вероятность будет сравниваться с известной целью обучения. Здесь «+1» означает, что компания превзошла медианную производительность всех акций от «t» до «t+12», а «-1» означает, что компания превзошла медианную производительность. всех акций от "t" до "t+12" Доходность за период была ниже средней доходности всех акций.

[Скрининг целей системы глубокого обучения]

Поскольку в базе данных содержится много целевых акций, мы должны сузить данные, чтобы выбрать подходящие компании, в которые мы заинтересованы инвестировать: 1) Рыночная капитализация компании составляет не менее 100 миллионов долларов США; 2) Штаб-квартира компании находится в США. 3) Компания Акции должны быть зарегистрированы на Нью-Йоркской фондовой бирже, Nasdaq или Американской фондовой бирже 4) За исключением компаний финансовой отрасли. Этот вид целевого скрининга сделает результаты, которые мы получаем, более практичными на практике.

Причина, по которой мы исключаем финансовые фирмы, заключается в том, что это обычная практика в экономике и количественных финансовых исследованиях. Использование особо высокого коэффициента левериджа в балансе финансовых компаний является общим методом работы финансовых компаний, и его значение существенно отличается от использования левериджа реальными компаниями. Финансовые компании также называют виртуальными компаниями в Соединенных Штатах, и для интерпретации финансовой отчетности таких компаний требуется независимая RNN. Итак, мы отделяем финансовые компании от обычных компаний, и в этом случае RNN, которую мы обучаем, применима только к обычным компаниям.

Согласно данным, отобранным по вышеуказанным правилам фильтрации, каждый месяц у нас будет от 1300 до 5000 компаний с соответствующими данными.

【Предварительная обработка и нормализация данных】

Очевидно, что если мы будем передавать данные из финансовой отчетности компании непосредственно в нейронную сеть с глубоким обучением, сеть RNN может быть не в состоянии легко переваривать данные; как говорится, вход — это мусор, а вывод — мусор. Следовательно, мы должны предварительно обработать и нормализовать входные данные, чтобы машинному обучению было легко переварить входные данные и предотвратить запоминание модели общего профиля компании во время обучения. База данных S&P Compustat включает следующие единицы данных.

Опыт обучения сети РНС показывает, что по техническим причинам, если данные возбуждения входных нейронов имеют лучшее распределение и ограничены нормативным диапазоном данных, то эффект обучения нейронной сети будет лучше. Мы должны нормализовать фундаментальные данные компании, чтобы удалить конкретную идентичность компании и сохранить относительные пропорции фундаментальных ценностей компании. В то же время нейронная сеть по-прежнему способна внутренне комбинировать произвольные отношения по мере необходимости, включая нелинейные отношения между данными.

Мы преобразуем поля исходных данных в нейронные входные переменные с финансовыми свойствами и интуитивно понятным значением с помощью ряда шагов предварительной обработки. Мы разделяем следующие пять типов входных характеристик: 1) импульсные характеристики цен акций, 2) характеристики стоимости акций, 3) нормализованные фундаментальные характеристики компании, 4) годовые изменения фундаментальных характеристик и 5) индикатор отсутствующей стоимости. Особенности.

▲ Нормализация импульсных характеристик цен акций
Поскольку мы пытаемся предсказать относительную будущую доходность акций, вполне возможно, что относительная доходность акций за разные периоды времени в прошлом будет иметь некоторое влияние на будущее. Для этого в определенный момент времени мы рассчитываем доходность акций за последние 1, 3, 6 и 9 месяцев. Вместо того, чтобы передавать исторические параметры возврата непосредственно в RNN, мы нормализуем эти параметры.
▲ Нормирование стоимостных характеристик акций
Поскольку мы пытаемся предсказать относительную будущую доходность акций, вполне возможно, что текущая относительная стоимость акций будет иметь некоторое влияние в будущем. С этой целью мы устанавливаем два входных нейрона значения, представляющих два очень общих индикатора значения, Одним из них является отношение балансовой стоимости к рыночной стоимости, а другим — отношение выручки к рыночной стоимости (обратное отношение цены к прибыли).

Конкретный расчет выглядит следующим образом:
1) Отношение балансовой стоимости к рыночной стоимости = балансовая стоимость собственного капитала / рыночная стоимость
2) Урожай = Операционный доход / Предприятие предприятия.

Конечно, наш ввод в RNN напрямую не вводит вычисленные выше значения.Наш ввод в RNN по-прежнему является значением после нормализации.Метод нормализации по-прежнему заключается в сортировке того же набора данных и нормализации данных от 0 до 100, 100 — самый высокий коэффициент.

▲Годовые темпы роста основных характеристик компании
Что касается самих фундаментальных данных, мы не можем напрямую передавать данные в сеть RNN. Мы должны нормализовать фундаментальные данные. Нормализация фундаментальных данных заключается в том, чтобы сначала вычислить стандартное отклонение того же набора данных, а затем разделить данные этого набора на соответствующее стандартное отклонение. В дополнение к вводу вышеуказанных фундаментальных характеристик мы также вводим характеристики изменения этих фундаментальных характеристик для RNN.Для многих неотрицательных переменных в финансовом отчете мы используем следующую формулу для расчета изменения: log[v(t )/v(t-1)]. Использование «логарифма» переменной является наиболее распространенным подходом в финансовой инженерии, поэтому даже при очень большом изменении исходной переменной после логарифмирования переменной соответствующее изменение останется умеренным. Мягкий ввод не будет Сеть RNN вызывает необычные эффекты. «t-1» представляет значение переменной год назад, и использование логарифмического метода для расчета доходности или темпов роста намного лучше, чем расчет в процентах. Сама логарифмическая скорость изменения хорошо распределена и не требует дальнейшей нормализации.

▲Характеристики индикатора отсутствия данных
В практике машинного обучения важным вопросом, который необходимо решить, является отсутствие определенных значений данных. Причин отсутствия значений в данных много: например, элементы данных были опущены из отчета, изменение метода отчетности, неправильный сбор данных или деление на ноль при расчете коэффициентов и т.д.

На практике применения РНС очень успешным оказался один метод обработки. Этот метод заключается в присоединении соответствующего индексного нейрона к каждому входному нейрону: если значение нейрона в определенный момент времени отсутствует, то его индексному нейрону присваивается значение 1, В противном случае индикаторный нейрон равен 0.
Для каждой комбинации компания-месяц мы извлекли приблизительно 20 фундаментальных необработанных данных из базы данных Compustat, из которых мы получили: 1) четыре данных импульсной характеристики; 2) две характеристики относительной стоимости; 3) 20 исходных данных; данные об изменении года для 20 исходных данных; 5) для каждых входных данных добавляются данные двоичного индикатора, чтобы указать, отсутствует ли значение входных данных в наборе данных за месяц компании. Согласно этому методу, сеть RNN имеет в общей сложности более 90 входных нейронов.

Глубокое обучение и рекуррентные нейронные сети достигли сверхчеловеческой производительности во многих областях.В области финансов схемы обработки глубокого обучения для финансовых временных рядов добились больших успехов в последние годы, а рекуррентные нейронные сети добавили совершенно новые возможности в набор инструментов финансового анализа. В то же время он предоставляет нам метод, отличный от ручного поиска эффективных факторов в классической «факторной инженерии», так что компьютерные алгоритмы могут автоматически обнаруживать новые функции с предсказательной способностью на основе исходных данных финансовой отчетности компании. Что еще более важно, он совершил прорыв в области обработки текста (NLP), позволив людям спокойно справляться с пришедшим взрывом данных и информации. Мы считаем, что революционные возможности глубокого обучения в финансовой сфере уже не за горами.

Оригинальные статьи Hang Seng Technology, перепечатка без разрешения запрещена. Подробнее см. (нажмите)Уведомление о перепечатке.