Использование машинного обучения для прогнозирования доходности акций не редкость с очень хорошими результатами, такими как«Когда эмпирическое ценообразование встречается с машинным обучением». Итак, можно ли применить тот же подход к облигациям? в 2020 годуReview of Financial StudiesВверх"Bond Risk Premiums with Machine Learning«Прогнозирование избыточной доходности облигаций с использованием методов машинного обучения. Авторы: Даниэле Бьянки из Университета королевы Марии, Лондонский университет, Маттиас Бюхнер из Уорикского университета и бизнес-школы Рутгерса. (Rutgers Business School) Андреа Тамони.
1 Дизайн исследования
1.1 Экспериментальная структура
В этой статье проводятся два эксперимента:
-
Используя данные кривой доходности (то есть годовую доходность к погашению бескупонных облигаций с погашением через 1-10 лет в текущий момент времени, всего 10), спрогнозируйте избыточную доходность облигаций с определенным сроком погашения в следующем году. (т.е. рост цены минус безрисковая ставка);
-
На основе кривой доходности используются 128 макропеременных и делается такой же прогноз. Эти макропеременные разделены на группы: реальный выпуск и доход, занятость и отработанное время, данные о розничных и производственных продажах, международная торговля, потребительские расходы, жилищное строительство, запасы и коэффициенты реализации запасов, заказы и невыполненные заказы, компенсация и труд. затраты, индексы цен, процентные ставки и спреды, фондовые индексы, валютные показатели.
Набор данных взят из (Liu and Wu, 2020) кривых доходности бескупонных облигаций. Набор данных представляет собой ежедневную периодичность, определяющую годовую доходность к погашению бескупонных облигаций со сроком погашения от 1 до 360 месяцев в каждый момент времени.
По прошлым данным85%и15% Разделите набор для обучения и набор для проверки (в порядке временного ряда), а тестовый набор — это избыточный доход на следующий год. После каждого теста обучающий набор и проверочный набор рекурсивно расширяются вперед на один месяц, и соотношение между ними остается постоянным, а длина тестового набора сохраняется равной одному году. Весь набор данных относится к периоду с 1971.08 по 2018.12 (10-летние облигации в США были выпущены с 1971.9), а первый тест начался с 1990.1. Схематическая диаграмма выглядит следующим образом:
Для каждого теста запишите прогнозируемый результат и в конце рассчитайте выход за пределы выборки.:
ввыражатьБескупонные облигации со сроком погашениявремяизбыточная норма доходности во времени,для используемого алгоритма машинного обучения.
В этой статье прогнозируются только облигации с нулевым купоном со сроком погашения 2, 3, 4, 5, 7 и 10 лет, а также используются эти шесть облигаций для построения портфеля с равным весом и прогнозируется доходность портфеля..
Проверяемая нулевая гипотеза, используя статистику Clark and West (2007) с поправкой на MSPE.
1.2 Алгоритмы машинного обучения
Вот краткое введение в алгоритм машинного обучения, используемый в этой статье. Сначала используются регрессия главных компонент и частичные наименьшие квадраты, а затем используются несколько методов регрессии со штрафными условиями, а именно регрессия LASSO, гребневая регрессия и эластичная сеть. Кроме того, в работе также используется расширение дерева регрессии — дерево с градиентным усилением (Gradient boosted tree), случайный лес и дерево пределов, как показано ниже:
Наконец, в статье используются несколько различных архитектур нейронных сетей. Когда для прогнозирования используются только данные кривой доходности, используется классическая структура нейронной сети с прямой связью, как показано на следующем рисунке:
При использовании как данных кривой доходности, так и макроданных для прогнозирования в этом документе проектируются 3 различные сетевые структуры, как показано ниже:
Первый заключается в подключении данных процентной ставки непосредственно к выходному слою, минуя скрытый слой (называемый гибридной сетью), второй — в объединении двух сетей (сети процентной ставки и сети макропеременных), а третий заключается в объединении двух сетей во второй групповой ансамбль макропеременных (называемый групповым ансамблем) на этой основе.
2 Экспериментальные результаты
2.1 Использование только прогнозов кривой доходности
Результаты эксперимента представлены на рисунке:
На панели А главный компонент PC кривой доходности берется первым, соответственно 3, 5 и 10. Когда используются 10 главных компонентов, это эксперимент Cochrane and Piazzesi (2005). результатОба отрицательны, и эффект тем хуже, чем больше ПК.После добавления квадрата нелинейного члена ПК результаты оказываются хуже. Переход на PLS также не улучшил производительность.
Панель B, гребневая регрессияявляется отрицательным, в то время как модели с разреженностью (регрессия LASSO, эластичные сети) предсказывают облигации со сроком погашения более 4 лет.является положительным и предсказывает комбинированныйТоже положительный.
На панели C дерево пределов работает лучше всего среди ряда древовидных моделей, вероятно, из-за рандомизированного расположения разделов функций. Для нейронной сети поверхностная сеть (1 скрытый слой, 3 узла) работает так же хорошо, как и глубокая сеть (2 скрытых слоя, 7 узлов), а углубление сети ухудшит результаты; Кокрейн и Пьяццези (2005) указали. из того, что форвардные курсы с лагом 1-11 периодов содержат информацию об избыточных доходах, которых нет в форвардных курсах, и бумага будет отставать от 1-11 форвардных курсов и 10 форвардных процентных ставок помещается в сеть с 7 узлами в одном скрытом слое , и по сравнению с мелкой сетью обнаруживается, что эффект не улучшился.Поэтому запаздывающая кривая доходности не может помочь текущей кривой доходности улучшить ее прогностическую способность.
2.2 Прогнозирование с использованием кривой доходности и макроданных одновременно
Результат выглядит следующим образом:
На панелях A и B, чтобы их можно было сравнить с Ludvigson and Ng (2009), вторая строка состоит в том, чтобы извлечь первые 8 основных компонентов из макропеременных, а затем взять их подмножество в соответствии с его настройкой, а возврат скорость В некоторых данных (строки 4, 5 и 6) используется коэффициент CP (линейная комбинация форвардных ставок), полученный Cochrane and Piazzesi (2005). Было обнаружено, что плотные модели, такие как гребневая регрессия или сжатие данных, плохо работали вне выборок, в то время как разреженные модели работали лучше и значительно улучшились по сравнению с экспериментальными результатами в 2.1, что указывает на то, что добавление макропеременных полезно для прогнозирования.
Панель C является результатом 3 видов сетей.Среди них эффект гибридной сети является выдающимся, и увеличение глубины может повысить ее точность.Если для выбора структуры сети используются предварительные знания экономики, это значительно повлияет эффект предсказания Интегрированная сеть с 1-слойной группировкой Так же хороша, как гибридная сеть с 3-мя слоями, и лучше в облигациях со сроком погашения в 7 и 10 лет. Кроме того, эффект от добавления макропеременных в несколько моделей деревьев также лучше, а дерево пределов относительно лучше.
3 Анатомия предсказуемости
Различается ли предсказуемость во время подъемов и спадов?? Используйте индикатор рецессии NBER, чтобы разделить период роста и период рецессии, и рассчитать вне выборки отдельно, результат следующий:
Извлеките главный компонент PC из кривой доходности, и первые три главных компонента представляютУровень кривой доходности,склон,кривизна, вы можете использовать регрессиюПроверьте, могут ли скрытые факторы, извлеченные нейронной сетью, предсказывать изменения первых трех основных компонентов.:
вСкрытый фактор, извлеченный для нейронной сети, то есть выход скрытого слоя. Результаты следующие (в первой строке не добавляются неявные факторы для справки):
Какие переменные важны? Частичный дифференциал прогнозируемого значения относительно переменной может быть рассчитан:
После взятия абсолютного значения для всехВозьмите среднее значение, чтобы получить важность переменной. Если усреднить важность каждой группы макропеременных, можно получить важность каждой группы.
На рисунках (а) и (б) ниже показано значение каждой переменной при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно. (c) и (d) — важность каждой группы после группировки при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно.
Приведенные выше результаты показывают, что нелинейность важна, но нелинейность, которая может улучшить производительность, возникает из-заМежду группамивзаимодействие илисвзаимодействие? Дифференциал второго порядка между группами можно получить отдельно для полносвязной сети и сети, интегрированной в группу:
Результат выглядит следующим образом:
Панель A показывает, что межгрупповое взаимодействие велико в полностью связанной сети, а панель B показывает, что внутригрупповое взаимодействие одинаково в двух нейронных сетях. Следовательно, превосходная производительность нейронной сети сгруппированного ансамбля обусловлена тем, что она запрещает межгрупповые взаимодействия и разрешает внутригрупповые взаимодействия.
4 Экономические преимущества предсказуемости
Может ли предсказуемость превратиться вдоход от инвестиций? В данной статье рассматриваются одномерные и многомерные эксперименты по распределению активов. В одномерных экспериментах инвесторы рассматривают возможность инвестирования только в безрисковые облигации иРискованные облигации со сроком погашения в течение одного года, в этой статье основное внимание уделяется толькоилиСлучай. В многовариантном сценарии инвесторы рассматривают как облигации со сроком погашения от 2 до 10 лет, так и безрисковые облигации. Результаты показаны в следующей таблице.Положительные значения указывают на то, что модель прогнозирования сильнее, чем модель EH (гипотеза ожидания), а выбранная структура нейронной сети является оптимальной структурой в Таблице 1 и Таблице 2 соответственно.
5 экономических факторов предсказуемости
На рисунке ниже (a) (b) нанесите прогнозируемую доходность 10-летних облигаций (сплошная линия) и темпы роста индекса промышленного производства США (IP) (пунктирная линия), (c) (d)) реализованная доходность 10-летних облигаций с замененной пунктирной линией.
Также можно рассчитать коэффициент Шарпа для рецессий и экспансий:
Все приведенные выше данные показывают, что контрциклический характер премии за риск по облигациям очевиден.
Затем используйте прогнозируемое значение избыточной доходности 10-летней облигации для расчета премии за риск по облигации в некоторых теориях ценообразования активов.ключевые факторысделать возврат. Факторы:
- иПредставляет собой степень расхождения в представлениях об избыточной доходности, представляющую реальное расхождение и номинальное расхождение, соответственно, с прогнозами ВВП и ИПЦ на 4 квартала вперед, с данными из базы данных SPF.
- является обратным 10-летнему среднему взвешенному темпу роста потребления, отражающему неприятие риска, а RAbex (из Bekaert, Engstrom, and Xu, 2019) также используется как изменяющееся во времени неприятие риска.
- ипредставляют неопределенность экономического роста и инфляции соответственно.
- - нейтральная к риску подразумеваемая волатильность 1-месячной 10-летней облигации,представляет собой сумму квадратов изменений месячной доходности 10-летней бескупонной облигации, двух показателей, которые измеряют волатильность облигации.
Результаты представлены в таблице ниже:
Рассчитайте прогноз избыточной доходности 10-летних облигаций и 3субъективныйКоэффициенты корреляции прокси-переменных премии за риск (EBR*, SUBJ_BRP, GLS), три переменные из исследования Blue Chip Financial Forecasts (BCFF), коэффициенты корреляции показаны в следующей таблице:
использованная литература
- Bekaert, Geert, Eric C. Engstrom, and Nancy R. Xu. The time variation in risk appetite and uncertainty. No. w25673. National Bureau of Economic Research, 2019.
- Бьянки, Даниэле, Матиас Бюхнер и Андреа Тамони, «Премии за риск по облигациям с помощью машинного обучения».The Review of Financial Studies (2020).
- Cochrane, John H., and Monika Piazzesi. "Bond risk premia." American Economic Review 95.1 (2005): 138-160.
- Liu, Yan, and Jing Cynthia Wu. Reconstructing the yield curve. No. w27266. National Bureau of Economic Research, 2020.
- Ludvigson, Sydney C., and Serena Ng. "Macro factors in bond risk premia." The Review of Financial Studies 22.12 (2009): 5027-5067.