Узнайте, как машинное обучение прогнозирует доходность облигаций

Использование машинного обучения для прогнозирования доходности акций не редкость с очень хорошими результатами, такими как«Когда эмпирическое ценообразование встречается с машинным обучением». Итак, можно ли применить тот же подход к облигациям? в 2020 годуReview of Financial StudiesВверх"Bond Risk Premiums with Machine Learning«Прогнозирование избыточной доходности облигаций с использованием методов машинного обучения. Авторы: Даниэле Бьянки из Университета королевы Марии, Лондонский университет, Маттиас Бюхнер из Уорикского университета и бизнес-школы Рутгерса. (Rutgers Business School) Андреа Тамони.

1 Дизайн исследования

1.1 Экспериментальная структура

В этой статье проводятся два эксперимента:

Используя данные кривой доходности (то есть годовую доходность к погашению бескупонных облигаций с погашением через 1-10 лет в текущий момент времени, всего 10), спрогнозируйте избыточную доходность облигаций с определенным сроком погашения в следующем году. (т.е. рост цены минус безрисковая ставка);
На основе кривой доходности используются 128 макропеременных и делается такой же прогноз. Эти макропеременные разделены на группы: реальный выпуск и доход, занятость и отработанное время, данные о розничных и производственных продажах, международная торговля, потребительские расходы, жилищное строительство, запасы и коэффициенты реализации запасов, заказы и невыполненные заказы, компенсация и труд. затраты, индексы цен, процентные ставки и спреды, фондовые индексы, валютные показатели.

Набор данных взят из (Liu and Wu, 2020) кривых доходности бескупонных облигаций. Набор данных представляет собой ежедневную периодичность, определяющую годовую доходность к погашению бескупонных облигаций со сроком погашения от 1 до 360 месяцев в каждый момент времени.

По прошлым данным85%и15% Разделите набор для обучения и набор для проверки (в порядке временного ряда), а тестовый набор — это избыточный доход на следующий год. После каждого теста обучающий набор и проверочный набор рекурсивно расширяются вперед на один месяц, и соотношение между ними остается постоянным, а длина тестового набора сохраняется равной одному году. Весь набор данных относится к периоду с 1971.08 по 2018.12 (10-летние облигации в США были выпущены с 1971.9), а первый тест начался с 1990.1. Схематическая диаграмма выглядит следующим образом:

Для каждого теста запишите прогнозируемый результат и в конце рассчитайте выход за пределы выборки. $R^2$ :

R^2_\text{OOS}=1-\dfrac{\sum_{t_0=1}^{T-1}\left(xr_{t+1}^{(n)}-\widehat{xr}_{t+1}^{(n)}(\mathcal{M}_s)\right)}{\sum_{t_0=1}^{T-1}\left(xr_{t+1}^{(n)}-\overline{xr}_{t+1}^{(n)}\right)}

в $xr_{t+1}^{(n)}$ выражать $t+n$ Бескупонные облигации со сроком погашения $t$ время $t+1$ избыточная норма доходности во времени, $\mathcal{M}_s$ для используемого алгоритма машинного обучения.

В этой статье прогнозируются только облигации с нулевым купоном со сроком погашения 2, 3, 4, 5, 7 и 10 лет, а также используются эти шесть облигаций для построения портфеля с равным весом и прогнозируется доходность портфеля. $R^2$ .

Проверяемая нулевая гипотеза $R^2<0$ , используя статистику Clark and West (2007) с поправкой на MSPE.

1.2 Алгоритмы машинного обучения

Вот краткое введение в алгоритм машинного обучения, используемый в этой статье. Сначала используются регрессия главных компонент и частичные наименьшие квадраты, а затем используются несколько методов регрессии со штрафными условиями, а именно регрессия LASSO, гребневая регрессия и эластичная сеть. Кроме того, в работе также используется расширение дерева регрессии — дерево с градиентным усилением (Gradient boosted tree), случайный лес и дерево пределов, как показано ниже:

Наконец, в статье используются несколько различных архитектур нейронных сетей. Когда для прогнозирования используются только данные кривой доходности, используется классическая структура нейронной сети с прямой связью, как показано на следующем рисунке:

При использовании как данных кривой доходности, так и макроданных для прогнозирования в этом документе проектируются 3 различные сетевые структуры, как показано ниже:

Первый заключается в подключении данных процентной ставки непосредственно к выходному слою, минуя скрытый слой (называемый гибридной сетью), второй — в объединении двух сетей (сети процентной ставки и сети макропеременных), а третий заключается в объединении двух сетей во второй групповой ансамбль макропеременных (называемый групповым ансамблем) на этой основе.

2 Экспериментальные результаты

2.1 Использование только прогнозов кривой доходности

Результаты эксперимента представлены на рисунке:

На панели А главный компонент PC кривой доходности берется первым, соответственно 3, 5 и 10. Когда используются 10 главных компонентов, это эксперимент Cochrane and Piazzesi (2005). результат $R^2$ Оба отрицательны, и эффект тем хуже, чем больше ПК.После добавления квадрата нелинейного члена ПК результаты оказываются хуже. Переход на PLS также не улучшил производительность.

Панель B, гребневая регрессия $R^2$ является отрицательным, в то время как модели с разреженностью (регрессия LASSO, эластичные сети) предсказывают облигации со сроком погашения более 4 лет. $R^2$ является положительным и предсказывает комбинированный $R^2$ Тоже положительный.

На панели C дерево пределов работает лучше всего среди ряда древовидных моделей, вероятно, из-за рандомизированного расположения разделов функций. Для нейронной сети поверхностная сеть (1 скрытый слой, 3 узла) работает так же хорошо, как и глубокая сеть (2 скрытых слоя, 7 узлов), а углубление сети ухудшит результаты; Кокрейн и Пьяццези (2005) указали. из того, что форвардные курсы с лагом 1-11 периодов содержат информацию об избыточных доходах, которых нет в форвардных курсах, и бумага будет отставать от 1-11 форвардных курсов и 10 форвардных процентных ставок помещается в сеть с 7 узлами в одном скрытом слое , и по сравнению с мелкой сетью обнаруживается, что эффект не улучшился.Поэтому запаздывающая кривая доходности не может помочь текущей кривой доходности улучшить ее прогностическую способность.

2.2 Прогнозирование с использованием кривой доходности и макроданных одновременно

Результат выглядит следующим образом:

На панелях A и B, чтобы их можно было сравнить с Ludvigson and Ng (2009), вторая строка состоит в том, чтобы извлечь первые 8 основных компонентов из макропеременных, а затем взять их подмножество в соответствии с его настройкой, а возврат скорость В некоторых данных (строки 4, 5 и 6) используется коэффициент CP (линейная комбинация форвардных ставок), полученный Cochrane and Piazzesi (2005). Было обнаружено, что плотные модели, такие как гребневая регрессия или сжатие данных, плохо работали вне выборок, в то время как разреженные модели работали лучше и значительно улучшились по сравнению с экспериментальными результатами в 2.1, что указывает на то, что добавление макропеременных полезно для прогнозирования.

Панель C является результатом 3 видов сетей.Среди них эффект гибридной сети является выдающимся, и увеличение глубины может повысить ее точность.Если для выбора структуры сети используются предварительные знания экономики, это значительно повлияет эффект предсказания Интегрированная сеть с 1-слойной группировкой Так же хороша, как гибридная сеть с 3-мя слоями, и лучше в облигациях со сроком погашения в 7 и 10 лет. Кроме того, эффект от добавления макропеременных в несколько моделей деревьев также лучше, а дерево пределов относительно лучше.

3 Анатомия предсказуемости

Различается ли предсказуемость во время подъемов и спадов?? Используйте индикатор рецессии NBER, чтобы разделить период роста и период рецессии, и рассчитать вне выборки отдельно $R^2$ , результат следующий:

Извлеките главный компонент PC из кривой доходности, и первые три главных компонента представляютУровень кривой доходности,склон,кривизна, вы можете использовать регрессиюПроверьте, могут ли скрытые факторы, извлеченные нейронной сетью, предсказывать изменения первых трех основных компонентов.:

PC_{i,t+1}-PC_{i,t}=b_0 + \boldsymbol{b}_1^T \mathcal{P}_t + \boldsymbol{b}_2^T \boldsymbol{x}_t + \epsilon_{i,t+1} \text{ for } i=1,2,3

в $\boldsymbol{x}_t$ Скрытый фактор, извлеченный для нейронной сети, то есть выход скрытого слоя. Результаты следующие (в первой строке не добавляются неявные факторы для справки):

Какие переменные важны? Частичный дифференциал прогнозируемого значения относительно переменной может быть рассчитан:

\mathbb{E}\left[\dfrac{\partial}{\partial y_{it}} xr_{t+1}^{(n)}\bigg| y_{it}=\bar{y}_i\right]

После взятия абсолютного значения для всех $t$ Возьмите среднее значение, чтобы получить важность переменной. Если усреднить важность каждой группы макропеременных, можно получить важность каждой группы.

На рисунках (а) и (б) ниже показано значение каждой переменной при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно. (c) и (d) — важность каждой группы после группировки при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно.

Приведенные выше результаты показывают, что нелинейность важна, но нелинейность, которая может улучшить производительность, возникает из-заМежду группамивзаимодействие илисвзаимодействие? Дифференциал второго порядка между группами можно получить отдельно для полносвязной сети и сети, интегрированной в группу:

\mathbb{E}\left[\dfrac{\partial^2}{\partial y_{i} \partial y_j} xr_{t+1}^{(n)}\bigg| y_{i}\in G_A, y_j\in G_B\right]

Результат выглядит следующим образом:

Панель A показывает, что межгрупповое взаимодействие велико в полностью связанной сети, а панель B показывает, что внутригрупповое взаимодействие одинаково в двух нейронных сетях. Следовательно, превосходная производительность нейронной сети сгруппированного ансамбля обусловлена тем, что она запрещает межгрупповые взаимодействия и разрешает внутригрупповые взаимодействия.

4 Экономические преимущества предсказуемости

Может ли предсказуемость превратиться вдоход от инвестиций? В данной статье рассматриваются одномерные и многомерные эксперименты по распределению активов. В одномерных экспериментах инвесторы рассматривают возможность инвестирования только в безрисковые облигации и $n$ Рискованные облигации со сроком погашения в течение одного года, в этой статье основное внимание уделяется только $n=2$ или $n=10$ Случай. В многовариантном сценарии инвесторы рассматривают как облигации со сроком погашения от 2 до 10 лет, так и безрисковые облигации. Результаты показаны в следующей таблице.Положительные значения указывают на то, что модель прогнозирования сильнее, чем модель EH (гипотеза ожидания), а выбранная структура нейронной сети является оптимальной структурой в Таблице 1 и Таблице 2 соответственно.

5 экономических факторов предсказуемости

На рисунке ниже (a) (b) нанесите прогнозируемую доходность 10-летних облигаций (сплошная линия) и темпы роста индекса промышленного производства США (IP) (пунктирная линия), (c) (d)) реализованная доходность 10-летних облигаций с замененной пунктирной линией.

Также можно рассчитать коэффициент Шарпа для рецессий и экспансий:

Все приведенные выше данные показывают, что контрциклический характер премии за риск по облигациям очевиден.

Затем используйте прогнозируемое значение избыточной доходности 10-летней облигации для расчета премии за риск по облигации в некоторых теориях ценообразования активов.ключевые факторысделать возврат. Факторы:

$DiB(g)$ и $DiB(\pi)$ Представляет собой степень расхождения в представлениях об избыточной доходности, представляющую реальное расхождение и номинальное расхождение, соответственно, с прогнозами ВВП и ИПЦ на 4 квартала вперед, с данными из базы данных SPF.
$-Surplus$ является обратным 10-летнему среднему взвешенному темпу роста потребления, отражающему неприятие риска, а RAbex (из Bekaert, Engstrom, and Xu, 2019) также используется как изменяющееся во времени неприятие риска.
$UnC(g)$ и $UnC(\pi)$ представляют неопределенность экономического роста и инфляции соответственно.
${TYVIX}$ - нейтральная к риску подразумеваемая волатильность 1-месячной 10-летней облигации, $\sigma_B^{(n)}$ представляет собой сумму квадратов изменений месячной доходности 10-летней бескупонной облигации, двух показателей, которые измеряют волатильность облигации.

Результаты представлены в таблице ниже:

Рассчитайте прогноз избыточной доходности 10-летних облигаций и 3субъективныйКоэффициенты корреляции прокси-переменных премии за риск (EBR*, SUBJ_BRP, GLS), три переменные из исследования Blue Chip Financial Forecasts (BCFF), коэффициенты корреляции показаны в следующей таблице:

использованная литература

Bekaert, Geert, Eric C. Engstrom, and Nancy R. Xu. The time variation in risk appetite and uncertainty. No. w25673. National Bureau of Economic Research, 2019.
Бьянки, Даниэле, Матиас Бюхнер и Андреа Тамони, «Премии за риск по облигациям с помощью машинного обучения».The Review of Financial Studies (2020).
Cochrane, John H., and Monika Piazzesi. "Bond risk premia." American Economic Review 95.1 (2005): 138-160.
Liu, Yan, and Jing Cynthia Wu. Reconstructing the yield curve. No. w27266. National Bureau of Economic Research, 2020.
Ludvigson, Sydney C., and Serena Ng. "Macro factors in bond risk premia." The Review of Financial Studies 22.12 (2009): 5027-5067.