Узнайте, как машинное обучение прогнозирует доходность облигаций

машинное обучение

Использование машинного обучения для прогнозирования доходности акций не редкость с очень хорошими результатами, такими как«Когда эмпирическое ценообразование встречается с машинным обучением». Итак, можно ли применить тот же подход к облигациям? в 2020 годуReview of Financial StudiesВверх"Bond Risk Premiums with Machine Learning«Прогнозирование избыточной доходности облигаций с использованием методов машинного обучения. Авторы: Даниэле Бьянки из Университета королевы Марии, Лондонский университет, Маттиас Бюхнер из Уорикского университета и бизнес-школы Рутгерса. (Rutgers Business School) Андреа Тамони.

1 Дизайн исследования

1.1 Экспериментальная структура

В этой статье проводятся два эксперимента:

  1. Используя данные кривой доходности (то есть годовую доходность к погашению бескупонных облигаций с погашением через 1-10 лет в текущий момент времени, всего 10), спрогнозируйте избыточную доходность облигаций с определенным сроком погашения в следующем году. (т.е. рост цены минус безрисковая ставка);

  2. На основе кривой доходности используются 128 макропеременных и делается такой же прогноз. Эти макропеременные разделены на группы: реальный выпуск и доход, занятость и отработанное время, данные о розничных и производственных продажах, международная торговля, потребительские расходы, жилищное строительство, запасы и коэффициенты реализации запасов, заказы и невыполненные заказы, компенсация и труд. затраты, индексы цен, процентные ставки и спреды, фондовые индексы, валютные показатели.

Набор данных взят из (Liu and Wu, 2020) кривых доходности бескупонных облигаций. Набор данных представляет собой ежедневную периодичность, определяющую годовую доходность к погашению бескупонных облигаций со сроком погашения от 1 до 360 месяцев в каждый момент времени.

По прошлым данным8515% Разделите набор для обучения и набор для проверки (в порядке временного ряда), а тестовый набор — это избыточный доход на следующий год. После каждого теста обучающий набор и проверочный набор рекурсивно расширяются вперед на один месяц, и соотношение между ними остается постоянным, а длина тестового набора сохраняется равной одному году. Весь набор данных относится к периоду с 1971.08 по 2018.12 (10-летние облигации в США были выпущены с 1971.9), а первый тест начался с 1990.1. Схематическая диаграмма выглядит следующим образом:

Для каждого теста запишите прогнозируемый результат и в конце рассчитайте выход за пределы выборки.R2R^2:

ROOS2=1t0=1T1(xrt+1(n)xr^t+1(n)(Ms))t0=1T1(xrt+1(n)xrt+1(n))R^2_\text{OOS}=1-\dfrac{\sum_{t_0=1}^{T-1}\left(xr_{t+1}^{(n)}-\widehat{xr}_{t+1}^{(n)}(\mathcal{M}_s)\right)}{\sum_{t_0=1}^{T-1}\left(xr_{t+1}^{(n)}-\overline{xr}_{t+1}^{(n)}\right)}

вxrt+1(n)xr_{t+1}^{(n)}выражатьt+nt+nБескупонные облигации со сроком погашенияttвремяt+1t+1избыточная норма доходности во времени,Ms\mathcal{M}_sдля используемого алгоритма машинного обучения.

В этой статье прогнозируются только облигации с нулевым купоном со сроком погашения 2, 3, 4, 5, 7 и 10 лет, а также используются эти шесть облигаций для построения портфеля с равным весом и прогнозируется доходность портфеля.R2R^2.

Проверяемая нулевая гипотезаR2<0R^2<0, используя статистику Clark and West (2007) с поправкой на MSPE.

1.2 Алгоритмы машинного обучения

Вот краткое введение в алгоритм машинного обучения, используемый в этой статье. Сначала используются регрессия главных компонент и частичные наименьшие квадраты, а затем используются несколько методов регрессии со штрафными условиями, а именно регрессия LASSO, гребневая регрессия и эластичная сеть. Кроме того, в работе также используется расширение дерева регрессии — дерево с градиентным усилением (Gradient boosted tree), случайный лес и дерево пределов, как показано ниже:

Наконец, в статье используются несколько различных архитектур нейронных сетей. Когда для прогнозирования используются только данные кривой доходности, используется классическая структура нейронной сети с прямой связью, как показано на следующем рисунке:

При использовании как данных кривой доходности, так и макроданных для прогнозирования в этом документе проектируются 3 различные сетевые структуры, как показано ниже:

Первый заключается в подключении данных процентной ставки непосредственно к выходному слою, минуя скрытый слой (называемый гибридной сетью), второй — в объединении двух сетей (сети процентной ставки и сети макропеременных), а третий заключается в объединении двух сетей во второй групповой ансамбль макропеременных (называемый групповым ансамблем) на этой основе.

2 Экспериментальные результаты

2.1 Использование только прогнозов кривой доходности

Результаты эксперимента представлены на рисунке:

На панели А главный компонент PC кривой доходности берется первым, соответственно 3, 5 и 10. Когда используются 10 главных компонентов, это эксперимент Cochrane and Piazzesi (2005). результатR2R^2Оба отрицательны, и эффект тем хуже, чем больше ПК.После добавления квадрата нелинейного члена ПК результаты оказываются хуже. Переход на PLS также не улучшил производительность.

Панель B, гребневая регрессияR2R^2является отрицательным, в то время как модели с разреженностью (регрессия LASSO, эластичные сети) предсказывают облигации со сроком погашения более 4 лет.R2R^2является положительным и предсказывает комбинированныйR2R^2Тоже положительный.

На панели C дерево пределов работает лучше всего среди ряда древовидных моделей, вероятно, из-за рандомизированного расположения разделов функций. Для нейронной сети поверхностная сеть (1 скрытый слой, 3 узла) работает так же хорошо, как и глубокая сеть (2 скрытых слоя, 7 узлов), а углубление сети ухудшит результаты; Кокрейн и Пьяццези (2005) указали. из того, что форвардные курсы с лагом 1-11 периодов содержат информацию об избыточных доходах, которых нет в форвардных курсах, и бумага будет отставать от 1-11 форвардных курсов и 10 форвардных процентных ставок помещается в сеть с 7 узлами в одном скрытом слое , и по сравнению с мелкой сетью обнаруживается, что эффект не улучшился.Поэтому запаздывающая кривая доходности не может помочь текущей кривой доходности улучшить ее прогностическую способность.

2.2 Прогнозирование с использованием кривой доходности и макроданных одновременно

Результат выглядит следующим образом:

На панелях A и B, чтобы их можно было сравнить с Ludvigson and Ng (2009), вторая строка состоит в том, чтобы извлечь первые 8 основных компонентов из макропеременных, а затем взять их подмножество в соответствии с его настройкой, а возврат скорость В некоторых данных (строки 4, 5 и 6) используется коэффициент CP (линейная комбинация форвардных ставок), полученный Cochrane and Piazzesi (2005). Было обнаружено, что плотные модели, такие как гребневая регрессия или сжатие данных, плохо работали вне выборок, в то время как разреженные модели работали лучше и значительно улучшились по сравнению с экспериментальными результатами в 2.1, что указывает на то, что добавление макропеременных полезно для прогнозирования.

Панель C является результатом 3 видов сетей.Среди них эффект гибридной сети является выдающимся, и увеличение глубины может повысить ее точность.Если для выбора структуры сети используются предварительные знания экономики, это значительно повлияет эффект предсказания Интегрированная сеть с 1-слойной группировкой Так же хороша, как гибридная сеть с 3-мя слоями, и лучше в облигациях со сроком погашения в 7 и 10 лет. Кроме того, эффект от добавления макропеременных в несколько моделей деревьев также лучше, а дерево пределов относительно лучше.

3 Анатомия предсказуемости

Различается ли предсказуемость во время подъемов и спадов?? Используйте индикатор рецессии NBER, чтобы разделить период роста и период рецессии, и рассчитать вне выборки отдельноR2R^2, результат следующий:

Извлеките главный компонент PC из кривой доходности, и первые три главных компонента представляютУровень кривой доходности,склон,кривизна, вы можете использовать регрессиюПроверьте, могут ли скрытые факторы, извлеченные нейронной сетью, предсказывать изменения первых трех основных компонентов.:

PCi,t+1PCi,t=b0+b1TPt+b2Txt+ϵi,t+1заi=1,2,3PC_{i,t+1}-PC_{i,t}=b_0 + \boldsymbol{b}_1^T \mathcal{P}_t + \boldsymbol{b}_2^T \boldsymbol{x}_t + \epsilon_{i,t+1} \text{ for } i=1,2,3

вxt\boldsymbol{x}_tСкрытый фактор, извлеченный для нейронной сети, то есть выход скрытого слоя. Результаты следующие (в первой строке не добавляются неявные факторы для справки):

Какие переменные важны? Частичный дифференциал прогнозируемого значения относительно переменной может быть рассчитан:

E[yitxrt+1(n)yit=yˉi]\mathbb{E}\left[\dfrac{\partial}{\partial y_{it}} xr_{t+1}^{(n)}\bigg| y_{it}=\bar{y}_i\right]

После взятия абсолютного значения для всехttВозьмите среднее значение, чтобы получить важность переменной. Если усреднить важность каждой группы макропеременных, можно получить важность каждой группы.

На рисунках (а) и (б) ниже показано значение каждой переменной при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно. (c) и (d) — важность каждой группы после группировки при прогнозировании избыточной доходности облигаций со сроком погашения через 2 года и 10 лет соответственно.

Приведенные выше результаты показывают, что нелинейность важна, но нелинейность, которая может улучшить производительность, возникает из-заМежду группамивзаимодействие илисвзаимодействие? Дифференциал второго порядка между группами можно получить отдельно для полносвязной сети и сети, интегрированной в группу:

E[2yiyjxrt+1(n)yiеGA,yjеGB]\mathbb{E}\left[\dfrac{\partial^2}{\partial y_{i} \partial y_j} xr_{t+1}^{(n)}\bigg| y_{i}\in G_A, y_j\in G_B\right]

Результат выглядит следующим образом:

Панель A показывает, что межгрупповое взаимодействие велико в полностью связанной сети, а панель B показывает, что внутригрупповое взаимодействие одинаково в двух нейронных сетях. Следовательно, превосходная производительность нейронной сети сгруппированного ансамбля обусловлена ​​тем, что она запрещает межгрупповые взаимодействия и разрешает внутригрупповые взаимодействия.

4 Экономические преимущества предсказуемости

Может ли предсказуемость превратиться вдоход от инвестиций? В данной статье рассматриваются одномерные и многомерные эксперименты по распределению активов. В одномерных экспериментах инвесторы рассматривают возможность инвестирования только в безрисковые облигации иnnРискованные облигации со сроком погашения в течение одного года, в этой статье основное внимание уделяется толькоn=2n=2илиn=10n=10Случай. В многовариантном сценарии инвесторы рассматривают как облигации со сроком погашения от 2 до 10 лет, так и безрисковые облигации. Результаты показаны в следующей таблице.Положительные значения указывают на то, что модель прогнозирования сильнее, чем модель EH (гипотеза ожидания), а выбранная структура нейронной сети является оптимальной структурой в Таблице 1 и Таблице 2 соответственно.

5 экономических факторов предсказуемости

На рисунке ниже (a) (b) нанесите прогнозируемую доходность 10-летних облигаций (сплошная линия) и темпы роста индекса промышленного производства США (IP) (пунктирная линия), (c) (d)) реализованная доходность 10-летних облигаций с замененной пунктирной линией.

Также можно рассчитать коэффициент Шарпа для рецессий и экспансий:

Все приведенные выше данные показывают, что контрциклический характер премии за риск по облигациям очевиден.

Затем используйте прогнозируемое значение избыточной доходности 10-летней облигации для расчета премии за риск по облигации в некоторых теориях ценообразования активов.ключевые факторысделать возврат. Факторы:

  • DiB(g)DiB(g)иDiB(число Пи)DiB(\pi)Представляет собой степень расхождения в представлениях об избыточной доходности, представляющую реальное расхождение и номинальное расхождение, соответственно, с прогнозами ВВП и ИПЦ на 4 квартала вперед, с данными из базы данных SPF.
  • Surplus-Surplusявляется обратным 10-летнему среднему взвешенному темпу роста потребления, отражающему неприятие риска, а RAbex (из Bekaert, Engstrom, and Xu, 2019) также используется как изменяющееся во времени неприятие риска.
  • UnC(g)UnC(g)иUnC(число Пи)UnC(\pi)представляют неопределенность экономического роста и инфляции соответственно.
  • TYVIX{TYVIX}- нейтральная к риску подразумеваемая волатильность 1-месячной 10-летней облигации,оB(n)\sigma_B^{(n)}представляет собой сумму квадратов изменений месячной доходности 10-летней бескупонной облигации, двух показателей, которые измеряют волатильность облигации.

Результаты представлены в таблице ниже:

Рассчитайте прогноз избыточной доходности 10-летних облигаций и 3субъективныйКоэффициенты корреляции прокси-переменных премии за риск (EBR*, SUBJ_BRP, GLS), три переменные из исследования Blue Chip Financial Forecasts (BCFF), коэффициенты корреляции показаны в следующей таблице:

использованная литература

  • Bekaert, Geert, Eric C. Engstrom, and Nancy R. Xu. The time variation in risk appetite and uncertainty. No. w25673. National Bureau of Economic Research, 2019.
  • Бьянки, Даниэле, Матиас Бюхнер и Андреа Тамони, «Премии за риск по облигациям с помощью машинного обучения».The Review of Financial Studies (2020).
  • Cochrane, John H., and Monika Piazzesi. "Bond risk premia." American Economic Review 95.1 (2005): 138-160.
  • Liu, Yan, and Jing Cynthia Wu. Reconstructing the yield curve. No. w27266. National Bureau of Economic Research, 2020.
  • Ludvigson, Sydney C., and Serena Ng. "Macro factors in bond risk premia." The Review of Financial Studies 22.12 (2009): 5027-5067.