Мы можем выбратькак можно меньшедля решения задачи подбора кривой. Поскольку функция ошибок является коэффициентомКвадратичная функция от , производная которой по коэффициентам равналинейна по элементам, поэтому минимизация функции ошибок имеет единственное решение, используяпредставляет , который можно найти в закрытом виде. Результирующий полином задается функциейданный.
Существует еще полиномиальный порядок выбора, который, как мы увидим, станет примером важного понятия, называемого сравнением моделей и выбором модели. На рис. 1.4 показаны четыреПример результатов полиномиальной подгонки к набору данных показан на рис. 1.2.
Заметим постояннуюи первый заказПолином плохо соответствует данным, поэтому функцияпредставительство слабое. третий заказПолином лучше всего подходит для функции в примере, показанном на рис. 1.4.. Когда мы используем многочлены более высокого порядка, мы получили отличное соответствие тренировочным данным. Фактически полином проходит точно через каждую точку данных,. Однако подобранная кривая сильно колеблется, и функцияпроизводительность очень плохая. Последнее поведение называется переоснащением.
Как мы упоминали ранее, наша цель — добиться хорошего обобщения, делая точные прогнозы на основе новых данных. Рассматривая отдельный тестовый набор, состоящий из 100 точек данных, мы можем получить хорошую пару производительности обобщения.Некоторые количественные данные о допуске точек данных были получены с использованием той же процедуры, которая генерировала точки набора данных, но с новым выбором значений случайного шума, включенных в целевые значения. для каждого, мы можем оценить обучающие данные, приведенные в (1.2), дляОстаточные значения, которые также можно оценить для тестового набора данных. Иногда удобнее использовать среднеквадратичную (RMS) ошибку, определяемую формулой
в,Разделение позволяет нам сравнивать наборы данных разных размеров на равной основе, квадратный корень обеспечиваетс целевой переменнойИзмеряется по одной шкале (и в одних и тех же единицах). Рисунок 1.5 показывает разницуГрафик обучения и тестового набора среднеквадратических ошибок при значениях. Ошибка тестового набора — это мера того, насколько хорошо мы предсказываемновых данных наблюденийНасколько он хорош с точки зрения стоимости. Заметим из рис. 1.5, что меньшие значения M дают относительно большие пары значений ошибок тестового множества, что можно объяснить тем, что соответствующие полиномы достаточно негибки и не могут уловить функциюшок. Значение М равнодает малое значение ошибки на тестовом наборе, что также дает производящую функциюРазумное представление , из рис. 1.4 видно, что дляСлучай.
Рисунок 1.4 Различные заказыПолиномиальный график, показанный красной кривой, соответствует набору данных на рис. 1.2.
Рисунок 1.5. Среднеквадратическая ошибка, определяемая (1.3) на обучающей выборке и независимой тестовой выборкеразличных значений .