Разделение набора данных, участвовал ли проверочный набор в обучении?
@TOC
предисловие
В книге «Машинное обучение» г-на Чжоу Чжихуа мы знаем, что при обучении моделей машинного обучения и глубокого обучения набор данных необходимо разделить, обычно на тренировочный набор и тестовый набор, Другая часть делится на проверочный набор. .
1. Как использовать проверочный набор?
Участвовал ли проверочный набор в обучении?
Из книги "Машинное обучение" мы знаем, что тренировочный набор используется для обучения параметров модели. Для всех тренировочных наборов после обучения эпохи мы будем использовать проверочный набор для проверки производительности приведенной выше модели. Несовместимость набор проверки и набор проверки, поэтому результаты в наборе проверки имеют смысл.
Но суть в том: 1. Проверочное множество не участвует в процессе градиентного спуска процесса обучения, в узком смысле не участвует в обучении параметров и обновлении модели. 2. Но в широком смысле значение существования проверочного набора действительно связано с процессом «ручной настройки параметров». Мы решаем, следует ли обучаться ранней остановке, в зависимости от производительности модели на действительных данных после обучение каждой эпохи или в соответствии с этим изменением производительности модели процесса для настройки гиперпараметров модели, таких как скорость обучения, размер партии и т. д. 3. Следовательно, мы также можем думать, что проверочный набор также участвовал в обучении, но не заставлял модель переобучать проверочный набор
2. Зачем нужен тестовый набор?
Обучающий набор используется для обучения параметров, а если быть точным, то он обычно используется для градиентного спуска. Набор проверки в основном используется для проверки точности текущей модели после завершения каждой эпохи, а затем для настройки гиперпараметров. Поскольку проверочный набор не пересекается с обучающим набором, эта точность является надежной. Итак, зачем вам тестовый набор?
Это требует различия между различными параметрами модели. Фактически для модели ее параметры можно разделить наОбщие параметрыиГиперпараметры. Без введения обучения с подкреплением общие параметры могут быть обновлены с помощью градиентного спуска, то есть параметры, обновленные обучающим набором. Кроме того, существует понятие гиперпараметров, таких как количество слоев сети, количество узлов сети, количество итераций, скорость обучения и т. д. Эти параметры не входят в диапазон обновления градиентного спуска. Хотя уже есть некоторые алгоритмы, которые можно использовать для поиска гиперпараметров модели, в большинстве случаев мы вручную настраиваем ее на основе проверочного набора.
Тогда очевидно, что нам также нужен совершенно необученный набор, который является тестовым набором, Мы не используем градиентный спуск тестового набора и не используем его для управления гиперпараметрами, а используем его только для тестирования после того, как модель окончательно обучена. показатель точности определяет обобщающую способность модели.
3. Коэффициент деления набора данных
В общем случае коэффициент деления следующий:Небольшой объем данных (традиционное машинное обучение) Нет проверочного набора, обучающий набор: тестовый набор = 7:3 Имеется проверочный набор, обучающий набор: проверочный набор: тестовый набор = 6:2:2
Большой объем данных (разделение больших данных) Предполагая, что есть фрагменты данных размером 100 Вт, вам нужно взять только 1 Вт в качестве проверочного набора и 1 Вт в качестве тестового набора, и все будет работать хорошо.Поэтому, если данные в глубоком обучении велики, мы можем настроить соотношение обучающего набора, проверочного набора и тестового набора до 98: 1: 1.