Первый опыт распознавания рукописных цифр MindSpore, глубокое обучение не так загадочно

глубокое обучение

Резюме: Если вы хотите понять глубокое обучение, но не знаете, с чего начать, давайте начнем с обучения модели распознавания рукописных цифр!

Как одна из ветвей машинного обучения широко используется глубокое обучение. Распознавание речи, автоматический машинный перевод, мгновенный визуальный перевод, оплата по факту, посещение по факту... Неосознанно глубокое обучение проникло во все уголки нашей жизни, принося большое удобство в нашу жизнь. Несмотря на это, все еще есть много людей, которые считают, что глубокое обучение непостижимо и недостижимо.На самом деле, оно имеет глубокие аспекты, которые трудно достичь непрофессионалам, но оно также имеет сходство, которое позволяет даже новичкам без основы. Почувствуйте прелесть глубокого обучения, и обучение модели распознавания рукописных цифр, которое будет представлено далее, именно таково.

Предварительное исследование распознавания рукописных цифр

Распознавание рукописных цифр является относительно простой задачей компьютерного зрения, а также одним из первых направлений развития в области компьютерного зрения.В первые дни оно в основном использовалось в таких сценах, как банковский перевод, распознавание отдельных номеров, почтовые отправления. письма, почерк посылок и распознавание почтовых индексов. Распознавание достигло высокой степени точности и широко пропагандировалось и применялось. Хотя сама область распознавания рукописных цифр относительно узка и ее практическая применимость ограничена, технологии компьютерного зрения, такие как сверточные нейронные сети, разработанные на ее основе, уже применялись для решения более сложных задач, поэтому распознавание рукописных цифр также стало областью компьютерных технологий. видение.Эталонная задача для измерения производительности алгоритма. Поэтому лучше всего узнать о разработке и обучении нейронной сети с помощью этого практического сценария. Как использовать фреймворк глубокого обучения MindSpore для разработки и обучения моделей? Как на платформе ModelArts обучить модель, которую можно использовать для распознавания рукописных цифр? Давайте разберемся.

Выбор и подготовка набора данных

Как традиционное машинное обучение, так и глубокое обучение в машинном обучении являются областями исследований, управляемыми данными.Необходимо обучать модели на основе большого количества исторических данных, а затем использовать модель для вывода и прогнозирования новых данных.Поэтому данные являются ключевым элемент машинного обучения.

Набор данных MNIST в настоящее время является наиболее широко используемым общедоступным набором данных в области распознавания рукописных цифр, и большинство алгоритмов распознавания обучаются и проверяются на его основе. Набор данных MNIST содержит 10 чисел от 0 до 9, каждое из которых содержит большое количество различных форм обучающих наборов изображений рукописных цифр, которые делятся на обучающие наборы и тестовые наборы. Учебный набор охватывает 60 000 изображений рукописных цифр, а тестовый уровень охватывает 10 000 изображений рукописных цифр. Каждое изображение представляет собой стандартизированное по размеру черно-белое изображение, представляющее собой бинарное изображение размером 28*28 пикселей со значением пикселя 0 или 1. Исходные изображения набора данных MNIST черно-белые, но использование изображений, дополненных данными, в реальном обучении может добиться лучших результатов обучения.

Изображения с дополненными данными, используемые в этом обучении

Метод распознавания, основанный на глубоком обучении

В отличие от традиционного машинного обучения, которое использует простую модель для выполнения таких задач, как классификация, в этом обучении мы используем глубокую нейронную сеть в качестве модели обучения, то есть глубокое обучение. Глубокое обучение извлекает признаки через искусственные нейронные сети.Выводы разных слоев часто рассматриваются как признаки разного масштаба, извлекаемые нейронной сетью.Вывод предыдущего слоя используется в качестве входных данных следующего слоя, а слои соединяются с образуют глубокую нейронную сеть.

Как работает глубокое обучение

В 1994 году Янн ЛеКун выпустил LeNet, сверточную нейронную сеть в сочетании с обратным распространением, которая намного превзошла другие модели в области распознавания рукописных цифр. В 1998 году сверточная нейронная сеть LeNet-5, созданная Яном Лекуном и др., успешно справилась с проблемой распознавания рукописных цифр и была известна как «Hello Word» сверточных нейронных сетей. LeNet-5 и последующие варианты определяют базовую структуру современных сверточных нейронных сетей и могут быть описаны как модели нейронных сетей начального уровня. В данной практике используется модель LeNet-5.

Структура Ленет-5

LeNet-5 состоит из входного слоя, сверточного слоя, слоя пула и полносвязного слоя. Входной слой используется для входных данных; слой свертки извлекает локальные объекты из входных данных с помощью операций свертки; слой пула уменьшает разрешение карты объектов путем понижения дискретизации, тем самым снижая чувствительность вывода к положению и деформации, а также уменьшает параметры и количество вычислений в сети; полносвязный слой собирает локальные признаки в полное изображение через матрицу весов, завершает отображение из пространства признаков в реальное пространство категорий, а окончательная классификация изображений завершается полносвязным слой. После того, как у нас есть такая нейронная сеть, нам необходимо постоянно обучать ее большому количеству наборов данных, чтобы иметь более точные результаты прогнозирования для входных данных.Этот процесс основан на MindSpore, платформе глубокого обучения, разработанной Huawei.

Процесс «обучения» MindSpore

MindSpore был развернут в среде разработки и среде обучения ModelArts и предоставляет пороговый алгоритм для непосредственного использования разработчиками Процесс его обучения показан на следующем рисунке в кратком виде:

  1. Разработка сети Frontline с использованием базовых модулей, предоставляемых MindSpore.

  2. Обрабатывать и улучшать данные для лучшего ввода данных

  3. Используйте передовую сеть для создания обучающей модели, а также сохранения и логического вывода модели.

Это может показаться тривиальным, но, в конце концов, эксперимент нужно провести самому, чтобы испытать бесконечное удовольствие.

Увидев это, вы уже наверняка немного знакомы со всевозможными фоновыми знаниями и принципами.Микро аутентификациякурс«Обучение модели распознавания рукописных цифр с помощью MindSpore»Бар. Кстати, позвольте мне сказать вам тихо, этот эксперимент все еще бесплатен, приходите в HUAWEI CLOUD AcademyЛаборатория песочницыиспытайте это немедленно. От принципа к практике я покажу вам всесторонний процесс обучения рукописной цифровой модели и быстро приступлю к глубокому обучению, приходите скорее!

→Нажмите прямо на HUAWEI CLOUD Academy, чтобы получить больше новых навыков

Эта статья опубликована в сообществе HUAWEI CLOUD «Первый опыт распознавания рукописных цифр в MindSpore, глубокое обучение не так уж и загадочно», первоначальный автор: College Xiaozhu.

Нажмите «Подписаться», чтобы впервые узнать о новых технологиях HUAWEI CLOUD~