В этом выпуске AI Adventures мы познакомимся с ядром Kaggle и используем его. Хотя в этом выпуске мы не будем присылать вам попкорн, я гарантирую вам, что Kaggle Kernels будет так же популярен, как попкорн.
Это тринадцатая часть серии видео/статей под названием «Приключения ИИ», представленных Юфэн Го, инженером по продвижению технологий разработки в Google, чтобы помочь вам понять искусственный интеллект и машинное обучение простым языком. В этой серии видео/статей мы вместе исследуем мир искусственного интеллекта, познакомимся с искусством, изучим науку и освоим инструменты машинного обучения.
первый раз:Что такое машинное обучение?
Вторая статья:Машинное обучение «Семь шагов»
Третья статья:Классификация цветов с оценщиком
Глава 4:Эластично масштабируемый облачный хостинг
Глава 5:Визуализируйте модель с помощью TensorBoard
Глава 6:Распознайте оценщика глубокой нейронной сетью
Глава 7:Решение для работы с большими данными для обучения моделей в облаке
Глава 8:Испытайте генерацию естественного языка с помощью Google Research
Название IX:Механизм машинного обучения в облаке
Глава 10:Обучите модель, используя набор данных MNIST
Глава 11:Лучшие практики для инженеров по машинному обучению в средах разработки Python
Глава 12:Прежде чем машинное обучение, дайте «Большой панде» попробовать данные
Весь контент и видео будут сначала опубликованы на "такой же остроумный, как ты», цель состоит в том, чтобы выпустить новейшую технологию машинного обучения, связанную с Google, TensorFlow. Сопутствующий контент. Если у вас есть какие-либо вопросы, вы также можете оставить отзыв в области сообщений.
Kaggle— это платформа, на которой вы можете исследовать науку о данных и делиться соответствующими результатами. Возможно, вы слышали о некоторых конкурсах на Kaggle, в которых разыгрываются денежные призы. Это также отличное место для практики исследования данных и обучения у сообщества.
▍Что такое ядра Kaggle?
Kaggle Kernels
По сути, ноутбуки Jupyter в браузере бесплатны. Конечно, такую важную вещь надо сказать еще раз, чтобы вы этого не видели:
Kaggle Kernels — это открытая платформа, позволяющая запускать Jupyter в браузере абсолютно бесплатно!
Это означает, что вам вообще не нужно бороться с настройкой локальной среды, и вы можете иметь отличную среду ноутбука Jupyter, где бы вы ни находились, если вы подключены к Интернету.
Больше чем это! Вычислительная мощность онлайн-блокнота исходит от сервера в облаке, а не от вашего компьютера. Таким образом, вы можете проводить исследования, связанные с данными, и машинное обучение, не потребляя драгоценную мощность вашего компьютера.
blog.Card Reformed.com/2017/09/21/…
Kaggle Недавно обновленоЯдра для обеспечения более мощной вычислительной производительности и увеличения времени использования до 60 минут.
Ладно-ладно, я долго болтал о Kaggle Kernels, пришло время посмотреть, как это выглядит на самом деле.
▍Ядра в действии
покаkaggle.comПосле регистрации учетной записи мы можем выбрать набор данных и войти во вновь созданное ядро или блокнот несколькими щелчками мыши.
Нажмите, чтобы увидеть анимацию вышеСсылка на сайт(около 11Мб)
Выбранные нами наборы данных будут предварительно загружены в используемое ядро, поэтому не нужно беспокоиться о загрузке наборов данных или ожидании длительного процесса копирования данных.
Однако вы все равно можете загружать данные (до 1 ГБ) в ядро, если хотите.
В нашем примере мы будем продолжать использоватьfashion-mnist
набор данных. Это набор данных с 10 категориями одежды, включая брюки, сумки, высокие каблуки, рубашки и т. д. В наборе данных пятьдесят тысяч обучающих выборок и десять тысяч оценочных выборок. иди ко мнеKaggle KernelВзгляните на блокнот.
Сначала взгляните на набор данных. Наборы данных доступны на Kaggle в виде CSV-файлов. Необработанные данные представляют собой изображения в градациях серого размером 28x28 пикселей, которые были сжаты в файл csv с 784 столбцами данных в строке. Файл также включает столбец данных, представляющих категории одежды (индексированные от 0 до 9).
▍Загрузка данных
Поскольку набор данных уже загружен в текущую среду браузера, мы пытаемся использовать его для чтения файла .csv вpandas
DataFrames, один для обучения и один для прогнозирования.
Обратите внимание, что данные хранятся во входном каталоге предыдущего уровня.
Если вы хотите увидеть, как я это делаю, обратитесь к моему ядру Kaggle:
▍Исследование данных
Теперь, когда мы загрузили данные в DataFrame, мы можем воспользоваться ими (подробности см. в предыдущем выпуске). мы используемhead()
метод, чтобы получить первые 5 строк данных, затем используйтеdescribe()
чтобы узнать больше о структуре набора данных.
Похоже, данные были обработаны не по порядку
▍Визуализация данных
Кроме того, если вы визуализируете эти оцифрованные данные, они будут иметь больше смысла, чем ряд за рядом скучных чисел. давайте использоватьmatplotlib
Давайте посмотрим, как выглядят эти изображения.
использовать здесьmatplotlib.pyplot
Библиотека, обычно называемая plt, используется для отображения массивов данных в виде изображений.
Мы можем видеть эти изображения, немного размытые, но мы все же можем сказать, одежда это или аксессуары.
Kaggle Kernels дает нам полностью интерактивную среду для ноутбуков практически без такелажа. Я должен подчеркнуть, что совершенно не нужно настраивать среду разработки Python или устанавливать какие-либо библиотеки, что действительно здорово!
Полная ссылка на ядро:woohoo.cardreform.com/withstyle/happens…
Вы уже используете ядра Kaggle? Какая ваша любимая функция? Любые советы, чтобы поделиться?
Спасибо, что прочитали этот выпуск Cloud AI Adventures. Если вам нравится эта серия, пожалуйста, поставьте лайк. Если вы хотите узнать больше о последующем контенте, подпишитесь на меня и "такой же остроумный, как ты» (вы также можете подписаться на Yufeng G’sMediumиYouTube канал). Не пропустите более интересное, увидимся в следующий раз!
▏Первоисточник:Medium - Introduction to Kaggle Kernels
▏ Источник обложки:Миниатюра видео на YouTube
▏ Источник видео:YouTube - Introduction to Kaggle Kernels
▏Перевод субтитров:Группа субтитров Гу Чуанга
▏Редактор статьи:@杨东