Примечания к «Освоение карты пути самообучения ИИ в прямом эфире за один урок»

машинное обучение искусственный интеллект TensorFlow алгоритм

Эта статья также размещена в моем блоге,Добро пожаловать на просмотр ?

Основные области исследований искусственного интеллекта

Из классического учебника «Искусственный интеллект» Russell & Norvig.

обработка естественного языка
представление знаний
автоматизированное рассуждение
машинное обучение
компьютерное зрение
робототехника

Сценарии жизни для основных приложений ИИ

  1. Помощники по жизни, такие как умные колонки, в основном используют распознавание голоса.
  2. Распознавание изображений, например, автономное вождение, алгоритмы камеры на основе искусственного интеллекта, анализ динамического поведения и т. д.

ИИ-приложение Qiniuyun

1. ИИ распознает лицо после загрузки видео
2. Обнаружение ИИ порнографии, борьбы с насилием и терроризмом

3. Классификация видео AI
4. Вырезание основных элементов, например, какие люди, объекты и другие элементы существуют в определенном видео.
5. Опишите видео
6. Сегментируйте и найдите видео

Быстрый старт

Совет для начинающих

  1. Не ждите, пока у вас будут все соответствующие математические знания, чтобы начать

Матрица/тензор, разложение по собственным значениям, определитель, норма...
Распределения вероятностей, независимые, байесовские, оценка максимального правдоподобия...
Линейная оптимизация, градиентный спуск, метод Ньютона...
Производные, частные дифференциалы, цепное правило, матричный вывод...
Теория информации, численные вычисления...

  1. Не собирайте слишком много учебного материала
  2. Практический X3

Краткий обзор машинного обучения

Что такое машинное обучение?

Машинное обучение — это использование алгоритмов обучения для создания моделей на основе данных.

Spam filters, Search ranking, Click through rate predict, Recommendations, Speech recognition,Machine translation, Face detection, Image classification......

  1. Традиционное программирование: данные + программа => вывод
  2. Машинное обучение: данные + вывод ====> Модель обучения

机器学习与传统编程

обобщаемость

Для некоторой задачи T и показателя производительности P, если производительность компьютерной программы, измеряемая P на T, улучшается с опытом E, то мы говорим, что компьютерная программа учится на опыте E. -- Том М. Митчелл

Как показано на рисунке ниже, хотя третье изображение не имеет отклонений, эффект предсказания неизвестной точки не так хорош, как на втором изображении. Это обобщение.

机器学习泛化性

Общие задачи и алгоритмы

для конкретных задач обучения

Ни один алгоритм не является более эффективным, чем другие, если бы не конкретная задача обучения.

  1. Алгоритмы обучения, которые хорошо работают в одних задачах, могут плохо работать в других.
  2. Часто решающую роль играет соответствие индуктивных предпочтений алгоритма обучения задаче.
  3. Индуктивные предпочтения — это предположения самого алгоритма обучения о том, «какая модель лучше».

классификация изображений

Люди могут легко классифицировать изображения, но машины не могут, потому что естьсмысловой разрыв.

Как показано на рисунке ниже, люди видят кошек, компьютеры видят числа, а компьютеры понимают концепцию семантики.

K-ближайшие соседи

K-ближайшие соседиЭто алгоритм классификации K-ближайших соседей (KNN), который является теоретически зрелым методом и одним из самых простых алгоритмов машинного обучения. Идея этого метода такова: если большинство из k наиболее похожих выборок в пространстве признаков (то есть ближайших соседей в пространстве признаков) принадлежат к определенной категории, то выборка также принадлежит к этой категории.

Другими словами, учитывая набор обучающих данных, у меня есть новый экземпляр, и если большинство экземпляров K, ближайших к экземпляру в данных, принадлежат определенному классу, то судят, что новый экземпляр принадлежит к определенному типу класса.

недостаток:

  1. Классификатор должен запомнить все обучающие данные и сохранить их, чтобы можно было использовать будущие тестовые данные для сравнения. Это неэффективно с точки зрения места для хранения, а размер набора данных может легко достигать ГБ.
  2. Классификация тестового изображения требует сравнения со всеми тренировочными изображениями, а алгоритм потребляет большие вычислительные ресурсы.

Линейный классификатор

Из-за очевидных недостатков K-ближайших соседей нам нужен более мощный метод для решения задачи классификации изображений, который можно использовать здесь.Линейный классификатор

Рекомендуемые учебные материалы

книги

  1. Ник «Краткая история искусственного интеллекта»
  2. Мирослав Кубат «Введение в машинное обучение»
  3. Чжоу Чжихуа, «Машинное обучение» (арбузные книги)
  4. Орельен Герон, «Практическое машинное обучение с помощью Scikit-learn и Tensorflow»,
  5. «Глубокое обучение» Яна Гудфеллоу и других (Цветочная книга)

статья

  1. Начало работы с машинным обучением (все в одном), Лян Цзинь http://sina.lt/f3W8
  2. Machine learning 101 by Jason Mayes http://sina.lt/f3W3

курс

  1. Ускоренный курс по машинному обучению https://developers.google.com/machine-learning/crash-course/
  2. Проф. Хонги Ли, Тайваньский национальный университет http://speech.ee.ntu.edu.tw/~tlkagk/courses.html
  3. Профессор Ву Энда http://mooc.study.163.com/smartSpec/detail/1001319001.htm
  4. Стэнфордский университет cs231n http://cs231n.stanford.edu/
  5. Стэнфордский университет cs224n http://web.stanford.edu/class/cs224n/

разное

  1. scikit-learn Tutorials http://scikit-learn.org/stable/tutorial/index.html
  2. Глоссарий по машинному обучению https://developers.google.com/machine-learning/crash-course/glossary

Q&A

  1. Связь между машинным обучением и социальными науками?
    Развитие машинного обучения в значительной степени зависит от социальных наук, потому что машинное обучение на самом деле исследует концепции психологии и то, как мозг учится и думает, и машинное обучение будет давать обратную связь социальным наукам в процессе развития.

  2. Китай находится на лидирующих позициях в области искусственного интеллекта, но почему вся информация в этой области из-за рубежа?
    Китай — большая страна, и данных о социальном поведении очень много. Но поскольку мы начали заниматься компьютерами относительно поздно, наши исследования в фундаментальной области неглубоки. Это не только область искусственного интеллекта, но и вся область информатики, многие наши приложения основаны на зарубежных базовых теориях. Но когда дело доходит до практических приложений, мы очень впереди. Например, распознавание лиц, в Китае большое население, и выборки, доступные для обучения, очень богаты. Задача, стоящая перед Китаем в области ИИ, заключается в том, как объединить наш опыт и обобщения в приложениях с базовыми теориями для содействия академическому развитию.

  3. Рекомендуется ли новичкам начинать с глубокого обучения?
    не предлагается. Вы должны систематически изучать основные понятия и их отношения, практиковать знакомство с общими методами, а затем учиться дальше.

  4. Pytorch и TensorFlow — две библиотеки машинного обучения, какая из них лучше подходит для обучения?
    Либо. TensorFlow производится Google, и существует множество ссылок с открытым исходным кодом. В настоящее время существует больше Pytorch для академических исследований и больше TensorFlow для прикладного уровня.

  5. Как я должен практиковаться в процессе обучения?
    Проходите онлайн-курсы, выполняйте упражнения на этих курсах и заходите на форумы, чтобы общаться с другими, чтобы прогрессировать. Или участвуйте в соревнованиях по искусственному интеллекту, таких как Tianchi, и заставляйте себя практиковаться.

  6. Какой язык программирования подходит для разработки ИИ?
    Хотя у python есть много библиотек, и многие основные фреймворки используют интерфейс Pythen. Но только Pyhton недостаточно, Qiniu AI использовала в процессе разработки такие языки программирования, как C++ и GO.

  7. Нужно ли читать научные статьи?
    Является необходимым. В настоящее время время от научных исследований до внедрения технологии очень короткое, и необходимо идти в ногу с последними результатами научных исследований.

  8. Процесс разработки ИИ
    Соберите исходные данные — сделайте выборку, организуйте и сгенерируйте образцы — поместите их в вычислительный объект для обучения (выполните отладку гиперпараметров в процессе) — сформируйте модель (оцените, соответствует ли модель требованиям, пройдите еще одну партию выборочных тестов) — перейдите онлайн, если устраивает

Живой обзор

Прикрепил ссылку на живой отчет:
Освоение карты пути самообучения ИИ в одном классе (часть 1)
Освоение карты пути самообучения ИИ в одном классе (часть 2)

Спасибо за просмотр, критика и исправления приветствуются?