оригинал:к data science.com/expensive-to-the…
Автор: Инсаф Ашрапов
Переводчик: kbsc13 (общедоступный номер: рост алгоритмических обезьян)
предисловие
Учебные ресурсы, рекомендованные в этой статье, основаны на моем личном опыте, и они очень полезны для расширения ваших знаний в области теории компьютерного зрения. Кроме того, лучше узнать и изучить машинное обучение и Python, прежде чем изучать теорию компьютерного зрения.
Рамка
Приступая к изучению компьютерного зрения, не обязательно выбирать использование фреймворка, но необходимо применять вновь полученные знания.
Других рекомендаций для фреймворков нет:
- pytorch:pytorch.org/tutorials/
- Керас (TensorFlow):www.tensorflow.org/guide/keras
Pytorch может потребовать больше кода для написания, но он более гибкий, поэтому его лучше использовать, и все больше и больше исследователей глубокого обучения начинают использовать этот фреймворк.
Albumentation(улучшение изображения) иcatalyst(фреймворк, обертывающий высокоуровневый API pytorch) также очень полезен, поэтому используйте их, особенно первый фреймворк для улучшения изображений —Albumentation.
аппаратное обеспечение
- Моделей Nvidia GPU 10XX+ более чем достаточно (около 300 долларов)
- Ядра Kaggle:www.kaggle.com/kernels, еженедельно бесплатно…30 часов;
- Колаб Google:colab.research.google.com/, каждый сеанс имеетОграничение на 12 часов, недельный лимит бесплатного времени неизвестен.
Теория и практика
онлайн-курсы
- CS231n:cs231n.stanford.edu/, онлайн-курс по выбору, это…На Youtube есть видеокурсы, в них есть и внеклассные занятия, но выполнять их не рекомендуется (хотя это бесплатно);
- Fast.ai:course.fast.ai/, второй курс стоит посмотреть. …Это также высокоуровневый фреймворк, обертывающий pytorch, но они часто меняют свой интерфейс API и не имеют документации, поэтому это не рекомендуется. Но просмотр их обучающих видеороликов стоит потраченного времени на изучение теории и забавных трюков.
При изучении этих курсов рекомендуется реализовывать эти теории через рекомендуемую структуру.
Документы и код
- arxiv.org/: Интернет для бесплатного доступа к последним статьям…
- paperswithcode.com/sota: демонстрирует глубокое обучение…
- GitHub.com/topics/comp…
книги
Книг не слишком много для чтения, за исключением следующих двух книг, которые я считаю очень полезными, вы можете выбрать pytorch или keras для реализации кода
- Deep Learning with Python:Woohoo. Amazon.com/deep-learn я…Разработчик Keras, исследователь Google AI — Франсуа Шолле. Это не бесплатная книга, но ее легко понять, и она может почерпнуть много новых знаний, о которых раньше не было известно;
- Deep learning with Pytorch:py torch.org/deep - ах, позволь тебе...Эли Стивенс и Лука Антига из команды pytorch
Kaggle
URL-адрес:Woohoo.Карты Reformed.com/competition…
Kaggle — известная онлайн-платформа для соревнований по машинному обучению, которая содержит различные типы соревнований, многие из которых являются соревнованиями по компьютерному зрению. Еще до прохождения курса вы можете начать участвовать в конкурсе, потому что с начала конкурса вы можете бесплатно запускать множество публичных ядер (публичный сквозной код).
более сложные пути обучения
Другой путь обучения может быть очень сложным, но вы можете научиться не только обучать модели и прогнозировать результаты, но и проводить собственные исследования, как у Сергея Белоусова aka bes.
Все, что нужно сделать, это прочитать и реализовать все приведенные ниже документы, и, конечно же, просто здорово их читать.
сетевая структура
- AlexNet: Бумаги.Грязевой Бодхисаттва.Цао Цао/бумага/4824-…
- ZFNet: АР Вест V.org/ABS/1311.29…
- VGG16: АР Вест V.org/ABS/1505.06…
- ResNet: АР Вест V.org/ABS/1704.06…
- GoogLeNet: АР Вест V.org/ABS/1409.48…
- Inception: АР Вест V.org/ABS/1512.00…
- Xception: АР Вест V.org/ABS/1610.02…
- MobileNet: АР Вест V.org/ABS/1704.04…
Семантическая сегментация
- FCN: АР Вест V.org/ABS/1411.40…
- SegNet: АР Вест V.org/ABS/1511.00…
- UNet: АР Вест V.org/ABS/1505.04…
- PSPNet: АР Вест V.org/ABS/1612.01…
- DeepLab: АР Вест V.org/ABS/1606.00…
- ICNet: АР Вест V.org/ABS/1704.08…
- ENet: АР Вест V.org/ABS/1606.02…
Генеративно-состязательные сети (GAN)
- GAN: АР Вест V.org/ABS/1406.26…
- DCGAN: АР Вест V.org/ABS/1511.06…
- WGAN: АР Вест V.org/ABS/1701.07…
- Pix2Pix: АР Вест V.org/ABS/1611.07…
- CycleGAN: АР Вест V.org/ABS/1703.10…
Обнаружение цели
- RCNN: АР Вест V.org/ABS/1311.25…
- Fast-RCNN: АР Вест V.org/ABS/1504.08…
- Faster-RCNN: АР Вест V.org/ABS/1506.01…
- SSD: АР Вест V.org/ABS/1512.02…
- YOLO: АР Вест V.org/ABS/1506.02…
- YOLO9000: АР Вест V.org/ABS/1612.08…
сегментация экземпляра
- Mask-RCNN: АР Вест V.org/ABS/1703.06…
- YOLACT: АР Вест V.org/ABS/1904.02…
Оценка осанки
- PoseNet: АР Вест V.org/ABS/1505.07…
- DensePose: АР Вест V.org/ABS/1802.00…
резюме
Эта статья представляет собой некоторые из ресурсов, рекомендованных первоначальным автором для начала работы с компьютерным зрением, включая рекомендуемые платформы глубокого обучения, курсы, электронные книги, веб-сайты для просмотра статей и кода, а также веб-сайт конкурса kaggle;
Существует также более сложный путь обучения, который заключается в чтении классических статей, от структуры сети до общих направлений компьютерного зрения, обнаружения, сегментации, GAN и оценки позы, но после завершения награды будут больше, не только использовать структуру обучить модель, решить задачу и иметь возможность развиваться в направлении исследования.
Код этой статьи может подписаться на мою официальную учетную запись, а затем ответить в фоновом режимеДокументы по компьютерному зрениюПолучить тезис.
Эксклюзивный мастер-код ИИ My DiDi Cloud: 9192, купите DiDi Cloud GPU и другие продукты ИИ и введите мастер-код, чтобы получить скидку 10%. Нажмите www.didiyun.com, чтобы перейти на официальный сайт Didiyun для покупки.
Добро пожаловать в мой общедоступный аккаунт WeChat--Рост алгоритма обезьяны, или отсканируйте QR-код ниже, чтобы общаться, учиться и развиваться вместе!