Сила искусственного интеллекта в основе искусственного интеллекта (ИИ) — маркировка данных

искусственный интеллект
Сила искусственного интеллекта в основе искусственного интеллекта (ИИ) — маркировка данных

000.png

Хотя с ростом популярности ИИ мы все больше и больше полагаемся на искусственный интеллект в своей жизни, связанные с ним насмешки над «искусственной умственной отсталостью» никогда не исчезали.

Я полагаю, что все знают, что если мы хотим, чтобы ИИ точно идентифицировал птиц на изображении, нам нужно вручную пометить эти фотографии как птиц в наборе данных, а затем позволить алгоритму и изображению произвести корреляционную оценку и распознавание.

001.png

Если с мелкомасштабными экспериментальными данными все в порядке, однажды возникнет потребность в метках миллионов масштабов, затраченное время будет невообразимым.

Так называемый «кто получает данные, получает искусственный интеллект», искусственный интеллект уже давно распространен в нашей жизни, такие как «разблокировка отпечатков пальцев», «распознавание лиц» и так далее, все относятся к категории искусственного интеллекта, но вышестоящие основные отрасли искусственного интеллекта, маркировка данных менее известна. Что такое аннотация данных?

Прежде чем узнать о маркировке данных, давайте узнаем об искусственном интеллекте.

Искусственный интеллект (ИИ), сокращенно ИИ. Это новая техническая наука, изучающая и разрабатывающая теории, методы, приемы и прикладные системы для моделирования, расширения и расширения человеческого интеллекта. Он пытается понять сущность интеллекта и создать новую интеллектуальную машину, которая может реагировать аналогично человеческому интеллекту.Исследования в этой области включают робототехнику, распознавание языка, распознавание изображений, обработку естественного языка и экспертные системы. С момента рождения искусственного интеллекта теория и технология становились все более и более зрелыми, а область применения также продолжала расширяться.Возможно, что технологические продукты, принесенные искусственным интеллектом, в будущем станут «контейнером» человека. интеллект.

Искусственный интеллект фактически является частичной заменой когнитивных функций человека. Алгоритмы искусственного интеллекта — это алгоритмы, управляемые данными, то есть, если вы хотите добиться искусственного интеллекта, вам сначала нужно научить компьютеры способности людей понимать и оценивать вещи, а затем позволить компьютеру изучить эту способность распознавания.

По аналогии с машинным обучением, мы должны научить его распознавать кошку, и прямо дать ему изображение кота, а он совершенно не представляет, что это такое.

002.png

Мы должны сначала получить изображение кота со словом «кошка», а затем машина запоминает особенности большого количества изображений. что это кошка..

003.png

И обучающий набор, и тестовый набор помечены данными.В качестве примера возьмем кошек, предположим, что у нас есть 1000 изображений с пометкой «кошка», тогда мы можем сделать 800 изображений в качестве обучающего набора и 200 изображений в качестве тестового набора. Машина запоминает модель из 800 картинок кошек, а затем распознает оставшиеся 200 картинок, которые машина раньше не видела, и тогда мы можем получить точность этой модели.

Поэтому в настоящее время искусственный интеллект нуждается в маркировке большого количества данных, то есть маркировке данных исходной информации.

Аннотирование данных — это процесс обработки изображений, голосов, текстов и других данных посредством классификации, рисования рамок, аннотаций, аннотаций и т. д., а также маркировки характеристик объектов как основных материалов для машинного обучения.

Аннотации данных являются ключевым звеном для эффективной работы большинства алгоритмов искусственного интеллекта. Маркировка данных заключается в том, чтобы пометить данные, которые должны быть распознаны и выделены машиной, а затем позволить компьютеру постоянно изучать характеристики этих данных и, наконец, понять, что компьютер может распознавать их автономно. Сценарии применения маркировки данных

1. Интеллектуальная безопасность Интеллектуальная безопасность является ключевой областью в сочетании искусственного интеллекта и информационных технологий, что имеет большое значение для развития городов и средств к существованию людей. Благодаря биометрии, мониторингу поведения и другим техническим средствам он широко используется в мониторинге городских дорог, мониторинге транспортных потоков, предотвращении общественной безопасности и других областях.

Аннотация лица в основном используется для распознавания лиц и идентификации личности в интеллектуальной безопасности.

004.png

Распознавание лиц, также известное как распознавание портретов и распознавание лиц, представляет собой биометрическую технологию, которая собирает изображения лиц разных возрастных групп, ракурсов, выражений и света на основе информации о чертах лица человека для полного распознавания личности. Технологии, задействованные в распознавании лиц, в основном включают компьютерное зрение, обработку изображений и т. д.

005.png

Применение распознавания лиц (применение технологии визуального распознавания) в Китае примерно прошло через процесс расширения из области общественной безопасности в сферу бизнеса. Сначала эту технологию использовали для проверки личности аэропорты, вокзалы и отели, а затем коммерческие банки стали использовать распознавание лиц для удаленного открытия счетов. После этого один за другим появлялись платежи по лицу и контроль доступа по лицу, а распознавание лиц постепенно проникало из нескольких ограниченных сценариев в повседневную жизнь людей.В настоящее время технология распознавания лиц широко используется во многих областях, кроме к интеллектуальной безопасности.Он также используется во многих областях, таких как финансы, правосудие, общественная безопасность, пограничный контроль, аэрокосмическая промышленность, электроэнергетика, образование, медицинское обслуживание и так далее.

Кроме того, маркировка элементов должна сочетаться с маркировкой поведения в интеллектуальных приложениях безопасности.

006.png

2. Интеллектуальный транспорт В последние годы, с появлением искусственного интеллекта, в нашу жизнь вошли беспилотное вождение и интеллектуальные системы безопасности дорожного движения.Многие отечественные компании вложили средства в исследования автоматического вождения и беспилотного вождения.Например, «Беспилотное вождение Baidu», запущенное компанией План Baidu «Car», его самоуправляемый автомобиль Apollo собственной разработки, также появился на Гала-концерте весеннего фестиваля CCTV 2018 года.

В процессе автономного вождения, если алгоритм самого автомобиля должен справляться со все более и более сложными сценариями, за ним должны стоять огромные объемы реальных дорожных данных. И это должно полагаться на аннотацию данных.

007.png

Кроме того, есть интеллектуальная парковка, которая также зависит от вмешательства аннотации данных искусственного интеллекта, сбора видео вождения, извлечения дорожных условий и маркировки мест для парковки, включая препятствия в виде облака точек D, светофоры, огни полосы движения и высокоточные карты. Предоставляйте точные обучающие данные для распознавания пешеходов, распознавания транспортных средств, распознавания светофоров, распознавания линий полосы движения и других технологий для сопровождения интеллектуального транспорта.

3. Умное здравоохранение Интеллектуальное медицинское обслуживание заключается в реализации взаимодействия между пациентами и медицинским персоналом, медицинскими учреждениями и медицинским оборудованием путем построения региональной медицинской информационной платформы для медицинской документации и использования самых передовых технологий Интернета вещей, а также постепенного достижения информатизации. Ожидается, что сочетание искусственного интеллекта и медицинской промышленности приведет к стремительному развитию.

Маркировка медицинских изображений — это маркировка областей и классификация медицинских изображений, которая в основном используется для помощи в клинической диагностике. Изучая большое количество наборов данных аннотаций медицинских изображений, искусственный интеллект поможет врачам ставить клинический диагноз и предлагать планы лечения.

008.png

Те, кто получает данные, получают искусственный интеллект Основные области применения алгоритмов искусственного интеллекта сосредоточены на трех аспектах: компьютерное зрение, распознавание/синтез речи и обработка естественного языка.

С точки зрения изображений: недавно разработанный алгоритм компьютерного зрения требует от десятков тысяч до сотен тысяч помеченных изображений для обучения, для разработки новых функций требуется около 10 000 изображений для обучения, а для обычного алгоритма оптимизации также требуются тысячи изображений. приложения в умных городах, существует устойчивый спрос на сотни тысяч изображений каждый год.

С точки зрения голоса: совокупное применение наборов данных маркировки ведущими компаниями достигло более одного миллиона часов, и ежегодный спрос по-прежнему растет с темпом роста 20–30%. профессиональные акустические знания, опыт маркировки данных, но также иметь способность алгоритма синтеза речи.

Обработка естественного языка: с дальнейшим взрывом прикладных продуктов ИИ в промышленности, медицине и образовании будет больше методов взаимодействия, а спрос на естественную семантическую обработку данных будет продолжать расти, и ожидается, что он станет третьим по величине. после изображения и голоса добавочный рынок.

Сколько интеллекта, столько и искусственных

Почти все эти массивные данные аннотируются вручную аннотаторами данных.Разрыв в отрасли аннотирования данных значителен, и аннотирование данных широко используется в различных отраслях, и отрасль начала постепенно модернизироваться и становиться индустриализированной.

009.png

В индустрии маркировки данных популярна поговорка: «Столько интеллекта, сколько рабочей силы».

В новой статье Принстонского университета, Корнельского университета, Университета Монреаля и Национальной академии статистических наук, опубликованной недавно, указывается, что большая часть этой ручной маркировки проводится за пределами США и других западных стран и применяется к работникам по всему миру. Мир жестоко эксплуатируется.

Возьмем в качестве примера компании по маркировке данных, такие как Sama (ранее Samasource), Mighty AI и Scale AI. Они в основном используют рабочую силу из стран Африки к югу от Сахары и Юго-Восточной Азии и платят своим сотрудникам всего 8 долларов (что эквивалентно 51,6 юаня) в день.) . Но в то же время эти предприятия могут получать огромную прибыль в десятки миллионов долларов каждый год.

Современный ИИ опирается на алгоритмы для обработки миллионов примеров, изображений или текстовых материалов. Но перед этим персоналу сначала необходимо вручную пометить объекты в наборе данных изображения, а затем передать алгоритму большое количество помеченных изображений, чтобы изучить закономерность и научиться точно идентифицировать объект. Этот трудоемкий, утомительный и отнимающий много времени процесс ручной маркировки данных стал важной частью экономики ИИ.

В будущем, поскольку сценарии приложений ИИ постепенно становятся многодоменными, в индустрии маркировки данных специалисты-практики также выйдут на этап погони за рыночным сегментом вместе с индустрией ИИ.Можно сказать, что возможности и проблемы идут рука об руку.Прошлые преимущества

Подпишитесь на официальный аккаунт [Pegasus Club], ответьте на соответствующие ключевые слова, чтобы упаковать и загрузить учебные материалы; ответьте «присоединиться к группе», присоединитесь к Pegasus AI, big data, группе обучения менеджеров проектов и развивайтесь вместе с выдающимися людьми!

Ответить номер "1" Скачать От входа до исследования 10 самых достойных чтения материалов в области искусственного интеллекта (скачать прилагается)

Ответ номер "11" 50 книг: искусственный интеллект ИИ/большие данные/базы данных/линейная алгебра/Python/машинное обучение/Hadoop

Номер ответа «12» Xiaobai | Python+Matlab+машинное обучение+глубокая нейронная сеть+теория+практика+видео+курсы+исходный код, с загрузкой!

Ответ номер "14" Xiaobai | Книги по машинному и глубокому обучению, которые обязательно нужно прочитать + боевое видео по машинному обучению / PPT + рекомендация книги по анализу больших данных!

Ответить номер "29" галантерейные товары | 28 сборников электронных книг больших данных/анализа данных/интеллектуального анализа данных для бесплатного скачивания!

Ответ номер "16" 100G Python от начального до опытного! Для самостоятельного изучения необходим полный набор видеоуроков + классические книги по python!

Ответьте на номер «36» с 286-страничным PDF-файлом, чтобы научить вас понимать алгоритмы, теории и вычислительные системы глубокого обучения! (загружаемый)

Ответьте на номер «37», чтобы загрузить ограниченное время | 265G python полный набор видеоуроков, от начального до продвинутого до навыков прохождения собеседования!

Ответ на номер «38» | Последняя глава новой книги Ву Энда «Тоска по машинному обучению» 1-58 (скачать в формате pdf)

Ответ номер "46" 700 страниц "Глубокого обучения для графики" (с кодом и загрузкой)

Ответ на номер "47" рекомендацию хорошей книги | 106 страниц китайской версии "Python Advanced" (с загрузкой)