Приветствую всех вОблако Tencent + сообщество, получить больше крупной технической практики Tencent по галантерее ~
Эта статья написанаОблачный центр искусственного интеллекта TencentОпубликован вКолонка «Облако + сообщество»
Гуо Лу, старший менеджер по продуктам Tencent, старший менеджер по продуктам и архитектор решений в центре базовых продуктов Tencent Cloud AI. Возглавлял разработку двух продуктов Tencent Intelligent Titanium TI-ONE (платформа визуального машинного обучения) и TI-S (платформа автоматизированного машинного обучения). После окончания Шанхайского университета Цзяотун по специальности распознавание образов и интеллектуальные системы, он последовательно работал в IBM и PricewaterhouseCoopers в области ИТ-архитектуры и консалтинга.Он глубоко понимает сочетание машинного обучения с бизнес-сценариями, такими как финансы и розничная торговля, помогая студентам Узнайте, как использовать инструменты для решения задач машинного обучения в реальном бизнесе.
Как мы все знаем, искусственный интеллект на данном этапе очень популярен, и исследователи тоже хотят войти в эту область.Что такое искусственный интеллект? У нас есть образная метафора, иллюстрирующая то, что называется искусственным интеллектом.
Искусственный интеллект устроен так: процесс приготовления риса — это процесс машинного обучения, рис — это большие данные, а рис — это искусственный интеллект. Одним словом, процесс обработки массивных данных посредством машинного обучения и окончательного формирования модели — это искусственный интеллект. Говоря о конкретных примерах, массивные данные AlphaGo поступают из различных шахматных записей, и он становится искусственным интеллектом, играющим в шахматы посредством машинного обучения.
Машинное обучение — это слово, но на самом деле за ним стоит множество вещей, таких как предварительная обработка, извлечение признаков, моделирование данных, оценка модели и так далее. В процессе моделирования помимо алгоритма выбора параметров есть много важных звеньев. Более важной частью этого процесса является разработка признаков.Хорошая модель или нет, зависит от того, хороша ли разработка признаков или нет.
Почему искусственный интеллект так популярен? По сравнению с традиционной бизнес-аналитикой (BI) искусственный интеллект более точен. В прошлом бизнес-аналитика реализовывала анализ и обработку больших данных, разница в том, что BI в основном обнаруживал правила данных через людей, а ИИ — через правила машин. Один из наших коллег как-то сказал, что когда правил более 10 миллионов, машины могут превзойти экспертов. Это предложение говорит о том, что характеристикой машинного обучения является точность.
ИИ определяет правила в данных с помощью машинного обучения, и эффект более точен, чем у людей, и есть 4 ограничения для использования ИИ для решения проблем.
Первое условие – бизнес-сценарий. Наш нынешний искусственный интеллект не является сильным искусственным интеллектом, и он не может решать никаких задач, как в фантастических фильмах. Одной из предпосылок для решения проблем с машинным обучением является преобразование бизнес-задач в задачи моделирования с помощью машинного обучения.Такие проблемы можно решить с помощью ИИ, поэтому бизнес-сценарии особенно важны.
Второе условие — массивные данные. Наш текущий принцип машинного обучения основан на статистике для изучения правил в данных. Основываясь на истории данных и статистике, мы обнаруживаем правила, а затем используем эти правила для прогнозирования данных в будущем. Для обнаружения правил в исторических данных требуются массивные данные, которые должны быть многофункциональными, неповторяющимися и высококачественными.
Третье условие – талант. Это включает в себя таланты в области алгоритмов, таланты, которые внедряют алгоритмы в инженерии, таланты, которые производят продукты, и таланты, которые интегрируют ИИ и бизнес-системы.Все эти люди являются талантами ИИ.
Четвертое условие – технические возможности. Включает вычислительные ресурсы, хранилище, сеть и интеграцию с бизнес-системами. ИИ не имеет ценности для бизнеса, если его нельзя интегрировать в корпоративные бизнес-системы.
Я только что упомянул четыре элемента машинного обучения.Далее я проиллюстрирую, как эти четыре элемента отражаются в различных сценариях.
В области управления рисками массивные данные включают данные о транзакциях клиентов, данные черного списка, данные клиентов, данные учетных записей клиентов и т. д. Все эти данные дают нам характеристики различных измерений. Мы используем ИИ для контроля рисков. Например, ИИ используется, чтобы определить, является ли транзакция по кредитной карте мошеннической транзакцией, или когда кредитная карта собрана, чтобы определить, насколько сильна готовность клиента погасить долг. Эти проблемы могут быть преобразованы в регрессию. или проблемы с классификацией. Таким образом, некоторые бизнес-сценарии в области контроля финансовых рисков трансформируются в ряд конкретных технических задач, которые можно решить с помощью моделирования машинного обучения.
В области маркетинга массивные данные включают в себя портреты клиентов, поведение клиентов, каталоги продуктов, данные о маркетинговой деятельности, данные о результатах маркетинга (например, исторические продажи определенного типа продукта определенным клиентам, успешные или неудачные) и т. д. Мы помещаем эти данные Отправьте его машине, чтобы узнать, какой продукт с большей вероятностью будет успешным, а какой тип клиентов добиться успеха нелегко, это то, что мы должны сделать. Когда дело доходит до деловых проблем, например, пробуждения от сна, многие клиенты в банках и компаниях электронной коммерции могут не иметь бизнеса в течение двух или трех лет после открытия счета.Это клиенты сна.Если они используют некоторые маркетинговые методы, таких как отправка вам текстовых сообщений или рекомендации рекламных мероприятий, чтобы увидеть, могут ли они снова сделать клиентов активными в банках или электронной коммерции.Другим примером является персонализированная рекомендация продуктов.После того, как многие люди покупают мобильные телефоны на JD.com, JD.com будет рекомендовать такие продукты, как пленки для мобильных телефонов, наушники, карты памяти и т. д. Эти рекомендации будут основаны на рекомендациях других пользователей или истории покупок пользователя и других продуктах, связанных с продуктом.
В области здравоохранения массивные данные включают данные о поведении пациентов, данные о рецептах, данные истории болезни и т. д. Использование этих данных для прогнозирования заболеваний, таких как прогноз диабета, прогнозирование вероятности диабета через два или три года на основе данных пациентов — это ИИ. сценарий применения.
Последний сценарий — ИИ плюс производство, которое также необходимо на многих фабриках.ИИ используется для улучшения процесса или снижения затрат.Здесь массивные данные будут включать параметры станка (выходные параметры каждого отдельного оборудования во время обработки), данные процесса и сценарии, включая выполнение некоторых интеллектуальных измерений с помощью машинного обучения, чтобы решить проблему, связанную с необходимостью определять, когда некоторые люди не могут туда попасть.
В разных бизнес-сценариях данные ИИ и бизнес-задачи ИИ различаются. Однако, условно говоря, таланты ИИ (включая таланты моделирования и инженеров), а также вычислительные ресурсы и вычислительные возможности ИИ являются общими, и процесс моделирования каждого сценария в целом схож.
В то же время таланты и вычислительные возможности ИИ иерархичны. ИИ должен пройти четыре уровня от теоретических исследований до возможности применения в инженерии. Ближайший к бизнесу уровень — это модель, а затем — алгоритм. Проблема поднимается, ее можно получить путем отладки на уровне алгоритма. Модели нельзя использовать напрямую. Как создать замкнутый цикл данных, необходимо реализовать на инженерном уровне или на уровне продукта. Что касается вычислительной среды и уровня вычислительных ресурсов, то при обучении моделей предстоит решить еще много инженерных проблем, включая интеграцию алгоритмов и источников данных, журналы обучения и мониторинг ошибок, планирование задач и многое другое. Эти проблемы не имеют большого значения для бизнеса, но технически сложны и имеют длительный цикл реализации, что создает определенные трудности для традиционных предприятий в использовании ИИ и обладании возможностями ИИ.
Мы разделяем таланты в области ИИ на 4 категории в соответствии с их уровнем зрелости: первая — это AI Geek, от построения базовых вычислительных ресурсов до внедрения вычислительной среды, до написания вышеуказанных алгоритмов, включая настройку модели, которая может быть выполняется одним человеком. , таких людей очень мало, а эффективность не обязательно высока, потому что всю работу приходится делать заново.
Второй тип — это исследователи ИИ, которые хорошо знакомы с определенными типами алгоритмов и могут сами писать более сложные алгоритмы. Однако они могут не очень хорошо понимать лежащую в основе вычислительную среду, например, то, как управляются графические процессоры, если алгоритм написан хорошо, а нижний уровень передается инженерам, которые принадлежат исследователям ИИ.
Третий тип-практики ИИ.Большинство студентов здесь находятся на этом уровне.Характеристики этого раздела:знание всего процесса моделирования;также возможность использовать некоторые алгоритмы с открытым исходным кодом для обучения модели,надеясь получить лучший алгоритм изучение пользовательских интерфейсов, которые не нужно моделировать из фреймворка, или для каждого взаимодействия требуется командная строка.
Последний — это персонал, применяющий ИИ, который хочет получить рабочую модель напрямую, не заботясь о принципе модели, надеясь напрямую получить модель из бизнес-данных для решения бизнес-задач.
В соответствии с указанными выше различиями столь многих уровней пользователей нам необходимо предоставлять дифференцированные решения, продукты и услуги для различных требований пользователей.
Начнем с нижнего уровня: для исследователей ИИ, которым необходимо предоставить вычислительные ресурсы, планирование задач и управление вычислительными ресурсами, он пишет собственные алгоритмы.
Вторая категория — специалисты по ИИ, которые должны моделировать себя и вносить небольшие изменения в алгоритм. Кроме того, они заботятся о том, как интегрироваться с бизнес-системой после построения модели и как реализовать замкнутый цикл данных. Цикл данных предназначен для предотвращения распада модели и обеспечения возможности итеративного обучения модели для сохранения эффекта после выхода в сеть.Это также то, о чем будут заботиться пользователи на этом уровне.
Следующим уровнем является приложение ИИ. Приложение ИИ требует автоматического обучения модели, автоматического анализа данных и автоматического проектирования функций. После завершения обучения модели оно автоматически развертывается как услуга. Лучше всего произвести тонкую настройку модели, то есть добавить некоторые данные для адаптации к новым сценариям.
Мы предоставляем дифференцированные продукты для клиентов на разных уровнях. TI-A в крайнем левом углу — это ускоритель глубокого обучения, в основном для ускорения обучения моделей. Наша скорость очень высока. Использование платформы TI-A в облаке может помочь пользователям достичь глубоких Ускорение обучения. А после того, как модель обучена, ее можно развернуть одним щелчком мыши, что также решает проблему того, как модель можно применить к бизнес-сценариям и как делать прогнозы после обучения.
Промежуточный продукт, TI-ONE, представляет собой интеллектуальную универсальную платформу машинного обучения из титана.Он имеет визуальный пользовательский интерфейс.Пользователи могут сразу увидеть весь рабочий процесс моделирования и увидеть взаимосвязь потока данных и зависимости каждой ссылки. Этот продукт позволяет пользователям легко моделировать и имеет множество встроенных алгоритмов.
В крайнем правом углу находится TI-S, который характеризуется полностью автоматической и черной технологией. Он не требует пользовательского моделирования. Просто дайте ему данные, и он может предоставить вам пригодную для использования модель. Это действительно моделирование одним щелчком мыши. модель обучена, ее можно развернуть как приложение.
Далее давайте подробнее рассмотрим конкретные функции умных изделий из титана. TI-ONE поддерживает машинное обучение, глубокое обучение и анализ моделей.Машинное обучение включает в себя инструменты для загрузки данных, предварительной обработки, разработки функций, выбора функций и некоторых конкретных алгоритмов позже. Глубокое обучение включает в себя некоторые уже написанные алгоритмы нейронных сетей, а также некоторые упакованные алгоритмы для некоторых бизнес-сценариев, таких как алгоритмы машинного зрения, обработка естественного языка и так далее.
В части вывода модели для модели, обученной с помощью машинного обучения, последующая обработка включает развертывание модели, управление моделью, мониторинг модели, проверку модели и т. д.
TI-A относительно прост, включая некоторые библиотеки нейронных сетей для глубокого обучения и функции вывода моделей Пользовательский интерфейс использует облегченный клиент, а консоль поддерживает мониторинг моделей и задач.
Обучение модели и развертывание TI-S выполняется автоматически в фоновом режиме.Пользователям нужно только загрузить данные, а TI-S автоматически завершает обработку данных, разработку функций, выбор алгоритма и оптимизацию параметров.
Интеллектуальная платформа титана снижает порог для предприятий, чтобы получить возможности ИИ: с точки зрения структуры, интеллектуальная платформа титана имеет встроенное множество основных сред, что избавляет пользователей от необходимости самостоятельно интегрировать структуру; с точки зрения алгоритмов, благодаря встроенной - в алгоритме пользователям экономится много работы по написанию алгоритмов; настройка модели С точки зрения оптимизации графический интерфейс интеллектуальной титановой платформы может помочь пользователям выполнять настройку алгоритма с более гибкими методами планирования и настройки параметров; с точки зрения оптимизации. управление моделью, интеллектуальная титановая платформа может помочь пользователям построить замкнутый цикл данных, который может быть построен только с помощью самого алгоритма. Это может быть реализовано только на обученной модели. Приобретенные напрямую приложения ИИ обычно не поддерживают замкнутый цикл данных. В условиях совместной работы интеллектуальная платформа титана поддерживает совместное использование моделей и алгоритмов командами.
Используя интеллектуальный титан в качестве ядра, предприятия также могут создать экосистему разработчиков.Разрабатывая приложения на этой платформе, разработчики могут сэкономить много тяжелой работы на нижнем уровне и могут реализовать замкнутый цикл модели через эту платформу. Кроме того, Tencent обладает относительно сильными техническими возможностями и сервисами алгоритмов, а также относительно богатыми сервисами данных, которые могут помочь разработчикам улучшать приложения ИИ. В нижней части облачной платформы относительно много вычислительных ресурсов, а для разработки и эксплуатации ИИ требуется много вычислительных ресурсов.
Эта диаграмма представляет собой рамочную диаграмму самообновления модели.Самостоятельно строить модели ИИ сложно, поэтому многие компании готовы покупать приложения ИИ напрямую, но при возникновении следующих ситуаций они должны строить свои собственные модели. Во-первых, если сценарий задачи, который вам нужно решить, уникален, а не простое распознавание лица или распознавание голоса, например, на многих производственных предприятиях, значения, которые необходимо измерить в производственном процессе, уникальны, в этом случае только построить свою собственную модель. Во-вторых, данные уникальны, и вы не хотите их публиковать. Моделирование требует много данных.Например, в только что упомянутом распознавании речи ИИ, поскольку нет корпуса диалектов, нет хорошей модели распознавания диалектов. Тогда, если вам нужна модель ИИ, и этой модели нужен производитель, чтобы помочь вам в обучении, то вы должны как минимум дать ему соответствующие данные. Однако в вашей собственной компании есть некоторые прикладные данные, которые другие не могут купить, и вы не хотите их вывозить.В настоящее время вам приходится моделировать их самостоятельно. В-третьих, модель необходимо постоянно обновлять. Самостоятельное обновление очень важно во многих сценариях. Поскольку модель будет разрушаться, необходимо добавлять новые данные для адаптации к новой ситуации. Для модели, построенной самостоятельно, в первую очередь , данные ваши собственные.Войдите на платформу обучения через платформу маркировки, платформа находится в вашем собственном компьютерном зале, и все модели здесь рассчитаны на платформе. После того, как шина данных между платформой и бизнес-системой подключена, фактически может быть сформирован замкнутый цикл модели и замкнутый цикл данных для удовлетворения требований самообновления модели.
Случаи применения платформы: Текущие кейсы нашей платформы включают в себя: контроль рисков в финансовой сфере, маркетинг и оптимизацию операций на основе NLP и OCR и т. д. Сфера образования сотрудничает с университетами или организаторами мероприятий, чтобы обеспечить конкуренцию на основе Платформа Окружающая среда и обучающие ссылки и т. д., в коммерческой сфере, помогите компании по недвижимости оптимизировать уровень обслуживания управления недвижимостью, в промышленной сфере, помогите компании метро сделать обнаружение аномалий на путях и оборудовании транспортных средств. Большинство из вышеперечисленных сценариев являются особыми, и такие модели могут быть обучены только платформой машинного обучения.
Q&A
Q1: Как Tencent определяет ИИ? От самого раннего распознавания ИИ до системы больших данных моделирование помещается в ИИ, а теперь это больше о глубоком обучении и машинном обучении, я не уверен.
A1: Голос, включая малые и микропредприятия, относится к уровню приложения ИИ.Для приложения ИИ используется платформа и структура ИИ, а также вычислительные ресурсы ниже. Наша платформа позиционируется как базовая платформа ИИ, которая представляет собой инструмент моделирования, который может предоставить инструменты, необходимые для машинного обучения и моделирования глубокого обучения.
Q2: Изменяется ли машинное обучение в принципе? Можете ли вы обучать модели машинного обучения и глубокого обучения с помощью Matlab?
A2: Принцип машинного обучения не изменился. Глубокое обучение эволюционировало из нейронных сетей. Когда количество слоев нейронной сети становится больше, оно становится глубоким обучением. Использование Matlab для обучения модели в принципе не проблема и алгоритм, но от Перспектива мышления, нынешнее мышление машинного обучения отличается от того, что было в прошлом.Раньше это было уменьшение размерности, но теперь это увеличение размерности из-за ограниченной вычислительной мощности. Теперь, если нейросеть имеет десятки слоев, объем вычислений очень большой, поэтому для глубокого обучения необходимо использовать GPU, если для обучения использовать матлаб, будут проблемы с вычислительной мощностью, и обучение не пройдет. вне.
вопросы и ответы
Каковы конкретные применения машинного обучения и искусственного интеллекта в эпоху Индустрии 4.0?
Связанное Чтение
Ван Цзюнь: обмен голосовыми технологиями Smart Speaker
Искусственный интеллект, машинное обучение, глубокое обучение, концентрические отношения между тремя
Эта статья была разрешена автором для публикации в сообществе Tencent Cloud + Для получения дополнительных оригинальных текстов, пожалуйстанажмите
Найдите и подпишитесь на общедоступную учетную запись «Сообщество Yunjia», получите технические галантереи как можно скорее и ответьте на 1024 после подписки, чтобы отправить вам подарочный пакет технических курсов!
Огромный технический практический опыт, все вСообщество Юнцзя!