Для получения дополнительных галантерейных товаров, пожалуйста, обратите внимание на публичный аккаунт WeChat «AI Frontline» (ID: ai-front)
Отказ от ответственности | Эта статья подготовлена исключительно AI Frontline и не может быть воспроизведена без разрешения!
Текстовая версия выглядит следующим образом:
Всем привет, меня зовут Венкель. Сегодня я очень рад использовать платформу Greedy Technology, чтобы поделиться с вами своим опытом и опытом в индустрии электронной коммерции.
Лично я раньше оказывал информационные услуги, связанные с данными, в KPMG в Южной Калифорнии, а затем я перешел в Revolve, которая является самой популярной в Лос-Анджелесе, и в компанию по электронной коммерции моды, очень популярную в Северной Америке, чтобы заниматься модой. связанные вещи; в прошлом году я прыгнул в Беверли-Хиллз, это винный бизнес электронной коммерции в Беверли-Хиллз, называется Напитки, это стартап.
Сегодня День богини (8 марта), предположительно, богини (рождения) не должны быть новичками в электронной коммерции. Таким образом, для коллег полезно иметь более глубокое понимание электронной коммерции. Итак, сегодня наша тема — новый фаворит электронной коммерции, то есть наука о данных и технология искусственного интеллекта. Эти две основные отрасли промышленности в последние годы переживают бурный рост, и электронная коммерция также должна оказывать им большую поддержку.
Итак, давайте посмотрим, что такое электронная коммерция, а также классификацию и статус-кво электронной коммерции в Северной Америке.
Что такое электронная коммерция? Я лично считаю, что следующее определение является более подходящим, оно одно: бизнес-модель, позволяющая фирме или частному лицу вести бизнес, то есть деловая сделка между бизнесом, компанией и физическим лицом через электронную сеть, как правило, мир широкая паутина, с которой мы знакомы, - это Интернет.
Электронная коммерция сейчас повсеместна. Можно сказать, что она проходит через продукты питания, одежду, жилье и транспорт каждого человека. Так же, как тележка для покупок на картинке справа, все можно отделить от нее. Сделки купли-продажи могут быть в тележка для покупок.выполнять или быть связанным с ней.
Давайте рассмотрим основные традиционные классификации электронной коммерции, их четыре категории:B2B, C2C, B2B и C2B. Один из двух самых важных его пунктов — это Business, то есть B означает бизнес-предприятие, а неотъемлемая часть — это наш Потребитель.
Одной из самых распространенных бизнес-моделей являетсяB2C,Так называемыйОперации купли-продажи между продавцами и физическими лицами. Вот несколько примеров: в Северной Америке должны быть знакомы два самых крупных из них: amazon.com и Netflix.
Акции amazon.com выросли с 900 юаней в прошлом году до 1500 или 1600 юаней в настоящее время, предполагается, что они быстро удвоятся, и их стоимость становится все выше и выше. Тогда Netflix - это видео, которое представляет собой бизнес электронной коммерции на основе видео. Раньше его отправляли с небольшого компакт-диска домой. Пока он является участником, пользователи могут выбирать фильмы бесплатно каждый месяц и менять фильмы, которые они хотят смотреть.Теперь это стало прямым Видео можно смотреть онлайн. Эти два в настоящее время являются наиболее типичными B2C.
С точки зрения традиционных отраслей, таких как Walmart, Walmart.co, Target, Best Buy и Best Buy, все они являются традиционными офлайн-отраслями розничной торговли, и теперь они не могут ждать, иначе они должны быть вынуждены делать это онлайн. com, вы также можете разместить заказ в Интернете, просмотреть продукты и перейти непосредственно в магазин для сопоставления.
Второй распространенный режимConsumer-to-Consumer,Так называемыйОбмен транзакциями между физическими лицами, Эта картинка довольно небрежна, но смысл должен быть понятен каждому.
Инициатором этого обмена между потребителями должен быть eBay.EBay.Люди размещают товары, которые они хотят продать, в Интернете.EBay предоставляет эту платформу, которая позволяет другим людям покупать и делать ставки на эти товары.
Здесь есть и другие примеры, такие как airbnb, популярная в последние годы компания-единорог в Bay Area, которая занимается сдачей в аренду простаивающих домов и личных пространств, забирает комнаты и дома, которые пользователи считают лишними или временно ненужными. , Его можно сдавать в аренду другим через эту платформу.
Etsy - это более интересный энтузиаст DIY, то есть веб-сайт для энтузиастов рукоделия, чтобы общаться с APP, Вы можете разместить свои произведения искусства и вещи ручной работы на этой платформе, чтобы другие энтузиасты рукоделия и художники могли обмениваться транзакциями друг с другом.
Uber всем должен быть хорошо знаком: как и Didi в Китае, Didi объединила свой китайский бизнес. Uber начинал как бизнес по заказу личных автомобилей или как временный водитель, чтобы помочь пользователям прокатиться. Теперь он открыл Uber Eesti и начал делать заказы на вынос, как и Meituan и Ele.me, он также может забирать и доставлять.
Здесь хотелось бы отметить ветерана amazon.com, который запустил сервис Prime now, а также начал пробовать услуги в сфере пищевой промышленности и общепита, можно продавать овощи и фрукты, а также пользователи могут открывать свои онлайн. магазины на амазоне.
Третий типBusiness-to-Business B2B, так называемая прямая коммуникация между продавцами, осуществляется на уровне предприятия..
Позвольте мне сначала привести пример: веб-сервисы amazon — это AWS, который также является сервисным центром облачных технологий при amazon.
Несколько основных отраслей, в которых AWS существует уже долгое время:
Первыйбаза данных, быстрые параллельные подключения к базам данных, такие как Redshift, которые находятся в облаке;
Второйместо хранения, S3 (Simple Storage Service), которое является облачным хранилищем, заявлено как неограниченное и может храниться без ограничений, пока вы платите; а такжеEC2(Elastic Compute Cloud) — это эластичные облачные вычисления. Они предназначены для серверов корпоративного уровня. Например, наша компания использует много серверов EC2 и Compute Cloud в облаке, поэтому нам не нужно открывать еще один компьютерный зал, сами или откройте центр обработки данных для хранения этих данных и веб-серверов, пока вы платите Amazon, он может гарантировать, что вы сможете работать без сбоев Это абсолютно прибыльный отдел Amazon.
Microsoft также открыла Microsoft Azure, облачное хранилище, услуги, связанные с облачными вычислениями, должны конкурировать с AWS, они также похожи по содержанию. Точно так же Google точно не будет сидеть сложа руки.Они также предоставляют услуги Google Analytics, но это немного другое: GA это не решение облачного сервера, это не решение этой проблемы, он в основном обеспечивает некое отслеживание, данные запись расхода. как сказать? Это эквивалентно каждому вашему движению на различных веб-сайтах электронной коммерции, например, где вы нажимаете, как долго вы просматриваете, какое устройство вы используете, будь то планшет или компьютер для просмотра, он будет записывать все эти действия пользователей. . Многие веб-сайты электронной коммерции будут использовать GA для соответствующей отчетности, то есть для анализа и обработки данных.
Другим примером здесь является Square, которая также является относительно интересной и новой моделью B2B, в основном используемой в малых и средних предприятиях, таких как фудтраки (мобильные фудтраки), которые очень распространены в Северной Америке.Вы можете использовать мобильный телефон терминал, а теперь есть услуги, которые используют NFC или Apple Pay, сетевое подключение и подключение 4G этих мобильных телефонов для считывания карты. Square взимает определенную плату за обслуживание, но это очень мобильно, очень мобильно и не необходимо специально подключить к POS-терминалу.
Последняя общепринятая классификацияПотребитель-бизнес, транзакции между покупателями и продавцами.
Вот несколько распространенных примеров:
Во-первых, это рекламное подразделение Google. Откройте бесплатные веб-страницы или бесплатные приложения в Северной Америке.Хотя многие веб-страницы или приложения считаются бесплатными, у них есть собственная реклама, и эта реклама предоставляется Google AdSense.
Например, некоторые ссылки на рекламу часто появляются в нижней левой или нижней правой ноге веб-страницы, обычно AdSense вносит автоматические решения, чтобы помочь отфильтровать рекламу, которые могут представлять для вас интерес. Объявления, которые вы нажимаете, на самом деле эквивалентны для того, чтобы помочь Google заработать некоторые рекламные сборы, но вы также используете бесплатные функции, поэтому вы фактически провели свое собственное время в обмен на бесплатные функции.
Следующие два примера следует лучше понять: Survey Monkey и Survey Gizmo предназначены для бизнес-опросов.После того, как пользователи завершат онлайн-опросы, продавцы будут платить за обратную связь, и соответствующие комиссионные будут поступать на эти две платформы. Как потребитель, если вы потратите время и свою личную информацию на проведение этих опросов, вы также можете получить определенную компенсацию, такую как дисконтные карты, купоны на скидку, ваучеры, не обязательно денежные вознаграждения, это С точки зрения потребителя зрения на сотрудничество между.
Давайте посмотрим на применение науки о данных и технологии искусственного интеллекта в электронной коммерции.
Наука о данных, как упоминалось здесь, также является наукой, управляемой данными, классом, управляемым данными, это межнаучный метод, обычно это комбинация различных алгоритмов и системных полей, используемых для предоставления данных в различных формах данных для обеспечьте поддержку и непрямой, как показано на схеме слева.
Вообще говоря, первым шагом в индустрии электронной коммерции является просмотр товаров перед компьютером, чтобы разместить заказ, положить его в корзину, затем провести картой и оплатить заказ.Когда получен следующий заказ, карта успешно проведена, и вам будет отправлено электронное письмо с подтверждением.И покупатели, и продавцы получают соответствующие электронные письма и отправляются на склад, чтобы упаковать и подготовить к доставке.
Весь процесс будет генерировать много данных, таких как данные о трафике, данные о трафике, такие как активность пользователя, то есть поведение пользователя, в том числе показы, просмотренный трафик показов; клик хотя, поведение кликов; сеанс - это сколько время, которое требуется Просмотр соответствующих элементов; Активность электронной почты — это трафик на стороне электронной почты, включая открытые клики, подписки или отказы от подписки, которые являются данными о трафике.
Существует несколько типов соответствующих данных о транзакциях: основным примером здесь является история заказов, которая представляет собой запись о размещении заказов и о том, какие вещи были куплены и проданы; членская подписка — это членская подписка, когда она началась, как долго она длилась. подписались, и какое это было членство.
Существует также информация о пользователе.Информация о пользователе является личной.Примеры, которые я привел здесь, являются демографическими и географическими. Демографический — это опрос населения, например пол, возраст и доход пользователя, где он живет, покупает ли он дом или есть ли у него автомобиль. Все это данные переписи населения. Географический — это географическая информация. Ваш обычный адрес проживания в большом городе., или в городах второго и третьего эшелона, или в пригородах, это географическая информация.
Точно так же у каждого клиента будут свои собственные данные о трафике/транзакциях, которые представляют собой информацию о просмотре и данные о транзакциях заказа. В электронной коммерции существует множество различных типов данных, здесь применяется технология искусственного интеллекта для обработки данных, которая предназначена для извлечения знаний и некоторых полезных идей из данных.
Рассмотрим подробнее еще три интересных примера.
Amazon GO был официально открыт для широкой публики в начале этого года;
Smart Speaker теперь является нашим популярным умным динамиком;
Наставник Netflix Artwork также упомянул, как давать рекомендации и рекомендации о фильмах на уровне пользователя.
Amazon GO — это автоматический магазин, и у Alibaba также есть соответствующий автоматический магазин в Китае, который, по оценкам, представляет собой аналогичную техническую форму.
Amazon Go в настоящее время открывает пробную версию в Сиэтле, и говорят, что есть очередь, чтобы войти, потому что слишком много людей хотят это увидеть.
Как показано на этом рисунке, в этом магазине нет конкретного продавца, который будет производить расчеты при выходе.Его основная технология, я проверил соответствующую информацию здесь, говорят, что есть некоторые поведения Computer Vision для динамического распознавания и глубокого обучения для Судя по действиям, существуют также различные датчики и слияния датчиков для определения членства и предметов.
Когда вы входите в дверь, вам необходимо загрузить приложение Amazon GO. После сканирования вы можете использовать этот датчик, чтобы узнать, что представляет из себя пользователь, связанную информацию, что он купил и является ли он участником или не членом. После сканирования QR-кода пользователь может войти. После входа везде на потолке должны быть камеры, не отражающиеся на фотографиях, но каждое ваше движение должно быть полностью записано.
Давайте сначала посмотрим на динамическое распознавание Computer Vision, в чем суть этой технологии?
Основным техническим ядром Computer Vision является использование сверточной нейронной сети, которая называется Convolutional Neural Network.
Вот простой пример, начиная с самого основного, обычно это изображение, английский язык, его можно разделить на три цвета: RGB; иногда у вас могут быть какие-то картинки, какая-то прозрачность: RGBA. Каждый RGB, красный, зеленый и синий будут иметь соответствующие значения.Свертка фактически создает заполнитель (фильтр) для цвета каждого слоя.
Здесь я привожу пример: используя фильтр 3×3, фильтр означает, что вы хотите извлечь особенности (признаки) каждого угла кадра из каждого угла кадра изображения, как описано на рисунке, это будет 3×3 filter задает шаг (количество шагов) слева направо. Количество шагов здесь должно быть 1, слева направо и затем сверху вниз. После того, как все слои будут удалены, соответствующий слой будет упрощен в один Convolved Feature — это уменьшенная матрица. Затем этот тип матрицы обычно можно использовать в качестве сверточных слоев, то есть Convolved.
Для свертки путем применения фильтров, подобных этому, вы также можете использовать простой максимальный пул, чтобы напрямую получить максимальное значение. Примером здесь является фильтр 2 × 2 и двухэтапное развертывание в каждом поле 2 × 2. Возьмите наибольшее значение в поле, как это поле, мы берем 6, соответствующие 8, и берем наибольшее значение значения в каждом слое. Этот подход должен помочь нам уменьшить всю картину и извлечь различные особенности различных цветов изображения.
Отсюда мы видим, что если использовать разные фильтры и разные шаги, то можно получить уменьшенное матричное изображение, а затем мы можем поместить соответствующие слои, выполнить свертку и объединение и поместить их в разные матрицы, чтобы их можно было прямой вывод на следующий слой Нейронная сеть может извлекать соответствующие функции со всех углов и направлений.
Примером здесь является то, что может сделать сверточная нейронная сеть.После разделения статического изображения на 3 слоя каждый слой выполняет свертку и максимальное объединение, а затем извлекает свой самый большой признак, а затем повторяется несколько раз.Свертка и максимальное объединение могут быть объединены в разными способами, обычно это должно работать. Подойдите к задней части, сожмите их все дальше и, наконец, скажите, есть ли на этой картинке собаки или кошки, или лодки и птицы.
Каждая идентификация имеет значение вероятности.Чем выше значение вероятности, тем выше вероятность, а это означает, что вероятность всех предметов на картинке больше, или можно сказать, что какие предметы находятся на картинке, здесь лодка. Видно, что у нее есть две лодки.
Только что упомянутая сверточная нейронная сеть является суждением о статической картинке, и она может судить о том, что на ней изображено. На самом деле все в Amazon GO движутся. Выбирая товары, они ходят. использовать динамическое распознавание сверточной нейронной сети CNN.
Алгоритм динамического распознавания также имеет историю и быстро развивался в течение последних десяти лет. Кратко представим скользящие окна с самого начала, алгоритм скользящего окна, его концепция такова: в каждом статическом изображении определите окно как фильтр, в этом окне слева направо, сверху вниз. При непрерывном сканировании каждое окно сделает суждение, и каждое маленькое окно имеет соответствующую картинку, чтобы судить, есть ли в нем какой-либо предмет, который я хочу. Вот бы определить есть ли машина.
The form in the sliding form algorithm can basically fix the sweep, until the scan to the target object, such as the match degree of this car is zero nine, then you can find the highest probability of this window, and confirm this inde There is автомобиль.
Недостаток этого алгоритма в том, что он будет очень неэффективен, так как в начале большое изображение разбивается на множество маленьких изображений, а непрерывное сканирование также является проблемой для вычислительных мощностей, потому что требуется много времени для непрерывного сканирования и сканирование, чтобы определить, какое изображение, скорее всего, содержит этот элемент.
Более популярный в последние годы алгоритм называется YOLO, то есть You Only Look Once, просто взгляните на него. Это значит дать вам картину, образец определенного периода, и вы сможете быстро судить об объектах на картине.
Как это достигается? Суть в том, чтобы проанализировать картинку по сетке (сетке), и разделить ее на множество мелких сеток, и судить, где в каждой сетке будет находиться центр тяжести предмета. Давайте используем этот автомобиль в качестве примера, чтобы определить, где находятся эти центры тяжести. Он также определит, есть ли целевой объект в мелкой сетке, и если есть, то обеспечит высокую вероятность.
Когда все эти маленькие окна, которые нашли машину, объединяются в большое окно, то нужно установить соответствующее пороговое значение, если пороговое значение превышает определенную величину, это означает, что у предмета действительно есть маленькое окно. Когда все маленькие окна соединены, будет получена более крупная картина. Точно так же CNN будет использоваться для вынесения суждения, чтобы определить, была ли вероятность увеличена или уменьшена, чтобы вы могли знать, что большая картина собрана воедино каждым маленькая картинка должна быть цельным товаром.
Конечно, есть еще много сложных процессов, например, вы можете обнаружить, что другие кадры также могут отражать автомобиль, вы можете соединить множество мелких сеток, или вы можете получить относительно полный объект, вы можете определить, какой прямоугольник лучше всего представляет пункт.
В общем, с помощью алгоритма YOLO можно добавить самый популярный GPU, быстро извлечь динамическую картинку из небольшого кадра предмета, определить, что это за предмет, является ли он человек или товар. , вы можете быстро определить, взял ли что-то пользователь на этом изображении.
Давайте продолжим смотреть на патент, Amazon подала заявку на соответствующие патенты в 2014 году.
Видно, что каждый товар имеет номер, камера и сеть имеют связанные коды, а видеорегистратор и камера могут обрабатываться в режиме реального времени Каждый раз, когда покупатель подходит к другой полке, он берет код товара. соответствующую полку. , после того, как пользователь возьмет ее, система узнает, существует ли еще предмет, изменится ли его вес, а также изменится соответствующее ему изображение.
Каждый предмет будет иметь свой соответствующий код, который может помочь системе определить, был ли предмет изъят. Поэтому здесь много источников данных для суждения о товарах.Во-первых, суждение по картинкам, полученным из сверточной нейронной сети, а также по изменениям веса и давления, есть ли что-то в отсеке предмета, тоже можно комбинировать с прошлым пользователя. Записи транзакций, чтобы определить, является ли это транзакционным поведением.
Глубокое обучение, которое является глубоким обучением, также может быть использовано здесь, В качестве входных данных можно судить о том, купил ли пользователь или приобрел поведение, или нужно ли вернуть его, чтобы принять соответствующее решение.
Перейдем к умному динамику.
С 2014 года Amazon инвестировала много денег в разработку Alexa, продукта для умных динамиков, и тогда все обнаружили, что этот рынок особенно хорош Google также запустил Google Assistant, а Microsoft также выпустила динамик в 2016 году. t кажутся особенно известными; до прошлого года Amazon предлагала обновленную версию и запускала продукты Show and Look с камерами; Apple также запустила собственный Homepod, который также является умной колонкой, и, похоже, он будет запущен в этом году. Обновленная версия привязана к Siri, соответственно Samsung также запустила Bixby, и он часто упоминается в рекламе.
Умные колонки — очень популярные продукты, и крупные технологические гиганты электронной коммерции запустили соответствующие продукты, чтобы помочь каждому размещать заказы, покупать и продавать товары в Интернете. Итак, давайте сосредоточимся на Amazon Echo, самом новаторском продукте, или умных колонках, которые открыли этот рынок только после Echo.
Функции Echo теперь очень мощные.Его можно подключить к различным приложениям мобильного телефона в графическом виде, слушать музыку, слушать радио, слушать новости, смотреть телевизор и звонить в машину.Его можно использовать дома для смотрите Amazon fireTV, Бытовыми приборами, такими как температурные переключатели, а также выключатели света в доме, можно управлять с помощью интеллектуальных динамиков.
Основная техническая база, которую мы должны здесь увидеть, — это распознавание и анализ речи. Распознавание голоса осуществляется через английский, китайский или другой арабский или японский язык, чтобы умные динамики могли понять, что вы хотите сделать.
Вот введение в технологию распознавания речи, которая быстро развивается в последние годы:
С самого начала соответствующие фонемы, извлеченные из каждого голосового диапазона, такие как голосовые диапазоны на этом рисунке, называются фонемами, и каждая фонема извлекает особенности, такие как гласные и согласные нашего пиньинь, а также некоторые другие репрезентативные произношения. извлеките эти элементы и соберите их вместе в соответствующие слова или фразы. Сначала это была относительно инженерная технология распознавания речи. Теперь она была разработана для использования RNN, которая представляет собой рекуррентную нейронную сеть.
Рекуррентная нейронная сеть отличается от традиционной нейронной сети тем, что она рекурсивна, что означает: каждый нейрон (см. рисунок выше), они связаны друг с другом, a предыдущего слоя, который является функцией активации, это обработанный вывод может быть напрямую выведен в следующую функцию, чтобы ее можно было повторять непрерывно. При этом для каждого соответствующего входа в каждый нейрон соответственно будут поступать разные слова и фразы, но эти нейроны связаны с предыдущими нейронами, более сложной сетью, можно сказать, что они связаны в положительном направлении, Это также возможно общаться друг с другом с противоположной стороны.
В окончательной обученной сети каждый нейрон будет выводить значение, такое как Y1Y2, и определять, что представляет каждый Y. Если вам нужно извлечь такие имена, как «Плюшевый мишка», вывод может быть представлен следующим образом: 0011000. Теперь для более сложной ситуации Y можно превратить в вывод целого вектора, который находится в тезаурусе. Например, значение, соответствующее «Тедди», равно 1, а другие нерелевантные слова в тезаурусе будут оценены как 0.
Смысл в том, что он судит о том, что произношение определенного слова на соответствующем этапе близко к соответствующему слову. Он напрямую пропускает более традиционный шаг фонемы, и прямо по длине и ширине всего голоса можно судить о том, что представляет собой звуковой файл. Это примерный принцип работы распознавания голоса.
С помощью распознавания голоса мы можем дополнительно идентифицировать соответствующий текст и выполнять НЛП, анализ естественного языка и семантический анализ.
Семантический анализ также является очень популярным предметом и может выполнять различные действия, например самые распространенные:
Статистика частоты слов, подсчитайте, сколько раз частота слов появляется в определенном файле или документе с помощью формулы, или подсчитайте их в этой статье или во всей библиотеке, сделайте уровень его частоты появления, а затем рассчитайте его ортогональную статистику частоты слов. . При этом соответствующие данные могут быть введены как данные.
NER — это распознавание именных объектов, которое представляет собой распознавание элементов, связанных с именами и существительными.
POS — это часть речи, часть анализа речи, как подлежащее, сказуемое и дополнение в китайском языке, которые являются прилагательными, существительными и местоимениями в английском языке.
N-грамм - это частота сочетаний слов, например: Кот - это слово, Бегущий кот - это словосочетание, выполняется двумя словами, то есть 2-грамм, N-грамм - это добыча этих высокочастотных сочетаний слова.
Встраивание слов очень интересно.Он может классифицировать каждое слово в соответствии с их категорией.Например,мужчина и женщина могут быть классифицированы в соответствии с полом и т.д.Его можно расширить как вектор корреляции.Это встраивание слов,и каждому слову дано более глубокий смысл.
С их помощью мы можем проводить дальнейший анализ, например, эмоциональный анализ, нравится или не нравится, положительный цвет — это отрицательный цвет, как в некоторых системах подсчета очков, используется эмоциональный анализ.
Вы также можете продолжать использовать GloVe/Word2Vec, используя Word Embedding, чтобы расширить слово в соответствующее векторное пространство, чтобы вы могли оценить компоненты всего предложения или конкретное значение, выраженное в части контента, или сделать суждение. предсказание того, что будет дальше.
Также могут быть разработаны чат-боты.С помощью этих методов НЛП вы можете общаться с реальными людьми или решать некоторые простые проблемы реальных людей. Например, включать и выключать свет, включать телевизор, извлекать из анализа речи нужные ключевые моменты и добиваться выполнения желания.
Давайте в последний раз взглянем на обложку Netflix.
Это также очень интересный пример использования науки о данных и технологии искусственного интеллекта. Слева на картинке выше - известный научно-фантастический сериал в Северной Америке.Основной сюжет в том, что дети отправляются исследовать нереальный космос, от реального к нереальному.
Как следует продвигать эти плакаты среди различных групп людей? Здесь вы можете извлечь соответствующие иллюстрации из каждого сюжета фильма в виде постеров.Друзья, которые любят фильмы ужасов, могут увидеть кровавые или огненные; зрители, которые любят детей, могут увидеть плакаты с множеством детей; Для определенной звезды вас должно интересовать его личный постер в качестве фаната.
Здесь необходим эффективный рекомендательный механизм, чтобы рекомендовать пользователям После просмотра этого рекламного плаката пользователи хотят нажать, чтобы играть?
Традиционный метод заключается в том, чтобы сначала собрать данные, построить модель, провести различные A/B-тестирования, а затем официально создать модель и выполнить ее на внешнем интерфейсе. Это время на самом деле долгое время, в краткосрочной перспективе это может занять несколько недель, это может быть несколько месяцев. За этот промежуток времени предпочтения пользователя могут сильно измениться.Возможно, после окончательного запуска модели вкус пользователя в этот момент времени отличается от ранее предсказанного вкуса пользователя, и модель не ясна.Расхождение, не добиться нужной функции, либо не порекомендовали что-то, что очень понравилось пользователю.
Последний алгоритм Netflix — это средство обучения с подкреплением, называемое обучением с подкреплением, Его главная особенность заключается в том, что его можно быстро повторять и постоянно оптимизировать.
Давайте посмотрим, как это реализовано.С самого начала его основная идея проста: алгоритм Multi-Arm Bandit определяет состояние в RL, и с помощью функции вознаграждения Q это будет Get what the reword is. Как и у этого осьминога, каждый шаг будет иметь разные последствия.Каждый из них подобен игровому автомату, запускающему игровой автомат A и игровой автомат C. Он может проиграть или выиграть оба, и значение будет разным.
Формула на рисунке выше определена здесь: Сила должна быть равна вознаграждению плюс будущая сила, умноженная на γ. Если γ равно 0, ожидаемое значение в будущем не будет учитываться, а вознаграждение, полученное в прошлый раз, будет осуществляться таким образом, а другие возможности рассматриваться не будут.
Теперь кажется, что лучший способ добиться этого — использовать алгоритм под названием Contextual Bandit, алгоритм внешней полосы пропускания.
Контекстный на самом деле определить пользователя как переменную среды, Каждый пользователь имеет разный опыт и предпочтения, поэтому здесь мы усложняем формулу только сейчас и добавляем скорость обучения, что означает, что будущее клиента Q, Необходимо достичь эффекта предсказания посредством моделирования.
После добавления скорости обучения, если α равно 1, вы можете удалить обе стороны и заменить их алгоритмом MAB прямо сейчас. Если модели не нужно слишком много думать о будущем, то используйте простой алгоритм оптимизации прямо сейчас, и выбирайте модель, которая каждый раз становится наиболее эффективной по результатам каждого раза; если вы хотите, чтобы модель RL обучалась больше и исследуйте больше неизвестных неизвестных в будущем. В этом случае, если предположить, что α не равно 1, эффект Q' может быть отражен в это время. Q' использует модель, похожую на глубокую нейронную сеть, для прогнозирования. Примером здесь является использование в качестве входных данных записей просмотров клиентов, личного опыта и, возможно, некоторой соответствующей информации, такой как возраст и пол. Может быть, вы можете получить много информации о клиентах, может быть, миллионы, и использовать этот метод для обучения глубокому обучению этой информации.
Пример, который я привожу здесь, — это торговля на фондовом рынке, с соответствующим бюджетом и акциями, а также с записями транзакций, может создать сеть глубокого обучения, она может принять решение: нужно ли вам покупать или продавать, или держать. В качестве примера, вот окончательный прогноз, который может использовать Q' в качестве будущего дохода. Со всей системой вы знаете недавнюю доходность, а затем можете предсказать будущую доходность.Конечно, этот Q слишком элементарный, и его можно официально использовать после непрерывной итерации.Моделирование учитывает больше переменных, и оно повторяется быстрее.