Как Ant Financial обеспечивает конфиденциальность и искусственный интеллект?

искусственный интеллект

За последние 15 лет Ant Financial переформировала платежи и изменила жизнь, предоставляя услуги более чем 1,2 млрд человек по всему миру, что неотделимо от поддержки технологий. На конференции Yunqi в Ханчжоу в 2019 году компания Ant Financial поделилась с участниками пятнадцатью годами накопления технологий и перспективными инновациями в области финансовых технологий. Мы собрали отличные выступления и опубликуем их в "Муравей Финансовые технологии«По официальным данным, эта статья — одна из них.

В эпоху искусственного интеллекта данные — это масло в области ИИ. Без данных сложно реализовать ИИ лучше. Однако хранилища данных препятствуют сбору и использованию данных.Компания Ant Financial начала развертывать машинное обучение с сохранением конфиденциальности три года назад и привержена машинному обучению с целью защиты безопасности данных и защиты конфиденциальности, которую мы называем общим интеллектом. мы поделились раньшеИдея и принцип общего интеллекта, Сегодня мы хотим поговорить о тенденциях развития и применения разделяемого интеллекта.

Текущая проблема с искусственным интеллектом заключается в том, что вы не можете иметь и то, и другое, то есть трудно сбалансировать конфиденциальность и удобство использования. Если вы хотите, чтобы ваша система искусственного интеллекта работала, вам, возможно, придется пожертвовать конфиденциальностью. Однако в большом количестве реальных сценариев, если конфиденциальность и удобство использования не могут учитываться одновременно, это приведет ко многим трудностям при реализации ИИ.

Чтобы привести несколько примеров.

Во-первых, контроль кредитного риска.Если пользователь хочет купить дом и взять кредит в банке, он может быть оценен как «плохой человек» в банке А, и нет никакой возможности одолжить ему кредит, потому что это учреждение хранит часть данных этого человека, и тот же пользователь переходит в учреждение Б, это учреждение Б может предоставить ему кредит на основании некоторых имеющихся у него данных.Таких противоречий много, и все они вызваны пробелами в данных.

В сфере умного медицинского обслуживания не так много случаев некоторых редких заболеваний в каждой больнице.Если мы сможем разделить случаи разных больниц, то сможем получить больше выборочных данных, чтобы использовать ИИ для более точной диагностики, но эта технология не является высшим приоритетом в этом случае.Для больницы она отвечает за защиту конфиденциальности пациентов.Как гарантировать, что конфиденциальность пользователя не будет раскрыта при совместном использовании случая, является первой проблемой, которую необходимо решить.

Проблема хранилищ данных повлечет за собой множество подобных проблем при внедрении и применении ИИ.

В реальной среде данные в этом графе недоступны, в некоторых местах могут быть какие-то краткосрочные связи, и большая часть данных в этом графе разъединена. Наша цель — прорваться сквозь хранилища данных и использовать технические методы для решения технических проблем. В случае защиты безопасности данных с помощью технологий реализуется совместное использование данных и передача ценности.

Общий интеллект: доступный невидимый

Для совместного использования данных цель, которую мы надеемся достичь, состоит в том, чтобы данные были доступны и невидимы.В сценарии, в котором участвуют несколько сторон, а поставщики данных и стороны платформы не доверяют друг другу, они могут собирать информацию от нескольких сторон для машинного обучения. , а также гарантировать, что конфиденциальность каждого участника не будет скомпрометирована.

Для достижения этой цели мы использовали множество существующих в отрасли технологий, таких как дифференциальная конфиденциальность, которая была исследована академическими кругами, доверенная среда выполнения, которую изучают многие поставщики больших данных, а также с улучшением вычислительной мощности и аппаратные технологии + криптография Прорывные и широко ценные многосторонние безопасные вычисления и т. д. В некоторых случаях целевые данные относительно малы, но исходные полевые данные относительно велики.Мы используем метод трансферного обучения для обмена данными, который также относится к нашей большой технической категории.

Конкретно,первый вариантЭто решение для доверенной среды выполнения. Оно в основном опирается на безопасный анклав среднего аппаратного уровня. Обе стороны шифруют данные с помощью некоторых криптографических механизмов. После шифрования их можно расшифровать только в сейфе. После расшифровки выполняются различные вычисления. Поскольку сейф является доверенным сторонним сейфом, если вы не доверяете друг другу, вы можете просто доверять сейфу, чтобы вы могли использовать все виды алгоритмов ИИ без утечки конфиденциальных данных.

Эта схема опирается на доверенное оборудование и передает его на доверенную платформу централизованно посредством шифрования данных. Для некоторых учреждений они уже мигрировали в облако, хранят все в облаке и развернули все технологии в облаке.Этот метод очень быстрый и удобный, и в то же время он может дать хороший эффект защиты конфиденциальности.

Второй вариантЭто решение на уровне программного обеспечения, мы обрабатываем данные в середине, а затем вычисляем их. Например, в технологии разделения секрета после разделения данных несколько сторон завершают операцию, отправляя случайные числа, а затем могут выполняться различные вычисления и модели ИИ; существуют также такие методы, как гомоморфное шифрование, в соответствующих операциях выполняются в зашифрованном пространстве для завершения расчета ИИ, а в середине есть модуль управления для совместного выполнения цели обучения. Этот метод сам по себе не требует аппаратного обеспечения.Это частичная схема программного обеспечения + криптография.Промежуточные результаты представляют собой случайные числа/зашифрованные промежуточные результаты.В настоящее время в направлении сочетания конфиденциальности + ИИ в отрасли эта схема относительно используется .

Туманность: Общая разведывательная сеть

Совместная разведка требует участия нескольких сторон.Мы разработали архитектуру сети совместной разведки Nebula.Для Ant Financial мы надеемся построить такую ​​общую сеть разведки с партнерами.

В сети есть различные вычислительные узлы, которые можно активировать на определенной платформе управления для реализации вычислений ИИ. Эта общая информационная сеть может использовать различные технологии для достижения цели совместного использования интеллекта.Например, для создания совместной маркетинговой сети узлы могут быть произвольно объединены в сеть, а многосторонняя технология безопасных вычислений может использоваться для достижения совместного маркетинга. в то же время узлы управления могут быть развернуты где угодно. ; Некоторые учреждения могут не иметь мощных возможностей ИИ и возможностей многосторонних вычислений, поэтому они могут полагаться на такие технологии, как облако, для размещения данных в доверенной среде выполнения для участия в построении такой сети.Поделитесь интеллектуальными технологиями, чтобы решить проблему последней мили посадки ИИ.

Архитектура всего нашего вычислительного узла показана на рисунке выше: нижний уровень похож на обычную среду, левая сторона представляет собой множество доверенных сред выполнения, а правая сторона — это обычная среда процессора и графического процессора. Выше будет единый уровень API, чтобы скрыть эти разные детали.

Далее будут локальные вычисления.Сами эти вычисления будут немного отличаться от общей среды с открытым исходным кодом.Мы изменим популярную версию на безопасную версию, такую ​​как безопасный XGBoost. При выполнении MPC в середине мы будем предоставлять различные технологии, такие как запутанные схемы, OT и т. д., а верхний уровень предоставляет некоторые визуальные и интерактивные интерфейсы.Обычные пользователи могут выполнять сложные многосторонние приложения с помощью таких вызовов. операция. Он также поддерживает различные выводы модели безопасности с сохранением конфиденциальности.

Мы надеемся завершить обмен интеллектуальными технологиями с помощью такой архитектуры и создать визуальный интерфейс, который может быстро и эффективно завершить построение всего расчета ИИ путем перетаскивания.

Вышеупомянутая общая интеллектуальная архитектура теперь достигла целей большей полноты, простоты использования и стабильности и была реализована во многих местах. С точки зрения полноты, мы достигли полных функций и полных сценариев.В настоящее время мы в основном поддерживаем контроль рисков и другие типичные сценарии искусственного интеллекта.Алгоритмы внутри являются относительно комплексными, охватывая линейные модели, древовидные модели, глубокое обучение, графовые нейронные сети и другие направлений; с точки зрения простоты использования мы надеемся лучше продвигать эту технологию моделирования, в то же время «защищая» некоторые базовые технологии (доверенная среда выполнения, многосторонние безопасные вычисления и т. д.), чтобы снизить стоимость обучения и использование; С одной стороны, мы реализуем кластеризацию общих интеллектуальных вычислений и поддерживаем удаленную эксплуатацию и обслуживание.

Мы запустили совместную аналитику на платформе аналитики больших данных. Демонстрация ниже представляет собой демонстрацию моделирования ИИ многосторонних безопасных вычислений.

Предыдущая часть предварительной обработки выглядит так же, как обычное моделирование ИИ.После предварительной обработки данных с помощью операций перетаскивания они отправляются в разделяемое интеллектуальное моделирование, которое будет генерировать результаты операций ИИ. Таким образом, можно значительно снизить порог использования новых технологий, что удобно для деловых сторон.

Ant Financial работает в области совместного использования интеллекта более трех лет, опубликовала более 10 статей и получила более 80 патентов.Что касается стандартных проектов, мы установили международные стандарты совместного использования данных IEEE и ITU-T MPC. , отраслевые стандарты общих разведывательных данных CCSA и стандарты альянса общих разведывательных данных AIOSS / AIIA развиваются одновременно, и они также получили несколько наград за инновации.

Общий интеллектуальный посадочный кейс

Далее представлены три типичных случая посадки.

Один находится в области контроля рисков безопасностии сотрудничать с экологическими партнерами для создания сети контроля рисков безопасности. Эко-партнеры используют представленную выше технологию доверенной среды выполнения для шифрования и передачи данных в сеть для построения этой модели, борьбы с поддельными транзакциями, групповыми преступлениями и т. д., значительно повышая точность контроля рисков и реализуя очистку контроля рисков. сеть. С помощью такой сетевой платформы управления рисками продавцы могут ежедневно добавлять множество транзакций, сокращая при этом капитальные потери.

Во-вторых, это Zhonghe Rural Credit., Мы значительно улучшили эффективность контроля рисков за счет объединения данных и превратили исходный традиционный автономный режим в онлайн-режим автоматического просмотра.Продление кредита занимает всего 5 минут, а совокупный кредит составляет 3,19 миллиарда долларов за 8 месяцев, и количество успешных кредитов составляет 440 000 человек., его бизнес охватывает более 20 провинций, более 300 уездных городов и более 10 000 деревень, помогая реализовать инклюзивное финансирование в сельской местности.

В-третьих, совместный контроль кредитного риска с Jiangsu Bank., помните наш предыдущий пример? Из-за неполных данных принятие решений по управлению рисками является неправильным.Теперь, благодаря совместному использованию интеллектуальных технологий, обе стороны могут завершить построение общей модели.Благодаря этому механизму может быть реализован совместный контроль рисков, что значительно улучшает эффект. . В то же время в этом процессе эффективно защищаются пользовательские данные и конфиденциальность.

В целом, мы хотим построить открытую и совместно используемую интеллектуальную сеть и надеемся, что больше партнеров и организаций примут участие в строительстве, разрушат хранилища данных и помогут лучше внедрить и применить технологию ИИ.

OceanBase возглавила список тестов TPC-C и добилась нулевого прорыва в китайских базах данных Хотите узнать технические подробности, стоящие за этим? Добро пожаловать на скачивание электронной книги«Анализ технологии тестирования OceanBase TPC-C», нажмите и удерживайте, чтобы определить следующий QR-код, следуйте«Муравьиные финансовые технологии»Официальный публичный аккаунт и ответ в диалоговом окне"ТПКК", Вы можете скачать это бесплатно.