Команда Беркли интерпретирует проблемы и возможности для будущих систем искусственного интеллекта

машинное обучение дизайн Безопасность Архитектура

Тенденции и проблемы развития систем ИИ

1. Критически важные системы искусственного интеллекта

Тенденции: ** ИИ используется во все большем количестве жизненно важных приложений, таких как автономное вождение, машинная хирургия, домашняя автоматизация, и тесно связан с благополучием и жизнью человека.
**Задача: системы искусственного интеллекта должны постоянно учиться, взаимодействуя с динамическими средами, и принимать своевременные, надежные и безопасные решения.

2. Персонализированная система искусственного интеллекта

тенденция:Предоставление пользователям индивидуальных решений — от виртуальных помощников и автономного вождения до политических кампаний — становится все более важным при разработке систем ИИ. Персонализированные системы искусственного интеллекта учитывают поведение и предпочтения пользователя.
вызов:Разрабатывайте системы искусственного интеллекта, которые могут предоставлять персонализированные приложения и услуги без ущерба для конфиденциальности и безопасности пользователей.

3. Межорганизационные системы искусственного интеллекта

тенденция:Все больше и больше организаций используют сторонние данные для улучшения своих сервисов ИИ. Например, больницы обмениваются данными для предотвращения вспышек, а финансовые учреждения обмениваются данными для улучшения предотвращения мошенничества. Популярность этого варианта использования приведет к переходу от хранилища данных (где компания собирает данные, обрабатывает их и предоставляет услуги) к экосистеме данных (приложения ИИ могут использовать данные, принадлежащие разным организациям, для обучения и принятия решений). .
вызов:Создавайте системы искусственного интеллекта, которые можно обучать на наборах данных, принадлежащих разным организациям, без ущерба для конфиденциальности данных между организациями и в процессе преодоления потенциальных барьеров для конкуренции между организациями.

4. Спрос на ИИ превышает закон Мура

тенденция:Способность обрабатывать и хранить огромные объемы данных является важной предпосылкой успеха ИИ, но технологиям будет все труднее идти в ногу со скоростью, с которой генерируются данные. Во-первых, данные продолжают расти в геометрической прогрессии. Во-вторых, взрыв данных происходит в то время, когда наша когда-то быстро улучшающаяся аппаратная технология сталкивается с застоем.
вызов:Разрабатывайте специфичные для предметной области архитектуры и программные системы для удовлетворения потребностей в производительности будущих приложений ИИ в эпоху после принятия закона Мура, включая специализированные микросхемы для рабочих нагрузок ИИ, граничные облачные системы для эффективной обработки данных на периферии, а также методы упрощения и выборки данных. .

В ответ на эти вызовы в этом документе определены 9 будущих направлений исследований (R1-R9) в 3 основных областях (поведение в динамических средах, безопасный ИИ и архитектуры, специфичные для ИИ).

Отношения между тенденциями, вызовами и темами исследований.

Поведение в динамичной среде

Большинство будущих систем ИИ будут работать в динамических средах, что требует от систем ИИ быстрого и безопасного реагирования даже на сценарии, с которыми никогда раньше не сталкивались.

R1: продолжайте учиться

Системы ИИ, которые учатся в динамических средах, обычно используют структуру обучения с подкреплением (RL). Несмотря на недавний успех объединения обучения с подкреплением с глубокими нейронными сетями для разработки систем ИИ, которые могут работать в различных контекстах (например, AlphaGo победил чемпиона мира по шахматам), обучение с подкреплением не нашло широкомасштабного практического применения. Авторы считают, что достижения в алгоритмах обучения с подкреплением в сочетании с инновациями в дизайне систем будут способствовать разработке новых приложений обучения с подкреплением.

направление исследований:(1) Создавайте системы обучения с подкреплением, которые могут в полной мере использовать преимущества параллелизма, допуская при этом динамические графы задач, обеспечивая задержки на уровне миллисекунд и работая на разнородном оборудовании в строго установленное время. (2) Создайте систему, которая может полностью имитировать реальную среду, потому что реальная среда будет постоянно производить непредсказуемые изменения и работать быстрее, чем в реальном времени.

R2: Надежное принятие решений

Все больше и больше приложений ИИ заменяют человека при принятии решений, особенно в критически важных ситуациях. Важным критерием является то, что они должны быть устойчивыми к неопределенности и ошибкам при вводе и обратной связи.

Двумя наиболее важными концепциями надежности в системах ИИ являются: (1) способность к надежному обучению при наличии зашумленной и состязательной обратной связи, (2) надежное принятие решений при наличии непредсказуемых и состязательных входных данных.

направление исследований:(1) Обеспечьте детализированную поддержку источников в системах ИИ, связывая изменения в результатах (таких как награды или состояния) с источниками данных, вызвавшими эти изменения, и автоматически изучайте причинно-следственные модели шума для конкретных источников. (2) Разработка API и языковая поддержка для разработки систем, которые позволяют системе поддерживать доверительные интервалы для принятия решений, особенно для пометки непредвиденных входных данных.

R3: Объяснимые решения

В дополнение к предсказаниям и решениям по принципу «черного ящика», системы ИИ также должны давать понятные человеку объяснения своих решений. Область причинно-следственного вывода имеет большое значение в применении будущих систем ИИ, и эта область имеет естественную связь с системной диагностикой и исходными идеями в базах данных.

направление исследований:(1) Создайте систему ИИ, которая может поддерживать интерактивный диагностический анализ, воспроизводить предыдущие рабочие процессы и определять входные характеристики, ответственные за конкретные решения.Общий подход заключается в повторном выполнении задач принятия решений на предыдущих возмущенных входных данных, (2) как причинно-следственных. вывод обеспечивает поддержку системы.

Безопасный ИИ

Проблемы безопасности систем ИИ можно разделить на две категории: первая категория заключается в том, что злоумышленники ставят под угрозу целостность процесса принятия решений. Вторая категория — это когда злоумышленники изучают секретные данные для обучения системы ИИ или изучают секретные модели.

R4: Безопасный анклав

Чтобы предотвратить эти атаки, необходимо создать безопасные анклавы. Безопасный анклав — это безопасная среда выполнения, которая защищает приложения, работающие внутри анклава, от вредоносного кода, выполняющегося за пределами анклава.

направление исследований:Создание систем ИИ, использующих безопасные анклавы для обеспечения конфиденциальности данных, конфиденциальности пользователей и целостности решений, может быть достигнуто путем разделения кода системы ИИ на минимальную кодовую базу, которая выполняется внутри анклава, и код, который выполняется вне анклава. Убедитесь, что код внутри анклава не приводит к утечке информации и не ставит под угрозу целостность процесса принятия решений.

R5: Состязательное обучение

Адаптивный характер алгоритмов машинного обучения делает системы обучения уязвимыми для новых типов атак, которые ставят под угрозу целостность решений, злонамеренно изменяя обучающие данные или входные данные для принятия решений. Существует два основных типа атак: атаки уклонения и атаки отравления данных.

Атаки уклонения происходят на этапе логического вывода системы, когда злоумышленник пытается сгенерировать данные, которые система обучения неправильно классифицирует. Атаки с отравлением данных происходят на этапе обучения, когда злоумышленник вводит отравленные данные (например, данные с неправильной маркировкой) в набор обучающих данных, в результате чего обучающаяся система запоминает ошибочные шаблоны.

направление исследований:Создание систем искусственного интеллекта, устойчивых к входным данным со стороны противника на этапах обучения и прогнозирования, позволяет разрабатывать новые модели машинного обучения и сетевые структуры, которые используют источники для отслеживания поддельных источников данных и повторного принятия решений после устранения поддельных источников данных.

R6: Совместное изучение конфиденциальных данных

Сегодня компании и предприятия обычно собирают данные, анализируют их и используют эти данные для внедрения новых функций и продуктов. Однако не у всех организаций есть такой же объем данных, как у крупных ИИ-компаний. Мы ожидаем, что все больше и больше организаций будут собирать ценные данные, иметь доступ к большему количеству сторонних сервисов данных и обмениваться знаниями из данных между несколькими организациями.

Основная проблема совместного обучения заключается в том, как изучить модели на межорганизационных данных, обеспечив при этом, чтобы релевантная информация не просачивалась во время обучения. Существует три основных подхода: (1) объединить все данные в анклав жесткого диска, а затем изучить модель, (2) использовать безопасные многосторонние вычисления и (3) использовать дифференциальную конфиденциальность.

направление исследований:Создавайте системы искусственного интеллекта, которые (1) могут обучаться, используя источники данных, не раскрывая информацию об источнике данных во время обучения или тестирования, и (2) стимулируют потенциально конкурирующие организации делиться своими данными или моделями.

Архитектура, специфичная для ИИ

Потребности систем искусственного интеллекта стимулируют инновации в системных и аппаратных архитектурах. Целью этих новых архитектур является не только повышение производительности, но и упрощение разработки приложений искусственного интеллекта следующего поколения за счет предоставления богатой, легко компонуемой библиотеки модулей.

R7: аппаратное обеспечение домена

В то время как данные продолжают экспоненциально расти, технологические достижения «производительность-стоимость-энергия», которые двигали компьютерную индустрию на протяжении 40 лет, подходят к концу, и единственный способ продолжать улучшать процессоры — это разрабатывать процессоры для конкретной области.

направление исследований:(1) Разработка аппаратных архитектур для предметной области для повышения производительности, значительного снижения энергопотребления приложений ИИ и повышения безопасности этих приложений; Программная система искусственного интеллекта для технологии хранения сексуальных данных.

R8: Составные системы искусственного интеллекта

Модульность и композиция являются ключом к увеличению скорости и применения разработки ИИ, упрощая интеграцию ИИ в сложные системы.

направление исследований:Создавайте системы и API-интерфейсы ИИ, которые могут объединять модели и действия модульным и гибким образом, и используйте эти API-интерфейсы для разработки богатых библиотек моделей и опций, которые значительно упрощают разработку приложений ИИ.

R9: облачная пограничная система

В настоящее время в облаке развернуто большое количество сервисов приложений ИИ, таких как распознавание речи и языковой перевод. Мы ожидаем, что будущие системы искусственного интеллекта будут соединять облачные и периферийные устройства. Во-первых, системы искусственного интеллекта, развернутые в облаке, могут переносить некоторые функции на периферийные устройства для повышения безопасности, конфиденциальности, снижения задержек и безопасности. Во-вторых, системы искусственного интеллекта, развернутые на периферии, могут обмениваться данными и использовать вычислительные ресурсы облака для обновления моделей.

направление исследований:Чтобы спроектировать периферийную облачную систему искусственного интеллекта, (1) используйте периферийные устройства для сокращения задержек, повышения безопасности и внедрения технологии интеллектуального хранения данных, (2) используйте облако для обмена данными и моделями между периферийными устройствами, обучения сложных моделей, требующих больших вычислительных ресурсов. и принимать высокоэффективные качественные решения.

Расширенное мышление

(Комментарий профессора Мурата Демирбаса, Университет штата Нью-Йорк в Буффало)

1) В 2009 году Беркли опубликовал аналогичный документ с изложением позиции по облачным вычислениям (Above the Clouds: A Berkeley View of Cloud Computing). Эта статья представляет собой хорошее резюме и систематизацию идей облачных вычислений. Но 8 лет спустя план исследования в этой статье не очень хорошо работает. Планирование бесполезно, но планирование необходимо. Сферы интересов академического сообщества со временем менялись, соответственно менялись и направления исследований. В CS почти невозможно полностью спланировать исследовательские исследования и управлять ими (возможно, это возможно в биологии и науке).

4-е, 5-е и 6-е направления исследований, предложенные в статье, продвигаются хорошо, остальные направления исследований вялые, а проекты 2 и 9 имеют небольшой прогресс. Хотя следующие направления исследований не упоминаются в этом плане исследований, они действительно изменили процесс развития области облачных вычислений.

  • Преимущества рабочих нагрузок машинного обучения в облаке
  • Появление новых систем SQL, увеличение количества согласованных распределенных баз данных, важность координационных групп, алгоритмов Paxos и сервисов ZooKeeper в облаке.
  • Разрабатывайте онлайн-системы потоковой передачи данных и потоковой обработки, такие как Spark, от Berkeley.
  • Гонка за мелкозернистой виртуализацией с помощью контейнеров и функций как сервисов
  • SLA получает больше внимания

Даже если планы Беркли по исследованию систем искусственного интеллекта имеют смысл, мы должны обратить внимание на то, как эти планы будут развиваться в ближайшие несколько лет, и какие неожиданные исследовательские возможности откроет область систем искусственного интеллекта.

2) Ранее в этом году Стэнфорд опубликовал аналогичный документ с изложением позиции, но их документ был посвящен проблемам и идеям повторно используемых архитектур в машинном обучении. Проект Стэнфорда DAWN направлен на создание сквозных рабочих процессов машинного обучения, привлечение экспертов в предметной области и сквозную оптимизацию. На приведенной ниже диаграмме обобщаются их идеи многоразовой архитектуры машинного обучения:

Конечно, это также неизбежно отражает сильные и слабые стороны команды Стэнфорда: они лучше разбираются в базах данных, науке о данных и производственных исследованиях. Похоже, что есть некоторые точки соприкосновения с разделом «Архитектуры, специфичные для ИИ» в документе Беркли, но обе стороны предлагают разные подходы к одной и той же проблеме.

3) Для исследовательского направления устойчивого принятия решений R2, предложенного в статье, кажется, что формальные методы — моделирование, рассуждения на основе инвариантов — полезны, особенно когда управление параллелизмом становится распределенным развертыванием машинного обучения.

Оригинальная бумага:A Berkeley view of systems challenges for AI
Использованная литература:Paper summary: A Berkeley view of systems challenges for AI

благодарныйЦай ФанфанОбзор этой статьи.