Введение
Федеративное обучение определяет структуру машинного обучения, в которой разные владельцы данных могут обмениваться данными без обмена данными.
В этом случае устанавливается виртуальная общая модель, и эффект этой виртуальной модели эквивалентен оптимальной модели, созданной всеми сторонами, объединяющими данные вместе.
Таким образом, построенные модели обслуживают только локальные цели в соответствующих регионах. При таком федеральном механизме личность и местонахождение каждого участника
Та же позиция и федеральная система помогли всем установить стратегию «общего процветания». Поскольку сами данные не перемещаются при построении виртуальной модели
Таким образом, федеративное обучение является возможным решением проблемы хранилища данных.
Чтобы продолжить машинное обучение на основе защиты конфиденциальности данных и соблюдения требований законодательства, лучше использовать методы федеративного обучения.
Этот стандарт специально разработан для решения проблемы хранилища данных.
1 Область применения
Этот стандарт определяет эталонную архитектуру федеративного обучения (FLRA), включая концепции FLRA, пользовательские представления, функциональные представления и
связь.
Этот стандарт распространяется на:
а) выбор и использование услуг федеративного обучения организациями, планирующими использовать технологии федеративного обучения;
б) организации, планирующие использовать технологии федеративного обучения для создания федеративных систем обучения;
c) Проинструктировать предоставляющие услуги организации, которые используют технологии федеративного обучения, предоставлять услуги федеративного обучения.
2 Термины, определения и сокращения
2.1 Термины и определения
Термины и определения, определенные в ITU-T Y.3500 | ISO/IEC 17788, и следующие применимы к этому документу.
2.1.1 Архитектура
Базовый обзор системы в ее окружении, выраженный через системные элементы, их отношения и принципы проектирования и развития системы.
идея или атрибут.
[ISO/IEC/IEEE 42010:2011]
2.1.2 Деятельность деятельность
Сборник конкретных задач.
[GB/T 32399-2015]
2.1.3 Шифрование Шифрование/шифрование
Процесс криптографического преобразования данных для создания зашифрованного текста. Обычно содержит набор преобразований, использующих набор алгоритмов и набор входных данных.
Параметр. Входной параметр обычно называют ключом.
[GB/T 25069-2010]
2.1.4 функциональный компонент
Достижимый функциональный базовый структурный элемент, необходимый для участия в деятельности (2.1.1).
[GB/T 32399-2015]
2.1.5 Совместимость
а) способность двух или более систем или компонентов обмениваться информацией и использовать обмениваемую информацию друг с другом;
б) способность двух или более систем к взаимодействию.
[GB/T 11457-2006]
2.1.6 Модульность
Разделите систему на модули (модули становятся элементами) для простоты проектирования и разработки.
[GB/T 11457-2006]
2.1.7 Ролевая роль
Набор действий (2.1.1), которые служат общей цели.
[GB/T 32399-2015]
2.1.8 Подроль подроль
Подмножество действий (3.2.1) для данной роли (3.2.7).
2.1.9 Федеративное обучение
Действие, в котором несколько участников работают вместе для выполнения задачи машинного обучения, исходя из того, что данные каждой стороны не являются локальными.
2.1.10 служба федеративного обучения. Служба федеративного обучения.
Служба федеративного обучения, предлагаемая с набором коммерческих условий.
Примечание. Коммерческие условия включают цены, рейтинги и уровни обслуживания.
2.1.11 участник федеративного обучения
Организация или учреждение, участвующее в сети федеративного обучения, которая предоставляет данные федеративного обучения для одного или нескольких других участников, или действия и модели
инициатор .
2.2 Сокращения
Интерфейс прикладного программирования API
Эталонная архитектура федеративного обучения FLRA
CPU Central Processing Unit (Центральный процессор)
Служба федеративного обучения FLS
Пользователь федеративного обучения FLU
Участник федеративного обучения FLP
Координатор федеративного обучения FLC
3 Обзор
3.1 Конвенция
Условные обозначения, принятые в настоящем стандарте, включают:
а) использовать диаграммы, чтобы помочь понять FLRA;
б) Ссылки на термины в главе 2 выделены жирным шрифтом.
На рис. 1 представлена легенда, использованная на рисунке.
3.2 Цель FLRA
Эталонная архитектура федеративного обучения обеспечивает архитектурную основу для эффективного описания ролей федеративного обучения, подролей, действий федеративного обучения, общих задач, функциональной архитектуры и функциональных компонентов федеративного обучения.
Цели FLRA включают в себя:
а) описать группы заинтересованных сторон для федеративного обучения;
б) описать основные характеристики федеративной системы обучения;
c) спецификация основных федеративных учебных действий и функциональных компонентов, описывающая взаимосвязь между ними и их связь с окружающей средой;
d) Определить руководящие принципы разработки и улучшения FLRA.
3.3 Цели FLRA
Цели FLRA включают:
а) помочь разработать согласованный набор федеральных стандартов обучения;
b) обеспечить технологически нейтральную точку отсчета для определения федеративных стандартов обучения;
c) Способствовать открытости и прозрачности в определении преимуществ и рисков федеративного обучения.
4 концепции эталонной архитектуры
4.1 Обзор федеративного обучения
4.1.1 Коннотация
Чтобы получить лучшую модель машинного обучения, каждому участнику необходимо использовать данные других сторон для проведения совместного моделирования. Всем сторонам не нужно совместно использовать ресурсы данных, то есть, когда данные не являются локальными, проводить совместную подготовку данных и устанавливать основу для моделей машинного обучения.
Ограничения федеративной системы обучения:
Среди них VFED относится к влиянию федеративной модели обучения, VSUM — к влиянию модели, построенной традиционным методом (то есть методом агрегации данных), а δ —
положительные границы.
4.1.2 Классификация
Возьмем в качестве примера федеративное обучение с двумя участниками. У каждой стороны есть набор данных. Распределение набора данных можно разделить на:
a) Образцы объектов ( X1, X2,… ) двух наборов данных имеют большее перекрытие, в то время как идентификаторы образцов (U1, U2…) имеют меньшее перекрытие, как показано на рисунке.
показано 2;
б) Идентификаторы выборки (U1, U2…) двух наборов данных имеют большее перекрытие, в то время как выборочные функции (X1, X2,…) имеют меньшее перекрытие, как показано на рисунке.
показано 3;
c) идентификаторы выборки (U1, U2…) двух наборов данных перекрываются с признаками выборки ( X1, X2,… ) с небольшим перекрытием или без него,
Как показано на рисунке 4.
По форме распределения данных федеративное обучение можно разделить на горизонтальное федеративное обучение, вертикальное федеративное обучение и федеративное трансферное обучение.
4.2 Обзор эталонной архитектуры
FLRA, определенный в этом стандарте, может служить базовой точкой отсчета для стандартизации федеративного обучения и в то же время обеспечивать общую основу для основных концепций и принципов федеративных систем обучения. Архитектурный вид FLRA
Системы федеративного обучения могут быть описаны с использованием подхода представления.
FLRA можно описать с использованием видов, в том числе:
а) вид пользователя;
б) функциональный вид;
c) реализовать представление;
г) представление развертывания.
Отношения конверсии различных представлений показаны на рисунке 5.
Таблица 1 дает описание каждого представления.
Таблица 1. Представление FLRA
FLRA-представление | Посмотреть описание | Сфера |
---|---|---|
Просмотр пользователя | Системный контекст, актеры, роли, подроли и федеративная учебная деятельность | в пределах диапазона |
Функциональный вид | Необходимая функциональность для поддержки федеративной учебной деятельности | в пределах диапазона |
реализовать представление | Функции, необходимые для реализации сервисов федеративного обучения в сервисах, компонентах инфраструктуры | вне диапазона |
Представление развертывания | На основе существующей или новой инфраструктуры, техническая реализация функции службы федеративного обучения. | вне диапазона |
ПРИМЕЧАНИЕ. Хотя этот стандарт содержит подробные описания представления пользователя и функционального представления, он не содержит описания представления реализации и представления развертывания.
Потому что представление реализации и представление развертывания связаны с технологией, а также с специфическим для поставщика способом внедрения и развертывания федеративного обучения.
4.3 Представление пользователя для федеративного обучения
Контент федеративного обучения, задействованный в пользовательском представлении, включает:
а) федеративная учебная деятельность;
б) роли и подроли;
в) участвующие стороны;
г) федеративные службы обучения;
д) Общие проблемы.
4.4 Функциональный вид федеративного обучения
Функциональный вид — это технологически нейтральный взгляд на функции, необходимые для создания федеративной системы обучения. Функциональное представление описывает распределение функций, необходимых для поддержки объединенных учебных действий, и определяет зависимости между функциями.
Контент федеративного обучения, представленный в функциональном представлении, включает:
а) функциональные компоненты;
б) функциональный слой;
c) Межуровневая функциональность.
Рисунок 6 иллюстрирует концепции функций, уровней и функциональных компонентов.
4.5 Взаимосвязь между представлением пользователя и общей заботой и функциональным представлением и общей заботой
Общие опасения касаются:
а) роли и подроли в представлении пользователя и прямо или косвенно влияют на действия, выполняемые этими ролями;
б) функциональные компоненты в функциональном представлении, используемые при выполнении действий, описанных пользовательским представлением.
Общие проблемы включают:
а) безопасность;
б) модульная;
в) Совместимость.
4.6 Представление реализации федеративного обучения
Реализация представлений выходит за рамки этого стандарта.
4.7 Представление развертывания федеративного обучения
Представления развертывания выходят за рамки этого стандарта.
5 Пользовательский вид
5.1 Обзор ролей, подролей и федеративных учебных действий
Ядром федеративного обучения являются распределенные сервисы и их предоставление. Соответственно, все федеративные действия, связанные с обучением, включают в себя действия, использующие службы, действия, предоставляющие службы, и действия, поддерживающие службы.
Роли федеративного обучения включают:
а) пользователи услуг;
б) стороны;
в) координатор.
d) Примечание. В любой момент времени участник может взять на себя несколько ролей. Принимая на себя роль, участник может ограничить ее принятием только одной или нескольких подролей этой роли. Для данной роли подроль является подмножеством ее федеративных учебных действий.
5.2 Пользователи федеративного обучения
5.2.1 Обзор
Чтобы использовать Federated Learning Service, пользователь Federated Learning Service может установить деловые отношения с поставщиком Federated Learning Service, а также может установить деловые отношения с партнером Federated Learning Service.
Примечание. Пользователем федеративного обучения может быть физическое лицо или организация (например, участвующее учреждение или организация), представляющая это физическое лицо.
Действия, связанные с федеративными обучающимися пользователями и подролями, показаны на рисунке 7.
5.2.2 Подроли
Подроли пользователей федеративного обучения включают:
а) Пользователи Federated Learning Service. Федеративная учебная деятельность пользователей услуг федеративного обучения в основном включает использование служб федеративного обучения;
б) бизнес-менеджер федеративного обучения. Бизнес-менеджер федеративного обучения — это учреждение или организация. Его основные действия включают обнаружение метаданных данных, обнаружение возможностей обслуживания и предложение требований к обслуживанию;
c) Интегратор федеративных образовательных услуг — это учреждение или организация. Его основная деятельность включает интеграцию с существующими системами.
5.2.3 Действия
Основные направления деятельности Federated Learning Services включают:
а) использовать Федеративную службу обучения;
б) метаданные данных, обнаруженных в сети;
c) обнаружить сервисные возможности из сети;
d) Предложить требования к обслуживанию.
5.3 Участники федеративного обучения
5.3.1 Обзор
Участники федеративного обучения в основном участвуют в вычислениях федеративного обучения и предоставляют услуги другим участникам федеративного обучения или пользователям служб федеративного обучения.
Участник федеративного обучения — это физическое лицо в системе федеративного обучения, которое совместно участвует в процессе машинного обучения, или сущность, представляющая физическое лицо (например, см.
с агентством или организацией).
Действия федеративного обучения, связанные с подролями участников федеративного обучения, показаны на рисунке 8.
5.3.2 Подроли
Подроли участников федеративного обучения включают:
а) участники федеративного обучения вычислений;
б) Федеративные поставщики услуг обучения.
Примечание 1. Участники федеративных обучающих вычислений в основном участвуют в алгоритмических действиях, таких как вычислительные действия (моделирование, прогнозирование и т. д.), управление моделями;
Примечание 2. Поставщик услуг федеративного обучения в основном отвечает за управление предоставляемыми им возможностями, такими как управление услугами, управление данными и т. д.
5.3.3 Действия
К основным видам деятельности участников федеративного обучения относятся:
а) вычислительная деятельность, такая как инициирование моделирования, участие в моделировании, инициирование предсказаний, участие в предсказаниях, получение безопасных зашифрованных вычислительных протоколов и шифрование данных;
b) управление моделью, например управление данными модели, управление метаданными модели (версия, участники, время моделирования, время действия и т. д.), модель
Тип выпуска, использование модели;
c) управление услугами, например возможности моделирования и прогнозирования, список услуг, предоставляемых пользователям, доступ к услугам, планирование услуг;
d) Услуги передачи данных, включая публикацию метаданных данных, обнаружение данных в сети, управление исходными данными стороны (включая, помимо прочего, хранение
метод, метод использования, метод шифрования), использование данных.
5.3.2 Подроли
Подроли участников федеративного обучения включают:
а) участники федеративного обучения вычислений;
b) Поставщики федеративных образовательных услуг.
Примечание 1. Участники федеративных обучающих вычислений в основном участвуют в алгоритмических действиях, таких как вычислительные действия (моделирование, прогнозирование и т. д.), управление моделями;
Примечание 2. Поставщик услуг федеративного обучения в основном отвечает за управление предоставляемыми им возможностями, такими как управление услугами, управление данными и т. д.
5.3.3 Действия
К основным видам деятельности участников федеративного обучения относятся:
а) вычислительная деятельность, такая как инициирование моделирования, участие в моделировании, инициирование предсказаний, участие в предсказаниях, получение безопасных зашифрованных вычислительных протоколов и шифрование данных;
b) управление моделью, например управление данными модели, управление метаданными модели (версия, участники, время моделирования, время действия и т. д.), модель
Выпуск модели, использование модели;
c) управление услугами, например возможности моделирования и прогнозирования, список услуг, предоставляемых пользователям, доступ к услугам, планирование услуг;
d) Услуги передачи данных, включая публикацию метаданных данных, обнаружение данных в сети, управление исходными данными стороны (включая, помимо прочего, хранение
метод, метод использования, метод шифрования), использование данных.
5.4 Координатор федеративного обучения
5.4.1 Обзор
Координатор федеративного обучения — это участник, который обеспечивает поддержку или вспомогательные функции для деятельности участников федеративного обучения, имеет функции участника федеративного обучения и берет на себя часть обязанностей по управлению сетью федеративного обучения и арбитражу.
Примечание 1. Деятельность федеративного обучения координатора федеративного обучения зависит от типа соавтора и его отношений с поставщиком федеративных услуг обучения и потребителем федеративных услуг обучения;
Примечание 2: Предпочтительно, чтобы координатором федеративного обучения был институт или организация.
Действия федеративного обучения, связанные с координатором федеративного обучения, показаны на рисунке 9:
5.4.2 Подроли
Роли координатора федеративного обучения включают:
а) Разработчики федеративного обучения, в основном ответственные за функциональное развитие федеративного обучения;
b) координатор алгоритма федеративного обучения, в основном отвечающий за координацию вычислительного поведения каждого участника во время работы алгоритма федеративного обучения;
c) Координатор участников федеративного обучения в основном отвечает за координацию поведения участников федеративного обучения, а также является основным элементом федеративного обучения.
поставщик данных.
Примечание. Типичные сценарии, такие как координация возможностей участников федеративного обучения и управление данными.
5.4.3 Действия
Деятельность федеративного координатора обучения включает в себя:
а) развитие функций федеративного обучения, таких как разработка алгоритмов, развитие инфраструктуры, развитие услуг;
b) вычислительные операции, такие как инициирование моделирования, многостороннее управление безопасными вычислениями (согласованные протоколы безопасности, генерация ключей, расшифровка данных);
c) управление моделью, такое как обнаружение модели, управление метаинформацией модели, управление ключами модели;
d) Координация возможностей обслуживания, таких как доступ к обслуживанию, выпуск возможностей обслуживания, управление метаинформацией обслуживания в федеративных обучающих сетях и метаинформация участников.
управлять;
e) Управление данными, например управление информацией об элементах данных, выпуск информации об элементах данных и обнаружение информации об элементах данных.
5.5 Общие опасения
5.5.1 Обзор
Общие опасения относятся к нескольким элементам в рамках описания FLRA или к работе экземплярной системы FLRA. Эти общие проблемы являются общими для нескольких ролей, действий и компонентов.
Общие проблемы федеративного обучения показаны на рисунке 10.
Набор федеративных учебных действий и компонентов должен быть определен для общих целей. Различные роли и решения могут использовать разные подмножества этих общих проблем.
Общие проблемы включают:
а) безопасность (см. 5.5.2);
б) модульность (см. 5.5.3);
c) интероперабельность (см. 5.5.4).
5.5.2 Безопасность
Безопасность является важной общей проблемой для федеративного обучения, в том числе:
а) Безопасность данных. Необработанные данные или данные, из которых можно вывести необработанные данные, не должны раскрываться другим участникам, координаторам или пользователям;
б) защита конфиденциальности. Данные интерактивных не должны включать данные, которые расположены в любой форме или обычно расположены для человека;
в) Безопасность передачи. Протоколы передачи данных, программное и аппаратное обеспечение должны быть безопасными и надежными для предотвращения атак.
5.5.3 Модульность
Чтобы повысить эффективность НИОКР, ремонтопригодность и переносимость функции федеративного обучения, конструкция федеративной системы обучения должна быть модульной, конфигурируемой и расширяемой для быстрого повторного использования для создания приложений верхнего уровня.
5.5.4 Совместимость
Функциональная совместимость в контексте федеративного обучения включает в себя способность клиента службы федеративного обучения и службы федеративного обучения взаимодействовать и обмениваться информацией в установленном порядке и получать предсказуемые результаты.
Для реализации функциональной совместимости между различными службами или компонентами федеративного обучения все стороны должны внедрить эффективные протоколы связи, унифицированные API и форматы данных.
6 функциональный вид
6.1 Функциональная архитектура
6.1.1 Многоуровневая структура
Функциональная архитектура федеративного обучения описывает федеративное обучение с набором высокоуровневых функциональных компонентов. Функциональные компоненты представляют собой функциональный набор федеративных учебных действий для выполнения различных ролей и подролей, связанных с федеративным обучением, описанным в главе 5.
Функциональная архитектура описывает компоненты через многоуровневую структуру. В многоуровневой структуре определенные типы функций сгруппированы в уровни, а компоненты на соседних уровнях взаимодействуют через интерфейсы.
Многоуровневая структура FLRA состоит из 4 слоев и набора межуровневых функций, охватывающих каждый уровень, как показано на рисунке 11:
6.1.2 Сервисный уровень
Уровень сервиса реализует сервисы, предоставляемые поставщиком услуг федеративного обучения, а также содержит программные компоненты, необходимые для реализации сервисов, и управляет ими.
Уровень обслуживания использует компоненты уровня алгоритма для реализации определенной логики в соответствии с бизнес-требованиями и предоставления услуг для федеративных обучающихся пользователей. Уровень обслуживания включает в себя, но не ограничивается:
a) Демонстрировать возможности службы федеративного обучения с помощью одного или нескольких механизмов доступа. В контексте федеративного обучения типичными примерами сервисных возможностей являются базовые сервисы, такие как классификация, кластеризация и регрессия, а также различные специальные прикладные сервисы, такие как распознавание речи, биометрическое распознавание, компьютерное зрение и НЛП;
b) Обеспечьте соответствующие функции безопасности для доступа к возможностям Federated Learning Services. Уровень службы отвечает за проверку пользовательских запросов с помощью пользовательских сертификатов и идентификационной информации пользователя, а также за проверку того, разрешено ли пользователям использовать определенные возможности. Сервисный уровень также отвечает за обработку шифрования, когда это необходимо, проверяя целостность запроса;
c) применять различные возможные стратегии для трафика от пользователей (например, запросов на обслуживание) и потоков на пользовательский уровень (например, выходных данных услуг), чтобы гарантировать эффективность и доступность услуг;
d) обучать различные задачи на основе различных алгоритмов, предоставляемых базовым уровнем, и, наконец, формировать совместную модель, необходимую для верхнего уровня обслуживания;
e) Предоставлять услуги публикации и обнаружения данных, которые могут публиковать локальные данные в федеративной обучающей сети или обнаруживать данные из федеративной обучающей сети для локального моделирования/прогнозирования.
6.1.3 Уровень алгоритма
Уровень алгоритма реализует базовый алгоритм федеративного обучения. Реализация уровня алгоритма должна быть общей и не связана с конкретными услугами.
Уровень алгоритма использует компоненты уровня оператора для реализации логики алгоритма федеративного обучения и обеспечения поддержки уровня обслуживания.
Функции уровня алгоритма включают, но не ограничиваются:
а) выравнивание образца;
б) выравнивание признаков;
c) совместная разработка признаков;
г) адаптация домена;
д) Реализация общего алгоритма федеративного обучения;
f) оценка алгоритма;
g) Моделирование и прогнозирование шифрования.
6.1.4 Уровень оператора
Уровень оператора содержит высокоабстрактные общие компоненты, необходимые для реализации логики алгоритма федеративного обучения. Компоненты, предоставляемые уровнем оператора, должны быть общими и могут повторно использоваться различными алгоритмами федеративного обучения, а не в сочетании с конкретными алгоритмами федеративного обучения.
Уровень оператора использует функции, предоставляемые уровнем инфраструктуры, для предоставления высоко абстрактных компонентов уровню алгоритма, чтобы разработчики алгоритмов могли быстро реализовывать алгоритмы федеративного обучения на основе этих операторов.
Уровень оператора содержит как минимум следующие компоненты:
а) Многосторонний оператор безопасных вычислений;
б) оператор агрегации;
в) активационная функция;
г) процессор регуляризации;
д) функция стоимости;
f) методы оптимизации;
g) Градиентный процессор.
6.1.5 Уровень инфраструктуры
Уровень инфраструктуры обеспечивает инфраструктуру времени выполнения для федеративных служб обучения.
Уровень инфраструктуры можно рассматривать как базовую поддержку федеративных служб обучения, обеспечивающую общие возможности вычислений, хранения и связи на более высоком уровне.
В обязанности уровня инфраструктуры входит:
а) предоставить программный интерфейс, чтобы службы верхнего уровня могли использовать инфраструктуру;
б) предоставить вычислительную мощность для выполнения задач моделирования или прогнозирования;
c) Обеспечить механизм хранения для хранения выходной модели и необходимых данных, а также предоставить практические инструменты для импорта/экспорта данных;
d) Обеспечить планирование ресурсов и механизм управления для отслеживания и регистрации состояния ресурсов;
e) Обеспечить коммуникационную инфраструктуру для безопасной передачи информации между различными сторонами.
6.1.6 Межуровневая функция
Межуровневая функциональность включает ряд функциональных компонентов. Эти функциональные компоненты взаимодействуют с вышеупомянутыми четырехуровневыми компонентами для обеспечения возможностей поддержки.
Межуровневые возможности включают, но не ограничиваются:
а) обучаемость;
б) эксплуатационные возможности;
c) возможности защиты данных;
d) Возможности мониторинга и оценки.
6.2 Функциональные компоненты
6.2.1 Обзор
В этом разделе описывается эталонная архитектура федеративного обучения с точки зрения общего набора функциональных компонентов службы федеративного обучения. Функциональный компонент — это функциональный элемент FLRA, выполняющий действие или часть действия. Функциональный компонент имеет соответствующие компоненты реализации, такие как программные компоненты, подсистемы или приложения, в конкретной реализации эталонной архитектуры.
6.2.2 Компоненты сервисного уровня
Общие функциональные компоненты сервисного уровня должны включать:
а) компоненты пользовательских услуг;
b) Компоненты службы координации участников;
c) компоненты услуги общего алгоритма;
d) компоненты службы сцены;
e) компоненты службы данных;
f) Компоненты управления задачами.
6.2.2.1 Компонент пользовательских служб
Компонент User Services позволяет пользователям Federated Learning Services получать доступ к Federated Learning Services и использовать их (используя действия Federated Learning Services). Федеральные исследования
Поставщик услуг обучения может, в зависимости от ситуации, предоставить клиенту соответствующие пользовательские функциональные компоненты.
Функциональность типичного компонента службы пользователя должна включать:
a) Пользовательский интерфейс: функция клиента службы федеративного обучения для взаимодействия с службой федеративного обучения, которая может быть в виде интерфейса командной строки или графического пользовательского интерфейса и API;
b) Отправка задачи: отправка конкретных требований к задаче (моделирование, онлайн-прогнозирование, офлайн-прогнозирование и т. д.) клиента службы федеративного обучения в федеративную обучающую сеть;
c) Инструменты импорта и экспорта данных и моделей: импорт данных, моделей и т. д. в службу федеративного обучения или экспорт данных и моделей из службы федеративного обучения;
d) Выпуск данных и открытие данных: Участники федерального обучения могут быть освобождены для других участников; федеральные участники обучения могут также обнаружить других участников, опубликованных в сети для использования.
6.2.2.2 Компонент службы координации участников
Компонент «Служба координации участников» поддерживает: Объединенные действия по обучению для менеджера службы федеративного обучения, включая управление идентификацией и профилями участников, мониторинг деятельности и использования службы, обработку инцидентов и отчеты о проблемах, службы управления безопасностью. Возможности координации федеративного обучения доступны только координаторам сети федеративного обучения и могут быть получены только с помощью службы федеративного обучения.
Типичные функциональные возможности компонента службы координации участников включают:
a) Служба управления участниками: обеспечение управления идентификацией, управлением полномочиями, конфиденциальностью данных и услугами, подлежащими аудиту, для клиентов службы федеративного обучения;
b) Мониторинг и управление: Предоставление услуг по мониторингу сбоев и мониторингу рабочего состояния сети федеративного обучения для клиентов службы федеративного обучения;
c) управление событиями: предоставление услуг заранее определенных или настраиваемых событий для клиентов федеративных услуг обучения;
d) Управление проблем: предоставляет сетевые проблемы для Федерального федерального исследования для изучения отслеживания обслуживания клиентов, услуги отчетности;
e) Управление безопасностью: служба для обеспечения безопасности учетных записей клиентов службы федеративного обучения.
6.2.2.3 Компонент службы общего алгоритма
Компонент службы общего алгоритма предоставляет функции общего алгоритма, чтобы алгоритм можно было применить к данным. Возможности, предоставляемые общими компонентами алгоритма, не сильно связаны с конкретными сценариями и службами.
Общие общие сервисные компоненты включают в себя:
а) Классификация: Классификация - это тип обучения с учителем, то есть объекты данных каждой обучающей выборки уже имеют идентификаторы классов. Благодаря обучению могут быть сформированы знания, которые выражают соответствие между объектами данных и идентификаторами классов. Цель состоит в том, чтобы сформировать класс знаний на основе выборочных данных.Классифицировать исходные данные, что, в свою очередь, также может предсказать классификацию будущих данных;
б) Кластеризация: Кластеризация - это неконтролируемая задача обучения. Алгоритм находит естественные группы (т.е. кластеры) наблюдаемых выборок на основе внутренней структуры данных. Результат кластеризации будет генерировать набор наборов, а объекты в наборе то же, что и один и тот же набор Объекты в похожи друг на друга и отличаются от объектов в других коллекциях;
c) Регрессия. Регрессия — это контролируемый алгоритм обучения, который прогнозирует и моделирует численные непрерывные случайные величины. Задачи регрессии характеризуются аннотированными наборами данных с числовыми целевыми переменными. То есть каждая выборка наблюдения имеет числовое значение истинности для наблюдения за алгоритмом, а прогнозируемые результаты обычно являются числовыми.
6.2.2.4 Компонент службы сцены
Компонент службы сцены предоставляет функциональные компоненты с сильной связью с бизнесом. Этот слой компонентов меняется в зависимости от потребностей бизнеса или пользователей федеративного обучения.
Типичные сценарии применения включают в себя:
а) Распознавание речи: машины преобразуют речевые сигналы в соответствующий текст или команды посредством процесса распознавания и понимания. Технология, связанная с распознаванием речи, в основном включает три аспекта: технологию извлечения признаков речи, критерий сопоставления с образцом и технологию обучения модели;
б) биометрическая идентификация: машина использует присущие человеческому телу физиологические характеристики (отпечатки пальцев, радужная оболочка, лицо, ДНК и т. д.) или поведенческие характеристики (походка, характер нажатия клавиш и т. д.) для проведения личной идентификации;
c) Компьютерное зрение: использовать машины вместо человеческих глаз для идентификации, отслеживания и измерения цели, а также выполнять графическую обработку, чтобы сделать изображение цели более подходящим для наблюдения человеческим глазом или передать на приборы для обнаружения;
d) Обработка естественного языка (NLP): машины обычно могут понимать значение и намерение текстов на естественном языке, а также могут выражать заданные намерения, идеи и т. д. в текстах на естественном языке.
6.2.2.5 Компоненты службы данных
Компоненты службы данных включают в себя:
a) выпуск данных, что означает, что участник безопасным образом информирует координатора о метаданных данных, принадлежащих участнику, чтобы другие участники федеративного обучения могли проводить федеративное обучение;
b) Обнаружение данных, что означает, что участник ищет и обнаруживает информацию метаданных данных, опубликованную другими участниками федеративного обучения в координаторе, для своих собственных федеративных учебных действий.
Функции службы публикации и обнаружения данных включают в себя:
а) все участники федеративного обучения должны поддерживать функцию публикации данных;
б) Участие в необходимости моделирования / прогностической деятельности поддерживает функцию обнаружения данных;
c) Должен существовать четкий план управления информацией об элементах данных для обеспечения нормального проведения федеративной учебной деятельности.
6.2.2.6 Компоненты управления задачами
Компонент управления задачами используется для управления действиями по моделированию и прогнозированию в объединенных учебных действиях.
Функции компонента управления задачами включают, но не ограничиваются:
а) Поддержка создания (т.е. отправки) объединенных учебных задач;
b) поддержка запросов о состоянии и журналах задач федеративного обучения, включая запущенные задачи и выполненные задачи;
c) Поддержка завершения выполнения задач федеративного обучения;
d) должны быть предусмотрены механизмы, позволяющие пользователям возобновлять частично неудавшиеся задачи, где это возможно;
e) Должны быть предоставлены API для предоставления возможностей управления федеративными учебными задачами.
6.2.3 Компоненты уровня алгоритма
Компоненты уровня общего алгоритма должны включать:
а) компоненты выравнивания выборки;
b) элементы выравнивания элементов;
c) инженерные компоненты совместных функций;
d) компоненты адаптации домена;
e) общие компоненты алгоритма федеративного обучения;
f) Компонент оценки алгоритма.
6.2.3.1 Образец компонентов выравнивания
Компонент выравнивания выборки часто используется в продольном федеративном обучении. Компонент выравнивания выборки должен гарантировать следующие две точки:
а) каждая сторона подтверждает перекрывающиеся выборки источников данных, не раскрывая свои соответствующие данные;
б) Неперекрывающиеся образцы не экспонируются.
6.2.3.2 Компоненты выравнивания функций
Компонент выравнивания функций обычно используется для федеративного обучения с постоянным направлением и должен включать:
а) каждая сторона подтверждает перекрывающиеся характерные свойства источников данных, не раскрывая свои соответствующие данные;
б) Не выставляйте неперекрывающиеся атрибуты объектов.
6.2.3.3 Компоненты проектирования объединенных элементов
Возможности совместной разработки признаков должны включать:
а) схема использования совместных признаков;
б) схема приобретения совместных признаков;
c) совместная обработка признаков;
г) Мониторинг совместных признаков.
6.2.3.4 Адаптивные компоненты домена
Цель компонента адаптации домена — сопоставить данные различных распределений исходного и целевого доменов в пространстве признаков, чтобы расстояние в этом пространстве было как можно меньше.
Примечание. Поскольку суть федеративного трансферного обучения заключается в том, чтобы найти сходство между исходным доменом и целевым доменом, функция этого компонента должна быть настроена в соответствии с конкретными потребностями.
6.2.3.5 Общие компоненты алгоритма федеративного обучения
Компонент общего алгоритма федеративного обучения включает в себя различные базовые алгоритмы, необходимые для федеративного обучения для различных сценариев приложений и различных задач обучения. Общие алгоритмы включают в себя:
а) Логистическая регрессия для федеративного обучения. Типичные алгоритмы включают продольную логистическую регрессию и горизонтальную логистическую регрессию;
б) Дерево решений для федеративного обучения. Типичные алгоритмы включают GBDT;
в) федеративное трансферное обучение;
г) Федеративное глубокое обучение.
6.2.3.6 Компоненты оценки алгоритма
Компонент оценки алгоритма содержит оценку эффекта объединенного алгоритма обучения, в том числе:
а) оценка правильности;
б) неразрушающий контроль;
в) оценка эффективности;
г) оценка эффективности;
e) оценка безопасности;
f) Оценка вклада участников.
6.2.4 Компоненты уровня оператора
Общие компоненты уровня оператора включают в себя:
а) Многосторонний оператор безопасных вычислений;
b) оператор агрегации федеративного обучения;
c) функция активации федеративного обучения;
d) процессор регуляризации федеративного обучения;
e) функция объединенных затрат на обучение;
f) метод оптимизации интегрированного обучения;
g) Объединенный обучающий градиентный процессор.
6.2.4.1 Многосторонний оператор безопасных вычислений
Многосторонние безопасные вычисления — это ядро базового механизма безопасности федеративного обучения. Когда участники федеративного обучения активны, этот компонент шифрует или десенсибилизирует данные, чтобы исключить утечку исходных данных. В типичном сценарии перед тем, как участник федеративного обучения отправит данные другому участнику, компонент шифрования/десенсибилизации обрабатывает свои собственные данные. включают:
а) К основным принципам относятся:
- Компоненты шифрования/десенсибилизации участников используют известные и поддерживаемые другими участниками и координаторами алгоритмы шифрования/десенсибилизации для шифрования данных.
обработка для удаления информации, непосредственно связанной с исходными данными; - Для шифрования данных компонент шифрования в координаторе использует ключ для шифрования зашифрованного текста.
б) Реализации включают: - гомоморфное шифрование;
- Секретный обмен;
- Забывчивая передача;
- искаженная схема;
- Алгоритм шифрования RSA и ключ 1024 бит или выше;
- Доверенная среда выполнения (TEE).
c) Общие операторы включают: - Четыре арифметических оператора;
- оператор сравнения размеров;
- логические операторы И/ИЛИ/НЕ;
- Оператор вычисления вектора.
6.2.4.2 Оператор агрегации федеративного обучения
Оператор агрегации федеративного обучения является уникальным оператором федеративного обучения и должен быть настроен в соответствии со стратегией агрегации и методом шифрования. Общие операторы агрегации федеративного обучения основаны на случайных числах и многосторонних протоколах безопасности.
6.2.4.3 Функция активации федеративного обучения
Функция активации федеративного обучения должна включать, но не ограничиваться:
а) функция активации традиционного машинного обучения, такого как сигмоид, softmax, tanh, softsign;
б) Совместная функция активации федеративного обучения, такая как сигмоид расширения Тейлора на основе полугомоморфного шифрования, ReLU на основе совместного использования секрета.
6.2.4.4 Процессор регуляризации федеративного обучения
Процессор регуляризации федеративного обучения должен включать, но не ограничиваться:
а) Процессоры регуляризации для традиционного машинного обучения, такие как L1, L2;
b) Совместные процессоры регуляризации для федеративного обучения, такие как расширение Тейлора L1 на основе полугомоморфного шифрования и расширение Тейлора L2 на основе полугомоморфного шифрования.
6.2.4.5 Функция федеративных затрат на обучение
Функция объединенных затрат на обучение должна включать, но не ограничиваться:
а) функции стоимости традиционного машинного обучения, такие как перекрестная энтропия, среднеквадратическая ошибка и средняя абсолютная ошибка;
б) Совместная функция стоимости федеративного обучения, такая как бинарная кросс-энтропия, основанная на полугомоморфном шифровании.
6.2.4.6 Метод оптимизации федеративного обучения
Федеративные методы оптимизации обучения должны включать, но не ограничиваться:
а) методы оптимизации традиционного машинного обучения, такие как стохастический градиентный спуск (SGD), RMSProp, AdaGrad, Adam;
б) Метод совместной оптимизации для федеративного обучения.
6.2.4.7 Процессор градиента федеративного обучения
Процессоры градиента федеративного обучения должны включать, но не ограничиваться:
а) Градиентные процессоры для традиционного машинного обучения;
б) Совместный процессор градиента для федеративного обучения.
6.2.5 Компоненты уровня инфраструктуры
Общие компоненты уровня инфраструктуры должны включать:
а) вычислительные компоненты;
б) компоненты хранения;
в) коммуникационные компоненты;
d) Компоненты планирования и управления ресурсами.
6.2.5.1 Вычислительные компоненты
Вычислительные платформы включают, но не ограничиваются:
а) Поддерживать выполнение задач на одном компьютере и должно поддерживать выполнение распределенных задач;
b) Должен существовать четкий план управления метаинформацией о задачах, чтобы обеспечить нормальную работу федеративных учебных мероприятий и прослеживаемость информации о задачах в течение определенного периода времени;
c) он должен иметь определенную отказоустойчивость, например, функции сбоя задачи и восстановления;
d) Должен быть предоставлен API для обеспечения возможностей разработки федеральных алгоритмов обучения.
6.2.5.2 Компоненты хранилища
Функции компонента хранилища должны включать, но не ограничиваться:
а) Поддержка хранения КВ;
б) Поддержка импорта и экспорта данных из других систем хранения в компоненты хранения;
c) Поддерживать постоянство внешнего хранилища для хранения данных;
d) следует поддерживать хранение данных в оперативной памяти для повышения производительности выполнения задач;
e) следует поддерживать распределенное хранение данных для повышения производительности чтения и записи данных;
f) иметь четкий план управления информацией об элементах данных для обеспечения нормального функционирования федеративной учебной деятельности;
g) предоставить API для обеспечения возможности доступа к компонентам хранилища;
h) Должны быть четкие стратегии и планы доступности данных, надежности и планов восстановления в случае потери хранилища.
6.2.5.3 Коммуникационные компоненты
Функции коммуникационного компонента должны включать, но не ограничиваться:
а) поддержка двусторонней связи;
b) поддерживать связь между кластерами и центрами обработки данных;
c) Поддерживать основные международные схемы защищенной связи, такие как HTTPS, TLS/SSL;
d) Когда участники общаются извне, они должны использовать безопасную схему связи для шифрования связи;
e) Контент, отправленный (включая активную отправку и пассивный ответ) другим участникам федеративного обучения или координаторам федеративного обучения, должен находиться на рассмотрении.
следить за тем, чтобы исходные данные не покидали партию;
f) Предоставление API для предоставления возможностей разработки федеративного алгоритма обучения.
6.2.5.4 Компоненты планирования и управления ресурсами
Функции компонента планирования и управления ресурсами включают, но не ограничиваются:
а) разумно распределять ресурсы для вычислений, хранения и запросов на связь;
b) записывать и управлять изменениями в аппаратных ресурсах, а также возвращать их в стратегию распределения ресурсов;
c) Должен быть предусмотрен механизм, позволяющий разработчикам настраивать правила планирования;
d) Предоставлять API для обеспечения использования ресурсов в режиме реального времени.
6.2.6 Межуровневые функциональные компоненты
Межуровневые функциональные компоненты должны включать:
а) эксплуатационные функциональные компоненты;
b) функциональные компоненты безопасности данных;
c) функциональные компоненты управления и аудита.
6.2.6.1 Операционные функциональные компоненты
Операционный функциональный компонент включает в себя набор операционных административных функций, используемых для управления и контроля федеративных услуг обучения, предоставляемых пользователям. К эксплуатационным функциональным компонентам относятся:
а) Справочник службы. Функция «Каталог услуг» предоставляет список всех услуг федеративной системы обучения. Список услуг включает в себя различные услуги для федеративной учебной деятельности, такие как различные услуги обучения и прогнозирования и другие вспомогательные услуги для различных потребностей и сценариев;
б) Управление политикой. Функция управления политиками обеспечивает определение, обновление и доступ к политикам службы федеративного обучения, а также управление этими политиками.
Эти политики включают деловые, технические, политики безопасности, конфиденциальности и аутентификации для самого федеративного обучения и его использования;
c) Управление исключениями и проблемами. Функция управления исключительными проблемами позволяет собирать отчеты об инцидентах и проблемах и управлять этими отчетами посредством анализа. Инциденты и проблемы могут быть обнаружены и зарегистрированы Системой поставщика услуг федеративного обучения или пользователем услуги федеративного обучения, то есть участниками федеративного обучения;
г) Управление предоставлением услуг. Функция управления предоставлением услуг обеспечивает функции управления предоставлением услуг федеративного обучения, такие как предоставленный функциональный интерфейс, SLA и т. д. В то же время эта функция обеспечивает необходимый рабочий процесс, гарантирующий, что эти сервисные элементы доставляются в правильном порядке.
6.2.6.2 Функциональные компоненты безопасности
Функциональные компоненты безопасности в основном обеспечивают конфиденциальность,
Гарантия атрибутов безопасности, таких как целостность, доступность и защита конфиденциальности.
Функции функциональных компонентов безопасности данных должны включать, но не ограничиваться:
а) Управление счетом. Убедитесь, что все соответствующие стороны имеют учетную запись;
b) Аутентификация и управление идентичностью. Обеспечение аутентификации всех вовлеченных сторон перед продолжением;
c) Управление политикой авторизации и безопасности. Убедитесь, что соответствующие стороны могут работать только с авторизованным контентом;
г) Управление целостностью данных. Благодаря обнаружению целостности и различным требованиям спецификации предотвратить потерю целостности данных из-за неправильной работы, злонамеренного повреждения и несоблюдения формата;
д) Уничтожение данных. Обеспечить функцию уничтожения данных каждого участника после использования различных типов данных и нести ответственность за полное удаление данных, которые невозможно восстановить, во избежание утечки информации;
f) Защита от утечки информации. Основная цель состоит в том, чтобы защитить конфиденциальную информацию, такую как федеративное обучение личности пользователя и обработку транзакций, от утечки или незаконного получения, доступ к которой возможен только при наличии полной авторизации. К функциям функциональных компонентов предотвращения утечки конфиденциальной информации следует отнести:
- Поддерживает ограничение передачи данных между определенными авторизованными узлами;
- Поддержка контроля доступа к пользовательским данным методами шифрования и дешифрования;
- Поддержка сокрытия информации об инициаторе/получателе федеративной учебной деятельности (задачи) и самой информации о транзакции;
- Поддерживайте использование алгоритмов защиты конфиденциальности, таких как доказательство с нулевым разглашением и гомоморфное шифрование, чтобы избежать раскрытия конфиденциальности.
6.2.6.3 Мониторинг и аудит функциональных компонентов
В соответствии с требованиями управления участников федеративного обучения функциональные компоненты надзора и аудита обеспечивают соответствие службы федеративного обучения характеристикам контролируемости и возможности аудита, чтобы предотвратить нарушение федеративным обучением требований соответствующих законов и правил, для достижения реальной безопасности данных и защиты от утечки данных, а также как авторитетная сторона, он оценивает, соответствуют ли требованиям процесс прогнозирования федеративного обучения и все аспекты окончательной модели.
Функции функциональных компонентов мониторинга и аудита включают, но не ограничиваются:
а) Должна существовать полная и надежная система управления нормативными требованиями Цели регулирования достигаются с помощью технических средств, таких как контроль доступа до входа, контроль полномочий в процессе и отслеживание после события, чтобы гарантировать, что записи не могут быть подделаны, отслеживаемы и проверяемый;
b) Целесообразно добиться немедленного надзора со стороны надзорного органа как члена Федерации, который может проводить немедленный аудит и надзор за целостностью данных, достоверностью и соблюдением процессов; данные и доказательства, связанные с вмешательством регулирующих органов, должны быть полностью зарегистрированы и сохранены. ;
c) Установить четкие правила регулирования. В то же время он должен поддерживать правила, согласно которым люди участвуют в надзоре и управлении и не могут быть автоматически реализованы с помощью технологий, а также правила, согласно которым организации или руководители осуществляют надзор и управление в соответствии с законами, административными регламентами, ведомственными правилами и т. д. ;
d) Сохраняйте информацию аудита, относящуюся к услугам, ресурсам и производительности. Как минимум, эта аудиторская информация должна включать в себя записи и журналы действий и рабочих условий окружающей среды всех сторон, участвующих в соглашении, и должна собираться и храниться безопасным образом.
7 Связь между пользовательским представлением и функциональным представлением
7.1 Обзор
На основании того, что в Главе 6 представлено пользовательское представление федеративных учебных ролей и действий, а в Главе 7 представлено функциональное представление, включая функциональные компоненты, в этой главе описывается связь логического сопоставления между ролями, действиями и функциональными компонентами.
7.2 Отношения
Отношение отображения в стандарте может применяться к:
а) степень, в которой определены информационные потоки или другие типы функциональной совместимости;
b) Обеспечение заданного качества (например, уровня безопасности или обслуживания).
Логические отношения, определенные в этой архитектуре, являются важной частью определения FLRA и его поведения. Описание логической связи включает поток информации, необходимый для взаимодействия между компонентами FLRA.
На рис. 12 показана общая конфигурация основных элементов FLRA, включая роли, федеративные учебные действия и компоненты.