Суть искусственного интеллекта заключается в процессе оптимизации

машинное обучение глубокое обучение
Суть искусственного интеллекта заключается в процессе оптимизации

Три элемента модели

Чтобы преобразовать вещи и проблемы в математические модели задач оптимизации, нам необходимо рассмотреть три элемента: переменные-факторы, ограничения и целевые функции. Сначала мы находим все факторы и переменные, которые влияют на модель в соответствии с вещами и проблемами, а затем устанавливаем целевую функцию в соответствии с целью измерения эффекта системы и, наконец, находим объективные ограничения и используем их в качестве ограничений модели.

формула

Как показано в приведенной выше формуле, факторная переменная реальной задачи фактически может рассматриваться как n-мерный вектор, и каждый элемент вектора является действительным числом. f0(x) — построенная нами целевая функция, и наша цель — минимизировать функцию (случай максимизации фактически может быть преобразован в случай минимизации). fi(x) и hj(x) используются в качестве функций ограничений, которые делятся на две категории: ограничения неравенства и ограничения равенства. Функции ограничений используются для ограничения возможного пространства. Если ограничений нет, функция ограничений не нужный.

целевая функция

оптимизация искусственного интеллекта

Какое отношение оптимизация имеет к искусственному интеллекту? Можно сказать, что искусственный интеллект по своей сути также является процессом оптимизации, и что касается интеллекта, которого мы хотим достичь, это также достигается путем обучения для получения оптимального решения. Это общие рамки, и задача искусственного интеллекта почти всегда в итоге возвращается к оптимальному решению.

Будь то традиционное машинное обучение, популярное глубокое обучение или потенциальное обучение с подкреплением, их основные основные идеи могут быть улучшены до задач оптимизации.

оптимизировать

Ограниченная оптимизация

Как упоминалось ранее, задача оптимизации может иметь или не иметь ограничений, и случай с ограничениями более сложен, чем случай без ограничений. Ограничения можно разделить на две категории: ограничения неравенства и ограничения равенства.Функция ограничений состоит в том, чтобы ограничить возможное пространство оптимальных решений определенными областями.

Даже с ограничениями ситуация сложнее, но у нас все еще есть математические инструменты для ее решения. В случае ограничений равенства можно ввести множители Лагранжа для решения проблемы, а исходную целевую функцию и функцию ограничения можно вместе преобразовать в функции Лагранжа. Функция Лагранжа и исходная целевая функция имеют общее оптимальное решение, поэтому нам нужно решить только оптимальное решение функции Лагранжа. Для случая ограничений-неравенств метод обработки аналогичен, за исключением того, что необходимо дополнительно выполнить условие ККТ.

В качестве примера возьмем следующий рисунок Предположим, что всего имеется четыре ограничения, и их общая ограниченная область представляет собой область, обозначенную четырьмя разными цветами. Предположим, что верхняя часть — это все возможные пространства для оптимального решения задачи, и она находится в области после ограничений.

Ограниченный

неограниченная оптимизация

В ситуации без ограничений для нахождения оптимального решения обычно используется метод градиентного спуска, так называемый градиент — это вектор, направление градиента — это направление, в котором функция растет быстрее всего в определенной точке, а модуль градиента является максимальным значением производной по направлению. Направление градиентного спуска — это направление, противоположное градиенту.Проще говоря, градиентный спуск — это как стоять на определенной позиции на горе и делать шаг одинаковой синхронной амплитуды во всех направлениях вокруг нее, что является самым быстрым направлением спуска. .

Неограниченный

Кроме того, при использовании метода градиентного спуска для поиска оптимального решения есть возможность найти локальное оптимальное решение, а попав в локальное оптимальное решение, возможно, не удастся выскочить и продолжить поиск глобального оптимального решения. решение. Следовательно, необходимо рассматривать и локальную оптимальную задачу, и в инженерии существуют специальные методы, предотвращающие попадание в локально оптимальное решение. Однако иногда разница между локальным оптимальным решением и глобальным оптимальным решением может быть не очень большой, и поиск глобального оптимального решения будет стоить дорого.

локальный оптимум


Этот официальный аккаунт фокусируется на искусственном интеллекте, чтении и мыслях, беседах о математике, информатике, распределенном, машинном обучении, глубоком обучении, обработке естественного языка, алгоритмах и структурах данных, глубине Java, ядре Tomcat и т. д.