По мере того, как наука о данных ярко проявляется в развитии искусственного интеллекта, интеллектуальный анализ данных и машинное обучение входят в поле зрения все большего числа людей. Многим такие рейтинги, как машинное обучение, кажутся магией, но их истинное значение неизвестно широкой публике.
Особенно для человека, работающего в области науки о данных, объяснить непрофессионалу, чем вы занимаетесь, — почти сверхсложная задача. Так что же такое машинное обучение и как объяснить его простым языком? Мы объясняем это через следующие области.
Одна, профессиональная теория
Энциклопедическое определение + профессиональная терминология заставляет людей звучать неясно, но на самом деле они путаются.
Машинное обучение (ML) — это многопрофильный междисциплинарный предмет, включающий теорию вероятностей, статистику, теорию приближения, выпуклый анализ, теорию сложности алгоритмов и другие дисциплины. Он специализируется на том, как компьютеры имитируют или реализуют поведение человека при обучении, чтобы приобретать новые знания или навыки, а также реорганизовывать существующие структуры знаний для постоянного повышения их производительности.
Это ядро искусственного интеллекта и основной способ сделать компьютеры разумными. Он применяется во всех областях искусственного интеллекта. Он в основном использует индукцию и синтез вместо дедукции.
Машинное обучение имеет широкий спектр приложений, таких как: интеллектуальный анализ данных, компьютерное зрение, обработка естественного языка, биометрия, поисковые системы, медицинская диагностика, обнаружение мошенничества с кредитными картами, анализ фондового рынка, секвенирование последовательности ДНК, распознавание речи и почерка, стратегия. Игры и робототехника.
Машинное обучение — это, по сути, обучающая структура, и вся структура включает в себя три части: среду, базу знаний и выполнение. В течение всего процесса среда предоставляет информацию системе, и система использует эту информацию для изменения базы знаний, чтобы повысить производительность исполнительной части системы для выполнения задачи, исполнительная часть выполняет задачу в соответствии с базой знаний, и в то же время возвращает полученную информацию в обучающую часть, чтобы продолжать улучшать базу знаний.
В конкретном приложении части среды, знаний и выполнения определяют конкретное содержание работы, а проблемы, которые необходимо решить в части обучения, полностью определяются тремя вышеуказанными частями. Проще говоря, машинное обучение — это метод, при котором компьютеры используют существующие данные для получения определенной модели и используют эту модель для предсказания будущего, что очень похоже на то, как думает человеческий мозг.
Во-вторых, увидеть большое из малого
Чтобы проиллюстрировать конкретный случай машинного обучения, оно заставляет людей осознать.
Начнем с надуманной сцены. Предположим, что в комнате волшебным образом плавает бесконечное количество маленьких шариков. Мы хотели выяснить, есть ли какая-то особая конструкция, в которой останавливаются шары. Например, мячи с большей вероятностью будут сосредоточены в определенной области? Умышленно ли он избегает определенных моментов? Равномерно ли они распределены по всему пространству?
Но в комнате было темно, и мы ничего не видели. Итак, мы взяли камеру со вспышкой и захотели сфотографировать маленькие шарики, плавающие по комнате. Фото выглядит так, как показано ниже:
Даже если есть связь между позициями шаров, мы не можем сказать по этой фотографии. Кажется, что шарики распределены равномерно. Поэтому мы попробовали другую позицию и сделали второе фото с нового ракурса.
Шары на фотографии все еще кажутся распределенными случайным образом без какой-либо закономерности. Попробуем с более высокого ракурса.
Ну, я все еще не вижу никакой закономерности. Затем попробуем еще раз под меньшим углом.
Ага, это немного интересно: кажется, что шары сосредоточены в двух областях возле крыши и земли, а посередине нет ни одного шара. Следовательно, чтобы открыть этот закон, мы должны найти «хороший» ракурс при съемке. Если угол неправильный, то мы никогда не сможем найти закономерность.
В приведенном выше примере мы хотим сказать, что на самом деле это трехмерные точки данных. Положение каждого шарика может быть представлено тремя числами, и каждое число представляет его положение по трем осям XYZ. В реальной работе компьютера положение точки данных будет представлено большим количеством комбинаций чисел.
Например, медицинская карта пациента в больнице может содержать 500 наборов цифр, включая его день рождения, рост, вес, артериальное давление, последний визит к врачу, показатели холестерина и так далее. Мы хотим выяснить, существует ли какая-то закономерность между точками данных разных пациентов, например, будут ли концентрироваться точки данных пациентов с сердечными заболеваниями? Если точки данных действительно сгруппированы, когда мы видим ту же тенденцию в точках данных для вновь поступившего пациента, мы можем сделать вывод, что у этого пациента, вероятно, сердечный приступ. Конечно, на практике все будет не так просто.
Человек не может увидеть эти точки данных невооруженным глазом. Как человек может различать 500 измерений? Как и в приведенном выше примере, никто не может видеть мяч в «темной комнате», и мы также не можем видеть точки данных в 500 измерениях. Точно так же, как мы можем использовать 2D-изображение для отображения точек данных в 3D-пространстве, мы также можем использовать «фотографии» более низкого измерения для представления точек данных с 500 измерениями.
Только делая «фотографии» под правильным «ракурсом», мы можем найти закономерности между разными точками данных, иначе это будет трудно выяснить. Это то, что люди называют «извлечением информации» из «больших данных».
3. Знайте это с любовью, действуйте разумно
Таким образом, ваши домашние животные должны быть в состоянии понять.
купи манго
Предположим, однажды вы собираетесь купить манго. Разносчик поставил тележку. Вы можете собирать их по одному, и продавец рассчитает сумму на основе фунта манго, которое вы выбрали (обычно в Индии). Очевидно, вы хотите выбрать самые сладкие и спелые манго, верно (потому что разносчики берут плату за вес манго, а не за качество манго). Но как ты собираешься выбирать?
Вы помните, бабушка говорила вам, что ярко-желтые манго слаще, чем темно-желтые. Итак, у вас есть простой критерий оценки: выбирайте только ярко-желтые манго. Вы проверяете цвет каждого манго, выбираете несколько ярко-желтых, оплачиваете счет и уходите, разве это не круто?
Но правда не так проста.
жизнь сложна
Вы возвращаетесь домой и начинаете медленно пробовать манго. Вы обнаружите, что некоторые манго не такие сладкие, как вы думаете. Вы беспокоитесь. Очевидно, бабушкиной мудрости не хватает. Выбрать манго не так просто, как посмотреть на цвет.
После долгих раздумий (и пробы различных сортов манго) вы обнаруживаете, что большие, ярко-желтые манго определенно сладкие, в то время как маленькие, ярко-желтые манго сладкие лишь наполовину (как если бы вы купили 100 за ярко-желтый манго). желтого манго, 50 относительно больших и 50 относительно маленьких, то вы обнаружите, что 50 больших манго сладкие, а 50 маленьких манго, в среднем только 25 сладких).
Вы так довольны своим открытием, что будете помнить об этих правилах, когда в следующий раз пойдете за манго за покупками. Но в следующий раз, когда вы придете на рынок, вы обнаружите, что ваша любимая манговая лавка переехала за город. Итак, вы решаете купить манго у другого продавца манго, но манго у этого продавца не из того места, что и у предыдущего. Теперь вы вдруг понимаете, что метод сбора манго, который вы изучили ранее (большие желтые манго самые сладкие), больше не работает. Вы должны начать все сначала. Вы попробовали все виды манго у лоточника и обнаружили, что здесь маленькие, темно-желтые манго на самом деле самые сладкие.
Вскоре после этого к вам приехала ваша дальняя родственница из другого города. Вы готовы угостить ее манго. Но она сказала, что не имеет значения, сладкие манго или нет, манго, которые она хочет, должны быть самыми сочными. Итак, вы снова попробовали различные сорта манго, используя свой метод, и обнаружили, что более мягкие манго были более сочными.
После этого вы переехали в другую страну. Там манго на вкус совсем не похоже на ваш родной город. Вы обнаружите, что зеленые манго на самом деле лучше, чем желтые манго.
Затем вы женитесь на жене, которая ненавидит манго. Она любит есть яблоки. Вы должны покупать яблоки каждый день. В результате накопленный ранее опыт сбора манго вдруг становится бесполезным. Вы должны использовать тот же метод, чтобы узнать взаимосвязь между физическими свойствами яблока и его вкусом. Ты делаешь это, потому что любишь ее.
компьютерная программа
Теперь представьте, что недавно вы писали компьютерную программу, помогающую собирать манго (или яблоки). Вы бы написали следующие правила:
if(цвет ярко-желтый, размер большой и куплен у любимого продавца): манго сладкое
если (мягкое): манго сочное
………………
Вы будете использовать эти правила для сбора манго. Вы даже можете попросить своего младшего брата купить манго по этому списку правил, и будьте уверены, что он купит манго, которые вас устроят.
Но как только вы обнаружите что-то новое в своих экспериментах с манго, вам придется вручную изменить этот список правил. Вы должны выяснить сложные детали всех факторов, влияющих на качество манго.
Если задача все более усложняется, приходится составлять схему селекции для всех видов манго. Ваше исследование позволит вам получить докторскую степень в области науки о манго (если есть такая степень).
Но у кого есть на это время.
алгоритм машинного обучения
Алгоритмы машинного обучения произошли от обычных алгоритмов. Это делает вашу программу «умнее», автоматически обучаясь на предоставленных данных.
Вы случайным образом выбираете определенную выборку (обучающие данные) манго на рынке и составляете таблицу, в которой записываются физические свойства каждого манго, такие как цвет, размер, форма, происхождение, продавец и так далее. (Это называется чертами).
Также запишите, сладкое ли манго, сочное ли оно и созрело ли оно (выходные переменные). Вы вводите эти данные в алгоритм машинного обучения (классификация/регрессия), и он изучает модель связи между физическими свойствами манго и его качеством.
В следующий раз, когда вы пойдете на рынок, просто проверьте свойства этих манго (тестовые данные) и введите их в алгоритм машинного обучения. Алгоритм будет предсказывать, что манго будет сладким, спелым и/или сочным, на основе ранее рассчитанной модели.
Правила, используемые внутри алгоритма, очень похожи на те, которые вы писали от руки на бумаге раньше (например, деревья решений), или что-то более сложное, но в основном вам не нужно об этом беспокоиться.
О чудо, теперь вы можете с уверенностью покупать манго, не беспокоясь о деталях выбора манго. Что еще более важно, вы можете улучшить свой алгоритм с течением времени (обучение с подкреплением), и по мере того, как он считывает больше обучающих данных, он становится более точным и исправляет себя после ошибочных прогнозов. Но самое приятное то, что вы можете использовать один и тот же алгоритм для обучения разных моделей, например модели для прогнозирования качества яблок, апельсинов, бананов, винограда, вишни, арбузов, и порадовать всех своих близких :)
Это ваше собственное машинное обучение, так здорово.
End