Выступление 丨Чжоу Чжихуа: Обсуждение искусственного интеллекта

искусственный интеллект

Источник | Сердце машины

Спикер | Чжоу Чжихуа

Организовать | Цю Лулу

Когда дело доходит до искусственного интеллекта, многие средства массовой информации и широкая публика могут сначала подумать об образе «искусственного интеллекта» в научно-фантастических фильмах. Поэтому люди, занимающиеся исследованиями в области искусственного интеллекта, часто сталкиваются с трудным или печальным вопросом: когда же появится искусственный интеллект, который умнее человека?

На такие вопросы на самом деле очень сложно ответить тем, кто занимается исследованиями в области искусственного интеллекта. Почему?Потому что когда дело доходит до искусственного интеллекта, есть два очень разных взгляда. Первый тип, который мы называем сильным искусственным интеллектом, направлен на создание машин, которые будут такими же умными, как люди, или даже умнее, чем люди.Этот взгляд чаще встречается в научно-фантастических произведениях и фильмах. Другой называется слабым искусственным интеллектом. Это то, что люди думают, что люди очень умны, когда они что-то делают. Могут ли они учиться у людей и делать машины умными, когда они что-то делают? Исследователи в научном сообществе в основном изучают этот аспект.

Есть очень известный ученый Марвин Мински, один из основоположников искусственного интеллекта, лауреат премии Тьюринга и основатель информатики Массачусетского технологического института. Однажды он дал определение искусственного интеллекта, заявив, что искусственный интеллект — это наука о том, чтобы «позволить машинам делать то, что потребовало бы интеллекта, если бы их выполняли люди».

Простая аналогия: более 100 лет назад мы видели птиц, летающих в небе, и тогда все думали, а можно ли сделать что-то, чтобы они летали, и вот после аэродинамических исследований у нас есть самолет. Но если мы спросим, ​​лучше ли самолеты птиц вообще, может быть трудно сказать. Самолет может летать выше и дальше птицы, но не так ловко, как птица. Но несмотря ни на что, первоначальная цель достигнута, и мы получили инструменты, которые могут помочь нам летать.

То, что должен делать искусственный интеллект, очень похоже на создание самолетов: мы видим, что у людей много разумного поведения, и мы надеемся использовать этот интеллект для создания некоторых инструментов, которые помогут нам делать более мощные вещи. Это главное, что мы учитываем, изучая искусственный интеллект. Мы занимаемся не искусственным интеллектом, а искусственным интеллектом, точнее, вычислительным процессом, вдохновленным разумным поведением (Intelligence-inspired Computing).

Давайте кратко рассмотрим, что произошло в области искусственного интеллекта за последние несколько десятилетий. Сегодня мы обычно думаем, что искусственный интеллект родился в 1956 году. Первая в мире современная компьютерная система родилась в 1946 году. В 1956 году вычислительная мощность компьютера была еще очень слабой, но в то время многие ученые думали: если вычислительная мощность продолжит развиваться таким образом, мы сможем сделать некоторые более сложное дело. Тем летом на конференции в Дартмутском колледже Джон Маккарти, впоследствии известный как отец искусственного интеллекта, дал этой дисциплине название «искусственный интеллект». В результате сегодня все мы думаем, что искусственный интеллект родился летом 1956 года.

За последние 60 лет истории, если мы посмотрим на основной исследовательский процесс или направление исследовательской работы, прошлое развитие прошло три этапа.

На первом этапе, с середины 1950-х до 1960-х годов, ИИ в основном занимался рассуждениями. Почему это? Потому что в то время многие исследователи искусственного интеллекта пришли из математики и информатики. У всех было естественное поклонение математикам, думая, что математики очень умны, потому что они могут доказать какую-то очень сложную теорему, способность, стоящая за этим, - это способность логических рассуждений. Итак, в то время все думали, что если вы можете дать компьютерной системе способность к логическому мышлению, то машина будет делать вещи умнее, поэтому в то время было много очень важных результатов исследований, таких как два лауреата премии Тьюринга Герберт Саймон. и Аллен Ньюэл создал Logic Theorist, автоматическую систему доказательства теорем. Г-н Ву Вэньцзюнь из Китая, результаты его исследований также относятся к этой категории. Так каков же уровень результатов таких исследований?Например,все знают,что математика является фундаментом естествознания и технических наук,но что является фундаментом математики?В 1940-х годах было два великих логика.Рассел и Уайтхед,которые использовал логику для построения всей математической системы, написал книгу под названием «Принципы математики». Им потребовалось десять лет, чтобы доказать теоремы в этой книге. Однако программе понадобилось меньше двух месяцев, чтобы доказать все теоремы, а одна из теорем, доказанных машиной, оказалась даже более изобретательной, чем те, что доказали два великих логика.

В 1960-х годах способность машин к рассуждениям достигла пика человеческого уровня, но машины были далеко не так умны, как люди, в выполнении каких-либо действий. Люди постепенно поняли, что одних способностей к логическому мышлению недостаточно. Математики могут доказать многие теоремы не только из-за своих сильных логических способностей, но и потому, что они обладают большими математическими знаниями, поэтому исследования искусственного интеллекта естественным образом перешли на второй этап. На этом этапе все думают о том, можно ли обобщить полученные знания и передать их в компьютерную систему. Это так называемый период инженерии знаний, и представительной фигурой является Эдвард Фейгенбаум, впоследствии лауреат премии Тьюринга, известный как отец инженерии знаний, который был главным научным сотрудником ВВС США. На этом этапе все в основном надеются обобщить знания людей-экспертов для решения задач.Например, когда вы работаете над геологоразведочной системой, если вы видите, что из скалы сочится красное, то это, скорее всего, железная руда. Обобщите эти знания, затем запрограммируйте их и поместите в компьютерную систему, в результате чего будет создано множество экспертных систем и разрешено множество проблем.

Но позже исследователи обнаружили, что обобщить знания и передать их системе очень сложно. С одной стороны, иногда мы, люди, можем решить какие-то проблемы, но не можем сказать, какие знания внутри. Существует также ситуация, когда эксперт-человек может не захотеть делиться своими знаниями. Что мне делать? Поскольку человеческое знание в основном изучается, многие люди, естественно, думают, можем ли мы позволить машинам изучать знания автоматически? Поэтому с 1990-х годов основные исследования искусственного интеллекта вошли в область искусственного интеллекта. Третий этап, который продолжается и по сей день, является «стадией машинного обучения». Таким образом, дисциплина машинного обучения возникла, чтобы решить узкое место в приобретении знаний. Классическое определение машинного обучения — это использование опыта для повышения производительности самой системы. Но каким бы ни был опыт, если вы хотите поместить его в компьютерную систему, он должен существовать в виде данных. Следовательно, машинное обучение должно анализировать данные, чтобы изучить, как использовать опыт. Поэтому эта область развивается и по сей день, и основное исследование заключается в том, как использовать компьютер для анализа теории и метода данных, или теории и метода интеллектуального анализа данных. Эта область особенно важна. Например, Премия Тьюринга — высшая награда в области информатики.В 2010 и 2011 годах Премия Тьюринга вручалась ученым, которые в течение двух лет подряд внесли выдающийся вклад в машинное обучение.Это большая редкость в истории Премии Тьюринга. ., что прямо отражает то значение, которое все придают этой области.

Машинное обучение вошло в историю, потому что оно должно решить узкое место в получении знаний. Но только в конце 20-го века люди начали обнаруживать, что они погружены в океан данных, нам срочно нужны были технологии для анализа данных, и в это время появилось машинное обучение, и наша потребность в нем была очень высока. Сегодня мы все знаем, что живем в эпоху больших данных, и мы чувствуем, что получение больших данных похоже на получение большого количества сокровищ. Но на самом деле это только один аспект.Большие данные похожи на шахту.После владения шахтой, если вы хотите получить в ней ценность, вы должны иметь очень мощную технологию анализа данных, а сегодняшний анализ данных в основном опирается на машинное обучение . Поэтому в эпоху больших данных технология машинного обучения неотделима от того, чтобы данные играли свою роль. Так что теперь технология машинного обучения распространена повсеместно, будь то интернет-поиск или распознавание лиц, автономное вождение, марсианские роботы, президентские выборы в США или даже анализ данных с полей сражений, используемых военными... До тех пор, пока у вас есть данные и вы хотите использовать компьютеры для помощи в анализе данных, вы можете использовать методы машинного обучения. Поэтому можно сказать, что бум искусственного интеллекта сегодня как раз из-за огромного развития машинного обучения, особенно технологии глубокого обучения, сыгравшего огромную роль.

Мы часто слышим слова «искусственный интеллект, машинное обучение, глубокое обучение». Как они связаны? Глубокое обучение — это ветвь машинного обучения, а машинное обучение — основная область исследований искусственного интеллекта. Хотя глубокое обучение может решить многие проблемы, и многие компании были основаны на основе технологии глубокого обучения, мы также должны отметить, что глубокое обучение не может «завоевать мир», и многие технологии машинного обучения играют роль во многих аспектах. Машинное обучение — это очень широкая предметная область, и ее ветви расширяются в геометрической прогрессии, поскольку требования к анализу данных продолжают появляться и расти. Глубокое обучение — это лишь небольшая его часть.

Ниже я хотел бы поделиться некоторыми своими мыслями о следующей эволюции машинного обучения. Для тех, кто знаком с машинным обучением, когда речь идет о машинном обучении, некоторые люди думают об алгоритмах, а некоторые — о данных. Можно сказать, что сегодняшнее машинное обучение существует в форме «алгоритм плюс данные». Какие технические ограничения существуют в этой форме?

Во-первых, нам нужно большое количество обучающих выборок. В эпоху больших данных большое количество обучающих выборок перестало быть проблемой, на самом деле это все еще большая проблема. В первом случае в некоторых приложениях общее количество выборок очень мало.Например, при локализации нефтяных месторождений данные должны быть получены по искусственно индуцированным землетрясениям.Поэтому стоимость получения таких данных очень высока, и это невозможно использовать большой объем данных. Во втором случае данных много, но очень мало того, что нас действительно интересует. Например, при обнаружении банковского мошенничества банк может иметь миллионы или даже десятки миллионов данных о транзакциях по кредитным картам каждый день, но реальных данных о мошенничестве с кредитными картами может быть очень мало. Также бывает ситуация, когда общий объем данных велик, но данных с известными результатами очень мало. Например, при обнаружении дефектов программного обеспечения, несмотря на большой объем программного кода, данных, которые фактически отмечают дефект, очень мало. Поэтому даже в эпоху больших данных мы все еще надеемся сделать хорошую модель с небольшим объемом данных.

Во-вторых, после создания модели машинного обучения, если среда немного изменится, модель может дать сбой или производительность может значительно снизиться. Например, мы развернули 100 датчиков, а 60 датчиков вышли из строя через месяц. В это время я заново установил 60 датчиков. Можно ли использовать исходную модель? Извините, производительность модели в это время будет значительно снижена. Потому что она Людям сложно поставить новый датчик в исходное положение, качество и мощность сигнала, излучаемого датчиком, также сильно изменятся, и модель трудно адаптировать.

В-третьих, подавляющее большинство систем машинного обучения сегодня представляют собой черные ящики. Мы можем делать прогнозы, даже очень точные прогнозы, но нам трудно объяснить почему. Это затрудняет использование таких моделей в некоторых сценариях приложений с высоким риском. Например, нам нужно сделать прогноз землетрясений, предсказать, что сегодня будет землетрясение, а завтра, пожалуйста, эвакуируйтесь. Руководители обязательно спросят, почему вы приняли такое решение?Если модель - это черный ящик, то он может только сказать вам, что это должен быть результат.Что касается причины, то я не знаю. В этом случае это предложение не может быть принято.

Наконец, на самом деле существует множество других проблем, например, даже при одинаковых данных результаты, полученные обычными пользователями, и результаты, полученные экспертами, будут сильно отличаться. Другим примером является проблема конфиденциальности данных.Сейчас в крупных больницах много случаев.На основе этих данных можно сделать очень хорошую систему диагностики.В то же время данные медицинских карт общественных больниц могут быть относительно небольшими, и трудно сделать хорошую модель непосредственно на основе его данных. Общинным больницам нужна помощь, а крупные больницы рады помочь, но это трудно сделать. Поскольку после того, как данные о делах будут переданы, будут затронуты такие вопросы, как конфиденциальность данных, право собственности и т. д. Существует стена защиты данных, которая не позволяет нам эффективно делиться опытом машинного обучения.

Сегодня существует множество других проблем, с которыми сталкивается технология машинного обучения, и я перечислил лишь некоторые из них. Сегодня исследователи усердно работают над изучением всех аспектов, но если все эти аспекты будут разделены и решены один за другим, будет трудно избавиться от статус-кво «врача от головной боли и стопы». Итак, можно ли всесторонне рассмотреть все эти вопросы в целостном контексте?

Недавно нам пришла в голову новая идея, которую мы называем «обучающее ПО». Теперь у компьютеров есть аппаратное и программное обеспечение, и мы надеемся, что после нескольких лет исследований машинное обучение создаст продукт под названием «обучающее ПО».

Теперь многие люди создали свои собственные приложения для машинного обучения и готовы поделиться своими моделями. Мы можем изготовить эти модели и поставить их в одном месте. В будущем, когда новый пользователь захочет сделать собственное приложение, ему уже не нужно будет начинать с нуля, ему нужно просто выйти на рынок, чтобы посмотреть, есть ли что-то, что можно использовать напрямую. Например, если пользователь хочет иметь нож для разделки мяса, он никогда не будет добывать или ковать железо самостоятельно, а пойдет на рынок, чтобы узнать, можно ли купить такой нож. Даже если вы не можете купить нож для мяса, если вы найдете арбузный нож, принесете его домой и отполируете своими данными, он может стать очень полезным инструментом. Основная идея здесь заключается в том, что, надеюсь, мы сможем частично повторно использовать результаты других, и нам больше не придется начинать с нуля.

Для этого «обучающее ПО» должно состоять из двух частей: одна часть — это модель, а другая — спецификация, используемая для описания модели. Для этого модель должна обладать тремя важными характеристиками, а спецификация должна обеспечивать собственные характеристики. Если обучающее программное обеспечение действительно станет реальностью, только что упомянутые проблемы могут быть полностью решены. Например, поскольку он саморазвивающийся, он может адаптироваться к окружающей среде; он имеет свои собственные спецификации и больше не является черным ящиком; пользователи могут использовать модели других людей в качестве основы, и с ним проще получить производительность экспертного уровня. . Совместное использование моделей, а не данных, позволяет избежать таких проблем, как конфиденциальность и защита данных. Следовательно, если обучающее программное обеспечение может стать реальностью, на этом рынке может быть много моделей, и модели могут использоваться большим количеством людей и использоваться лучше, и они могут иметь более высокие цены. Это может даже привести к возникновению новой отрасли. Мы ожидаем, что после десяти-пятнадцати лет исследований, возможно, машинное обучение сможет перейти от формы «алгоритм плюс данные» к форме «обучающего программного обеспечения».