С появлением нового витка глобальной технологической революции искусственный интеллект стал новым направлением развития предприятий и новым двигателем волны интернет-революции.
Если 2017 год — это «первый год» распространения технологий искусственного интеллекта, то 2018 год — это «год приземления» технологий искусственного интеллекта. Внимание людей также будет постепенно переключаться с соревновательных действий, таких как игра в го, на использование искусственного интеллекта для действительного решения проблем, стоящих перед миром. В этом контексте многие стартапы в области искусственного интеллекта сталкиваются с проблемами, но компании, пережившие большую волну, и традиционные предприятия, которые успешно трансформировались, могут стать лидерами индустрии искусственного интеллекта будущего.
15 мая конференция TIC «Когда AI встречает облако: применение и практика искусственного интеллекта» была посвящена практическому применению и практике искусственного интеллекта.Главные эксперты и технологии из UCloud, Uisee Technology, Fourth Paradigm и Beijing Chushi Technology. ответственное лицо обсудило, как использовать технологию облачных вычислений для ускорения внедрения технологий и приложений ИИ, таких как машинное обучение, глубокое обучение и визуальные вычисления. Эта статья систематизирует сухое содержание живой речи лектора, надеясь дать вам некоторые размышления и ссылки.
С ростом индустрии искусственного интеллекта технологии искусственного интеллекта постепенно стали применяться во всех сферах жизни. Однако то, как быстро и эффективно внедрять приложения ИИ, стало огромной проблемой, будь то традиционная интернет-компания, которая впервые занимается приложениями искусственного интеллекта, или стартап-компания в области искусственного интеллекта. Эксперт по технологиям искусственного интеллекта UCloud Сун Сян объединил многолетний опыт UCloud в области общедоступных облаков, чтобы предложить решение UCloud по внедрению ИИ, которое помогает быстро исследовать, разрабатывать и развертывать приложения ИИ, предоставляя простой в использовании, стабильный и экономичный Платформа AI PaaS.
Как объединить технологию ИИ с конкретными промышленными приложениями и найти реальную сцену, очень важно для развития предприятия Сун Сян объединил реальный опыт UCloud, чтобы решить технические проблемы приземления ИИ.
Во-первых, основное окружение. Базовая среда включает в себя не только каркас ИИ, но и библиотеки алгоритмов, различные аппаратные устройства и несколько типов хранилищ. Пересечение этих вариантов создает очень сложную среду. Как контролировать базовую среду и упростить ее использование разработчиками — вот первая задача.
Во-вторых, построение систем ИИ. Внедрение ИИ требует интегрированной системы ИИ, может ли она быть лучше совместима с различными платформами и алгоритмами ИИ, имеет ли платформа возможность горизонтального расширения, поддерживает постоянное расширение масштаба бизнеса и обладает ли она эластичной масштабируемостью и аварийным восстановлением. возможности и т. д., все из которых выдвигают более высокие требования к совместимости алгоритма, масштабируемости платформы, распределенной системы и системы вертикального расширения.
В-третьих, вход и выход. Как получить более высокую прибыль с меньшими инвестициями — это проблема, которую должны учитывать инвесторы в области ИИ. Например, как проверять идеи с меньшими ресурсами и меньшими инвестициями на этапе исследований, как снизить затраты на исследования и разработки при разработке приложений ИИ, чтобы персонал, занимающийся исследованиями и разработками, мог больше сосредоточиться на алгоритмах, и как сократить затраты ресурсов и эксплуатационные расходы.
В ответ на проблемы, с которыми сталкивается технология посадки ИИ, Сун Сян предложил решение UCloud. С точки зрения UCloud, основным методом является платформизация. Чтобы достичь платформизации, необходимо достичь общей разработки в четырех измерениях: разделение среды, распределение, масштабируемость и совместное использование ресурсов.
Первый – экологическое разделение, которое делится на 3 основных направления:
Во-первых, программный стек и базовые ресурсы уровня программного обеспечения ИИ изолированы посредством упаковки контейнера, во-вторых, облачный хост ЦП, облачный хост ГП, физический облачный хост и базовые ресурсы ГП или ресурсы ЦП изолированы посредством контейнер, и, наконец, через уровень доступа к программному обеспечению.Изолируйте хранилище и вычисления, чтобы позволить большему количеству ресурсов хранения быть подключенными к среде ИИ.
Среди них базовая идея разделения среды включает в себя две основные технологии, первая — технология контейнеров, а вторая — технология доступа к данным.
Контейнерная технология разделена послойно. Примером является программный стек на рисунке ниже.Нижний уровень – это базовая среда, а средний – вычислительная библиотека, такая как ЦП или ГП. На этой основе накапливаются различные фреймворки ИИ для расширения реализации алгоритмов ИИ. и коды.
Таким образом, контейнерная технология может принести пользу в пяти областях:
упаковка. Операционная среда полностью изолирована, и программных конфликтов между разными задачами не будет.
предварительно установлен. Базовый образ имеет встроенные различные базовые программные среды, чтобы уменьшить затраты пользователя на подготовку среды.
бесплатно. Различные программные пакеты могут быть установлены бесплатно для инкапсуляции различных алгоритмов.
Многоразовый. Образ контейнера алгоритма можно использовать повторно.
совместимость. Образы контейнеров графического процессора могут работать на узле графического процессора любого типа. Образы контейнеров ЦП могут работать на узле ЦП любого типа.
Технология доступа к данным должна предоставлять два интерфейса, локальное хранилище и NFS, чтобы вычислительные узлы верхнего уровня могли получать доступ к различным уровням данных и выполнять такие функции, как передача интерфейса, управление полосой пропускания и даже управление разрешениями через уровень доступа к данным.
Точно так же технологии доступа к данным могут принести множество преимуществ:
упаковка. Логика вычислительного узла не должна поддерживать различные интерфейсы хранения, а должна только подключаться к различным типам хранилищ через 2-3 (например, локальное хранилище, NFS) интерфейсы.
гибкий. Расширяя типы хранилищ, к которым может обращаться уровень доступа к данным, также можно расширить типы доступа к данным платформы ИИ.
стабильность. Уровень доступа к данным может контролировать поток данных, обеспечивать выполнение SLA для каждой задачи и в то же время защищать пропускную способность и поток серверной системы хранения данных.
Безопасность. Контроль доступа к данным для обеспечения безопасности данных.
После разделения программного обеспечения вы можете рассмотреть возможность создания обучающей платформы, включая планирование задач, управление ресурсами и устойчивость к сбоям.
В то же время вы также можете создать онлайн-платформу для рассуждений, с помощью которой вы можете быстро развертывать свои собственные распределенные онлайн-задачи.
Когда платформа построена, ее легко расширить по горизонтали и вертикали. Например, вертикальное расширение, вы можете управлять кластерами ЦП и кластерами ГП через систему управления платформой, а также быстро увеличивать собственный пул ресурсов.
На готовой платформе кластеры ЦП, ГП и хранилища могут управляться единообразно, и эти ресурсы могут быть разделены между различными бизнес-группами или разными компаниями, что повышает коэффициент использования ресурсов.
Как один из первых публичных облачных стартапов, созданных в Китае, можно сказать, что развитие ИИ является общей тенденцией для UCloud, и это само собой разумеющееся. Итак, какую роль публичное облако играет в среде посадки ИИ?
В общем, при использовании общедоступного облака для реализации ИИ первое, что вам понравится, — это услуги IaaS.
ресурс. Достаточные вычислительные ресурсы, ресурсы хранения и сетевые ресурсы снижают стоимость приобретения и обслуживания ресурсов в процессе исследований и разработок ИИ.
базовая среда. Предоставляйте образы виртуальных машин, образы контейнеров и другие услуги. Уменьшите сложность развертывания среды ИИ во время исследований и разработок ИИ и его применения.
Основные услуги. Предоставляет базовые услуги, такие как балансировка нагрузки (ULB) и распределенное хранилище. Сократите затраты на исследования и разработки в процессе производства приложений ИИ.
Во-вторых, вы также можете пользоваться услугами PaaS публичного облака:
Окружающая инкапсуляция. Предоставить предустановленную базовую среду ИИ, включая драйвер графического процессора NV, Cuda, TensorFlow/MXNet и другие платформы, пользователям не нужно выполнять сложную установку и настройку среды;
распределенный. Обеспечьте обучающую платформу ИИ и платформу онлайн-сервиса ИИ, предоставьте универсальный ИИ, пользователям не нужно создавать сложные платформы ИИ;
Горизонтальное расширение. Обеспечьте достаточное количество ресурсов ЦП/ГП, которые можно свободно расширять по горизонтали, и пользователям не нужно беспокоиться о проблемах с ресурсами;
Вертикальное расширение. Благодаря разнообразию типов вычислительных ресурсов и сетевых ресурсов хранения пользователи могут свободно выбирать подходящую комбинацию;
Гибкий биллинг. Основываясь на правилах выставления счетов на уровне секунд и минут, пользователи могут взимать плату по требованию, и пользователям не нужно беспокоиться о трате ресурсов.
Помимо программных технологий, применение искусственного интеллекта также неотделимо от поддержки аппаратного оборудования. Пан Чжэн, глава отдела технологий искусственного интеллекта в UISEE, объяснил практику применения методов глубокого обучения в реальном времени на встроенных устройствах, в том числе требования и проблемы визуального распознавания в автономных вождениях и сверточных сетях со сбалансированной эффективностью и точностью.
С развитием технологии автономного вождения автомобиля бортовая оптическая система и бортовая радиолокационная система приобретают особое значение для обеспечения безопасности вождения.
В настоящее время, когда речь заходит о технологии восприятия окружающей среды для автономных транспортных средств, многие в первую очередь думают о лидаре. Действительно, по сравнению с бортовыми датчиками, такими как камеры и радары миллиметрового диапазона, лидары обладают преимуществами высокой точности и высокого разрешения, но пока не стали популярными из-за высокой цены. Поэтому, в дополнение к существующим лидарным решениям, поиск более дешевого решения для восприятия окружающей среды стал проблемой для многих предприятий. В ответ на эту проблему появилось визуальное восприятие.
Зрительное восприятие включает в себя следующие характеристики:
Раз, больше информации. Датчики на основе лидара в основном обеспечивают некоторое восприятие облаков и восприятие глубины, но цвет и текстура объектов не могут быть восприняты. Например, если впереди есть препятствие, лидарный датчик не может определить, машина это или человек, а знает только информацию о форме, но не информацию о текстуре. Но благодаря визуальному восприятию вы можете узнать его специфические цветовые характеристики и конкретные характеристики текстуры, а также потенциально получить больше информации, чтобы помочь в принятии решений и контроле.
Во-вторых, поле зрения шире. Лидар имеет поле зрения от 30 до 60 градусов вверх и вниз и имеет максимум 64 пикселя восприятия. Как вы можете себе представить, если изображение имеет только 64 пикселя сверху и снизу, изображение будет очень размытым. Но через камеру, чтобы воспринимать окружающую среду, есть 720 пикселей вверх и вниз, чтобы воспринимать окружающий мир, что может помочь вам получить больше информации.
В-третьих, инфраструктура более скоординирована. Дизайн дорог, препятствия, различные сигнальные огни и дорожные знаки предназначены для передачи визуальной информации.
В-четвертых, оборудование дешевле. Лидар — очень дорогое устройство, по сравнению с фотоаппаратом его стоимость в десятки, а то и сотни раз превышает цену, колеблется от десятков тысяч до сотен тысяч. И визуальное восприятие может иметь гражданские, практические требования к продукту.
Основываясь на характеристиках визуального восприятия, UISEE придает большое значение разработке алгоритмов визуального распознавания и надеется использовать встроенную платформу графического процессора для выполнения всех вычислений, необходимых для визуального восприятия. Это требует большой работы по оптимизации сжатия сети, чтобы эффективность и точность могли обеспечить более сбалансированный выбор сети.
Сравнивая известные сети за последние годы, вы обнаружите, что если вы хотите повысить уровень точности примерно на 10%, вам придется платить в десятки раз больше суммы вычислений, поэтому вы должны использовать наиболее точную сеть, чтобы соответствовать требованиям. требования к точности автономного вождения?
Пан Чжэн представил две быстрые сети, первая из которых — PVANet, как показано на следующем рисунке:
PVANet превращает исходную стандартную свертку в две части: одна часть является нормальной сверткой, а другая часть инвертирует результат свертки, а затем объединяет его с исходным результатом свертки. Это не только экономит половину вычислений, но и позволяет получить карту объектов с удвоенной вычислительной размерностью. В результате UISEE провел тест производительности обнаружения людей и транспортных средств в сети PVANet.Тест показал, что для относительно плотных сцен PVANet может обнаруживать всех людей и транспортные средства без необходимости использования сотен или даже тысяч слоев.Интернет. Следовательно, вполне возможно применить сеть, подобную PVANet, для автоматического вождения, чтобы полностью обнаруживать людей и транспортные средства в реальном времени.
Второй — MobileNet, как показано на следующем рисунке:
Его основной принцип заключается в декомпозиции трехмерной свертки и декомпозиции на две части. Первая часть выполняет двумерную свертку на каждой выходной карте, превращая трехмерную свертку в двумерную, уменьшая объем вычислений. На рисунке перечислены кратные уменьшения суммы расчета.Числитель — это сумма расчета MobileNet после разложения, а знаменатель — сумма расчета исходной стандартной свертки.Можно обнаружить, что ее сумма расчета является одной из исходных DK квадратов плюс одна N-я, то есть, если используется свертка 3 × 3, она станет одной девятой от исходной суммы расчета с помощью метода MobileNet, а также может гарантировать ту же точность, что и оригинал.
Развитие облачных вычислений ускорило внедрение машинного обучения.Помимо спроса на вычислительную мощность в облачных вычислениях, каждое предприятие должно учитывать, как построить надежную систему машинного обучения на основе облачных вычислений. Йе Лиденг, старший директор по исследованиям и разработкам UCloud, взял онлайн-систему логического вывода в качестве примера, чтобы продемонстрировать дизайн и реализацию платформы машинного обучения, включая управление ресурсами, проектирование и реализацию архитектуры.
Бессерверность означает, что логика на стороне сервера, реализованная разработчиком, работает в вычислительном контейнере без сохранения состояния. Она запускается событиями и полностью управляется третьей стороной. Ее состояние на бизнес-уровне записывается базой данных и ресурсами хранения, используемыми разработчиком. . Как показано ниже:
Верхняя часть рисунка описывает модель традиционной архитектуры интернет-приложений: пользовательское клиентское приложение APP взаимодействует с резидентным процессом, развернутым на стороне сервера, а процесс на стороне сервера обрабатывает большую часть процессов бизнес-логики приложения. Во второй половине описывается бессерверная архитектурная модель. Самое большое отличие от модели традиционной архитектуры заключается в том, что большинство процессов бизнес-логики интернет-приложений передаются клиенту, и клиент выполняет стандартные бизнес-сценарии, такие как вход в систему, аутентификация и чтение базы данных, вызывая интерфейсы сторонних служб; custom Настраиваемая бизнес-логика завершается вызовом сторонней платформы FaaS для выполнения пользовательского кода. В общем, бессерверная архитектура разделяет весь ряд фоновых процессов на стороне сервера в традиционной архитектуре на выполнение вызовов сторонних сервисов или вызовов FaaS на стороне клиента.
В бессерверной архитектуре разработчикам программного обеспечения и инженерам по эксплуатации и обслуживанию больше не нужно заботиться о развертывании, установке и масштабировании серверов.Решение этих проблем остается за поставщиками облачных платформ, а программисты могут направить свою энергию на реализацию бизнес-логики с помощью код, а не сервер управления. Бессерверность не означает, что серверы больше не нужны, но применение, использование, планирование и масштабирование серверных ресурсов автоматически реализуются поставщиками облачных услуг, и разработчикам приложений не нужно заботиться об этом.
Основываясь на четырех характеристиках: бессерверность, отсутствие управления, гибкое расширение, высокая доступность и оплата по мере использования, можно построить корпоративную систему искусственного интеллекта, которая в основном делится на три этапа:
Первым шагом является создание базовой вычислительной платформы.
Второй шаг, управление приложениями верхнего уровня, удобен для пользователей для управления моделью.
Третий шаг — предоставить SDK. Пользователям удобно использовать систему на разных фреймворках.
Итак, как построить вычислительную платформу, которая удовлетворяет бессерверным технологиям, нам нужно сначала рассмотреть два вопроса.
Во-первых, я надеюсь, что пользователям не нужно эксплуатировать и поддерживать эту вычислительную платформу при использовании этой вычислительной платформы.
Во-вторых, есть надежда, что при использовании этой вычислительной платформы пользователями будут выставляться счета в соответствии с фактическим потреблением вычислительных ресурсов, а не в соответствии с конфигурацией.
На следующем рисунке представлена схема простого PUC:
Предполагается, что при построении этой системы внешнему миру предоставляются две возможности: одна возможность — позволить пользователям загружать алгоритмы, упаковав их в докер, а другая — позволить пользователям отправлять задачи и вычислительные задачи. Укажите путь, по которому API загружается в репозиторий docker, а затем верните результат расчета через API.
На следующем рисунке показана подробная архитектура центральной платформы:
Это архитектура вычислительной платформы, полностью основанная на платформе IaaS, с преимуществами аварийного восстановления в зонах кросс-доступности, развертывания наборами, выпуска в оттенках серого и параллельного расширения всех модулей.
После создания этой системы вам необходимо добавить слой APP Engine на вычислительную платформу.Используя этот уровень, вы можете создать приложение.Алгоритм, соответствующий этому приложению, является вашим образом докера, который можно использовать для управления или переключения доступа к различным версии. .
С вычислительной платформой и APP Engine два уровня услуг, система логического вывода машинного обучения в основном отсутствует.На следующем рисунке показана окончательная схематическая диаграмма всей фреймворковой системы.Когда придет запрос, я надеюсь, что модель ИИ Код вывода непосредственно упаковывается и размещается на вычислительной платформе, к бизнесу можно получить прямой доступ через пересечение, предоставляемое APP Engine, или можно получить доступ к модели.
В эпоху сильного ИИ ожидания людей в отношении интеллектуального обслуживания клиентов, активного во всех сферах жизни, становятся все выше и выше. Син Шаоминь, руководитель отдела интеллектуального обслуживания клиентов 4Paradigm, представил практику применения технологии искусственного интеллекта 4Paradigm в сфере обслуживания клиентов, в том числе поделился принципом работы интеллектуального обслуживания клиентов, связанной с этим обработкой естественного языка, машинным обучением, глубоким обучением и другими используемыми технологиями. , а также технические трудности в развитии интеллектуального обслуживания клиентов.
Зачем нужна служба поддержки? Зачем нужно интеллектуальное обслуживание клиентов? Я верю, что все поймут. Во многих отраслях на самом деле существует проблема обслуживания клиентов, будь то авторизованная консультация или послепродажное обслуживание и т. Д., Большое количество проблем повторяется, и эти повторяющиеся проблемы будут напрасно тратить много людей. Однако большое количество ценных данных, таких как записи чатов и исторические записи, простаивают и не используются. Так что в этом случае есть умная служба поддержки клиентов.
Типичные общие функции интеллектуального обслуживания клиентов можно разделить на три категории:
Первая категория представляет собой один раунд вопросов и ответов.
Вторая категория — многораундовый диалог.
Третья категория — взаимодействие человека и машины.
Принцип работы интеллектуального обслуживания клиентов в основном такой же, как и у различных производителей интеллектуального обслуживания клиентов, и все они работают в одном направлении, как показано на следующем рисунке:
Сначала нужен модуль распознавания речи, чтобы распознавать речь клиента в текст, затем понимать текст, затем выполнять распознавание намерений и, наконец, распространять его в системе управления диалогами.
В частности, принцип работы интеллектуального обслуживания клиентов разделен на следующие модули:
1. Обработка естественной речи, такая как сегментация слов, клаузулы, маркировка частей речи, синтаксический анализ, денотативное разрешение, веса предложений, семантическое сходство и т. д., а также типы и шаблоны вопросов. Они проведут всесторонний анализ проблемы пользователя на первом этапе, а затем сохранят ее.
2. Распознавание намерений с помощью некоторых из предыдущих результатов обработки естественного языка делится на два метода: один — метод шаблона, а другой — метод классификатора. Способ шаблона очень прост, анализ намерений выполняется путем сравнения с шаблоном. Метод классификатора заключается в том, чтобы вручную пометить данные после сбора большого количества данных в определенном поле, а затем обучить его, чтобы он стал классификатором для распознавания намерений. Эти два метода имеют свои преимущества и недостатки.Проблема метода шаблона заключается в том, что, хотя он очень точен, его способность к рисованию относительно слабая.Метод классификатора обладает сильными способностями к рисованию, но ему не хватает большого количества данных.
3. База знаний, база знаний на самом деле является наиболее важным режимом интеллектуальной системы обслуживания клиентов.Его подход в основном аналогичен подходу поисковой системы, который в основном делится на два этапа.
Первым шагом является отзыв наборов-кандидатов. Вспомните некоторые наборы кандидатов из базы знаний, которые могут быть похожи на проблему.
Второй шаг — переоформление. Раскройте релевантность с помощью сходства текста, сходства предложений, моделей сходства нейронных сетей или слияния нескольких моделей.
4. Граф знаний. Разница между графом знаний и базой знаний заключается в том, что база знаний представляет собой структуру вопросов и ответов или древовидную структуру, а граф знаний представляет собой графоподобную структуру.
Распространенными инструментами для графов знаний являются Neo4j, OrientDB, Titan и т. д.
5. Технология диалога, есть также три способа технологии диалога, первый - заполнение слота конечного автомата, второй - метод MDP, а третий - сквозная модель, часто используемая в академических кругах, я надеюсь используйте огромную модель Решите любые возникающие проблемы.
Как показано ниже:
Слева схематическая диаграмма загрузчика, а справа MDP, представляющая собой принципиальную схему марковского процесса принятия решений.
6. Чат-боты. На самом деле, есть два метода. Один – использование нейронной сети. Основным является использование нейронной сети или статистической модели. Модель обучается путем сбора большого количества корпусов. Пока корпусов достаточно, эффект будет достаточно хорошо. Второй — модельный метод, но проблема в том, что он неточен и требует большого объема корпуса.
В большинстве случаев для обучения модели недостаточно данных
Услуги SaaS охватывают разные области, и проблема нехватки данных более актуальна.
Общая модель обучения языку, а затем оптимизация модели после роста данных
Сначала используется система правил, данные достигают определенного количества, и модель используется
Многодоменный диалог остается трудным:
Ведение разговоров на основе поля за полем слишком дорого
Общее управление диалогами не идеально
Переключение сцен не может быть выполнено плавно
Не допускайте, чтобы переключение сцен выглядело жестким
Сложность переключения сцен значительно улучшена
Существующий способ по-прежнему роботизированный
Роботы не могут ответить, отвечают люди
Робот рекомендует ответы людям
Исследуя, чтобы роботы были главными, а люди дополнялись
Повысить точность ответов робота
Улучшить способность робота к самообучению
Помимо общего интеллектуального обслуживания клиентов, ИИ в последние годы также блистал в сфере образования.Ли Шугуан, генеральный директор Beijing Chushi Technology, поделился своими решениями в области оценки устной речи и исправления домашних заданий с помощью ИИ, а также проанализировал «изображение», «голос», техническая практика «обработки естественного языка» и другие технологии на прикладном уровне.
В основном существует два типа технологий оценки, основанных на продуктах, которые можно увидеть на рынке сегодня.
На основе GOP (Хорошее произношение): (например, свободное владение английским языком, интересный английский дубляж в детской сфере)
Его основные технологии:
Принудительное выравнивание, сравнение баллов фонетической модели, обнаружены проблемные произношения, ритм, скорость и беглость;
Добавить распознавание голоса;
Глубокое обучение: CNN, DNN;
мобильный.
Технология устной оценки Freetalk: (Применяется к открытым вопросам TOEFL или IELTS)
Его основные технологии:
Анализ речи: анализ и извлечение признаков таких аспектов, как произношение, ударение, интонация, скорость и беглость речи.
Распознавание речи. Распознавание речи для тех, кто не владеет английским языком, использование методов углубленного обучения и точность распознавания являются ключом к извлечению содержимого разговорного языка.
Анализ обработки естественного языка: анализ и извлечение признаков идентифицированного контента в нескольких измерениях, таких как релевантность темы, семантическая согласованность, грамматические ошибки, использование словарного запаса и словосочетание.
Автоматическое подсчет очков: слияние нескольких моделей, большое количество корпусов для устного обучения.
Сценарии применения:
1. Автоматическая оценка и исправление устных тестов TOEFL и IELTS: В настоящее время ручная оценка может быть заменена ручной работой со средней ошибкой около 2 баллов (30 полных баллов), что значительно сокращает повторяющуюся работу учителей. 2. Сокращение TOEFL и сокращение IELTS: поток вопросов банка продуктов, охватывающий более 80% иностранных кандидатов. Накопленные миллионы студентов используют,
К основным методам оценки относятся:
Проверка грамматических ошибок: согласование подлежащего и глагола, использование формы глагола, словосочетание, использование артикля, часть речи, выбор слова, использование предлога, время глагола, правописание, использование заглавных букв в именах собственных и предложениях и т. д.
Извлечение функций анализа обработки естественного языка: анализируйте и подсчитывайте особенности текста в сочинениях учащихся, включая сложность слов, словосочетание, организацию текста, связность обсуждения и его не по теме, может ли аргументированная статья поддержать аргумент и т. д. .
Механизм автоматической оценки: для определенных типов тестов мы используем алгоритмы машинного обучения (классификация, сортировка) для динамической корректировки весов вышеуказанных аспектов и стандартов окончательной оценки, а также для обучения соответствующих моделей оценки Окончательная система может быть задана в нескольких измерениях. , Подробные аналитические отчеты и отзывы;
Методы слияния, такие как CNN.
Сценарии применения:
1. Автоматическая оценка и исправление составов, таких как младшая школа, TOEFL и IELTS: вместо ручной оценки средняя ошибка составляет около 2 баллов (30 баллов из 10), аналогично e-rater ETS;
2. На основе массовых исследований и разработок данных ручной коррекции, намного опережает аналогичные продукты по количеству и точности обнаружения грамматических ошибок и сопоставим с Grammarly, крупнейшим в мире механизмом коррекции пользователей.
Точки знаний создают карту знаний.
Метки вопросов: очки знаний, сложность, тип вопроса, возможность проверки и т. д.
Согласно анализу данных результатов пробного теста, можно более точно предоставлять персонализированные планы подготовки к тесту для учащихся с разными способностями, а также своевременно подталкивать и корректировать траекторию обучения.
Адаптивный тест: Теория ответов на вопросы (IRT), смоделированная в соответствии с трудностью, дискриминацией и т. д., с меньшим количеством вопросов тест является более точным.
Следующие области представляют собой направления, на которых сосредоточена технология Chu Shi (в настоящее время она не очень хорошо разработана, и ожидается, что она прорвется в будущем). Необходимо сотрудничать с учебными заведениями K12 или государственными школами.
Распознавание рукописных формул: вы можете обратиться к компании MyScript в США, которая повзрослела. Но есть проблемы, такие как разрывы строк.
Распознавание субъективных вопросов, таких как математика: точность рукописных формул, распознавание букв и распознавание китайских иероглифов было улучшено и стало зрелым.
Решение и исправление математических прикладных задач: становление зрелым.
Решение и исправление задач по математике и геометрии в средней и старшей школе: еще есть возможности для повышения точности решения задач, и текущая точность превысила 70%; исправление становится зрелым.