Адаптивное обучение: применение машинного обучения в Happy Word Field

Источник контента:11 июня 2017 г. Ван Синьи, директор Hujiang Data Mining, выступил с речью на тему «Адаптивное обучение: применение машинного обучения в поле Happy Word» на «Совместном форуме Ele.me и Qiniuyun, посвященном новейшей практике применения на основе сценариев Большие данные». IT big coffee сообщил, что как эксклюзивный видео-партнер, он был выпущен с разрешения организатора и спикера.

Количество слов для чтения:2768 | 4 минуты чтения

Видеообзор и PPT выступлений гостей:t.cn/RncA1LB

Резюме

Образование является наиболее традиционной и сложной социальной деятельностью.Как использовать технологию искусственного интеллекта (машинного обучения) для преобразования и продвижения человеческого самообучения (повышение эффективности обучения и эффекта обучения) является основной проблемой интернет-образования больших данных и майнинга; краткое введение к применению технологии ИИ Различные линейки продуктов Shanghai Jiang (основная часть включает в себя помощь студентам в «персонализированном» обучении и помощь учителям в преподавательской работе), уделяя особое внимание совместному использованию: использование технологии DM, ML в сочетании с RM (Модель удержания), IRT (IRT (Item Response Theory), DKT (Deep Knowledge Tracing)) и другие модели для применения практики и познания в области счастливых слов.

Об образовании и интернет-образовании

Образование — самая традиционная, сложная и широкомасштабная социальная деятельность, а учеба болезненна, человек не любит учиться, но стремится расти.

Интернет-образование характеризуется низкой частотой и высокой интерактивностью. Наша миссия состоит в том, чтобы использовать технологию машинного обучения для преобразования и продвижения человеческого самообучения, сделать обучение более счастливым, а также повысить эффективность обучения и эффект обучения.

Применение машинного обучения в Hujiang.com

Применение машинного обучения в Hujiang.com в основном начинается с четырех измерений: учителя (сетевые учителя), ученики, контент и инструменты, и создает четыре сценария применения:

Адаптивное обучение, взаимодействие человека с компьютером, мониторинг учебного процесса, обработка контента.

сетевой мастер

Машинное обучение, основанное на больших данных, может помочь веб-мастерам лучше понять студентов, самих себя и весь рынок.

Понимание студентов заключается в том, чтобы знать, как учатся все студенты, которые изучают курс, и знать степень мастерства в каждой детали знаний.

Понимание самого себя заключается в том, чтобы обнаружить, какие точки знаний, процессы или узлы в ходе лекций сетевого учителя вызовут у всех проблемы с пониманием, и помочь сетевому учителю изменить программное обеспечение курса.

Взгляд на рынок — это обобщение того, какие курсы будут более популярны из общего направления.

С постепенным применением и развитием искусственного интеллекта в образовании и интернет-образовании роль учителей (сетевых учителей) также меняется, постепенно переходя от роли «передачи знаний» к «тренировке способностей» и «тренировке нравственности».

ученик

Адаптивное обучение делится на интеллектуальные услуги репетиторства и интеллектуальные помощники в обучении. Интеллектуальное руководство по обучению должно разделить курс на разные блоки знаний и предоставить разные разумные пути обучения для каждого человека. Интеллектуальный помощник по обучению должен переопределить расположение учителя и машины и передать часть повторяющейся работы учителя машине.

На основе обширных больших данных мы в полной мере используем технологии анализа данных, интеллектуального анализа данных и машинного обучения и строим пользовательские модели с учетом потребностей в обучении, готовности учиться, способностей, экономических способностей и настойчивости на основе подробного обучения учащихся. данные траектории.

Внесите некоторые высокоинтерактивные улучшения в процесс обучения (система обучения), оптимизируйте содержание и дизайн учебных программ, порекомендуйте темы и учебные материалы в библиотеках контента, таких как банки вопросов, и обеспечьте разумный цикл оценки в процессе экзамена, привнося богатый и разнообразный обучение, опыт.

содержание

На образовательной сцене существуют различные роли, такие как учителя, ученики и помощники преподавателей. Во время взаимодействия с персонажем генерируется большой объем данных, включая, помимо прочего, текст, изображения, аудио, видео, поведение пользователя и другие формы контента. В традиционном обучении, за исключением нескольких частей, которые могут быть восприняты учителями, не используется большой объем данных.

Полностью собрать данные и построить систему маркировки для образовательной отрасли; с одной стороны, эти данные депонируются в структурированные знания, так что они имеют обучающую ценность; с другой стороны, в различных сценариях применения эти данные также могут помочь с коммерциализация.

Система маркировки и измерения: в образовательных сценариях существует большое количество измерений.Благодаря интеллектуальному анализу данных и машинному обучению содержимое помечается, и выводятся соответствующие метки, корреляции и индексы измерения корреляции.

Создавайте карты знаний, банки вопросов и базы данных различных дисциплин и уровней. Содержание всех курсов и баллов знаний будет связано с графом знаний. Мы можем проделать большую работу на графе знаний, например, если точка знаний плохо усвоена, мы можем проанализировать и связать ее через граф знаний.

Обеспечьте некоторую поддержку данных с открытым исходным кодом и алгоритмов для ускорения производства контента и повышения коммерциализации контента.

инструмент

Применение машинного обучения в линейке инструментов в основном включает следующие три аспекта:

Глубокая интеграция с учебными сценариями через открытые интерфейсы;

Открытое восприятие поведения пользователей и анализ данных;

Применяйте интеллектуальные облачные сервисы.

Создавайте интеллектуальные и персонализированные инструменты для всего процесса обучения, обучения и тестирования с помощью технологий данных и машинного обучения.

Применение машинного обучения в поле счастливых слов

Happy Word Field - это инструмент для практики повторения слов под управлением Hujiang.Благодаря игровому режиму обучения, тестирования и повторения вы можете овладеть словарным запасом и сделать обучение более увлекательным. Применение машинного обучения в области счастливых слов в основном представляет два модуля: адаптивный словарный тест на основе модели IRT и персонализированный путь прорыва на основе модели памяти.

Тест адаптивного словарного запаса на основе модели IRT: на основе минимального взаимодействия пользователя с моделью IRT точно оценивается словарный запас пользователя, и на основе теста адаптивного словарного запаса рекомендуются некоторые разумные словари.

Адаптивный словарный тест на основе модели IRT

статическая экзаменационная работа: У всех одни и те же вопросы, и студенты тратят больше времени на простые вопросы, которые они точно ответят, и сложные вопросы, которые точно не ответят, что влияет на пользовательский опыт.

Динамическое интерактивное тестирование: у каждого учащегося свой вопрос, и следующий вопрос динамически меняется в зависимости от ответов на исторические вопросы. Алгоритмы могут фокусироваться на вопросах, в отношении которых алгоритм не уверен, и просить студентов ответить, тем самым избегая траты слишком большого количества времени на вопросы, которые они точно ответят и точно не ответят.

IRT (Item Response Theory)

Чем выше способности человека, тем больше вероятность правильного ответа;

Чем выше сложность слова, тем ниже вероятность правильного ответа и тем правильнее кривая;

Человеческие способности = сложность слова, тогда вероятность правильного ответа равна 0,5.

Как выбрать следующее слово?

Выберите слово, сложность которого наиболее близка к текущей оценке способности, и пользователь не ответил. Для этого слова P (правильный ответ | сложность слова, человеческая способность) ~ 0,5, что является наиболее неопределенным, что позволяет избежать двух слов, которые могут привести к пустой трате времени.

направление на улучшение

Гибридную IRT можно использовать при наличии нескольких путей обучения.

Используя глубокие нейронные сети, существующие данные можно хорошо объяснить.

Улучшение стратегии выдвижения вопросов заключается в использовании MDP.

Персонализированный сквозной путь на основе модели памяти

Персонализированный сквозной путь на основе модели памяти: в процессе запоминания слов кривая памяти рассчитывается в соответствии с характеристиками памяти каждого человека, и кривая памяти используется для установления разумных уровней. Алгоритмическая модель пути персонифицированного прорыва на основе модели памяти прошла три основных этапа: кривая памяти Эббингауза, интервальный эффект, Act-R, затем реализуется модель МКМ. Первый раздел (кривая памяти Эббингауза): в основном строится групповая кривая памяти Эббингауза и индивидуальная кривая памяти каждого учащегося; второй этап рассматривает эффект интервала для построения модели кривой; третий этап основан на алгоритмическом моделировании Act-R.

Кривая памяти Эббингауза→эффект интервала→Act-R→MCM

Вероятность экспоненциально убывает со временем:

где m, h, f — константы, которые интерпретируются как степень начального обучения (00) и индекс распада памяти (f>0)

Кривая памяти Эббингауза: y=1-0,56x^0,06

Влияние многократного обучения на память: Эффект интервала (Spacing effect) Интервал между двумя обучениями записывается как ISI (межсессионный интервал), а время между вторым обучением и финальным тестом записывается как RI (retention interval).

Act-R

ACT-R предполагает, что для каждого обучения будут разные траектории вероятности запоминания, а вероятность запоминания затухает как степенная функция со временем: tk, dk относятся к времени запоминания и индексу затухания k-й траектории, β равно студенту или Параметры, связанные с запоминанием вещей, которые влияют на силу памяти. bk относится к значимости каждой дорожки памяти.Чем больше число, тем лучше эффект обучения.

Затухание траектории связано с моментом времени, когда происходит обучение: здесь c и α - константы.Если интервал между k-м обучением и предыдущим относительно короткий, текущее будет затухать быстрее.

Вероятность припоминания монотонно связана с активностью памяти m: где и – соответствующие параметры. Вся модель имеет 6 свободных параметров.

MCM предлагает предположение, что каждое новое обучение хранится по разным траекториям и затухает с разной скоростью. Хотя каждая трасса затухает экспоненциально, сумма этих траекторий со временем затухает как степенная функция Например, трасса i xi затухает следующим образом:

где - постоянная времени затухания, а последующие трассы имеют относительно небольшие постоянные времени затухания, трассы 1-k используют средневзвешенное значение и, наконец, синтезируют общую интенсивность трассы.

в. yi — весовой коэффициент, представляющий вклад i-й траектории, причем среди всего k траекторий вероятность памяти минимальна среди них:

Основной причиной возникновения интервальных эффектов является правило обновления траекторий (Staddon et al., 2002). Трек обновляется только в том случае, если другие треки не могут сохранить память о материале. Это правило влияет на эффект запоминания информации при разной частоте появления и в разной среде. При усвоении материала рост вклада i-й траектории отрицательно связан с суммарной интенсивностью предшествующих траекторий:

Вот и все на сегодняшнем обмене, спасибо всем!