Источник контента:11 июня 2017 г. Ван Синьи, директор Hujiang Data Mining, выступил с речью на тему «Адаптивное обучение: применение машинного обучения в поле Happy Word» на «Совместном форуме Ele.me и Qiniuyun, посвященном новейшей практике применения на основе сценариев Большие данные». IT big coffee сообщил, что как эксклюзивный видео-партнер, он был выпущен с разрешения организатора и спикера.
Количество слов для чтения:2768 | 4 минуты чтения
Видеообзор и PPT выступлений гостей:t.cn/RncA1LB
Резюме
Образование является наиболее традиционной и сложной социальной деятельностью.Как использовать технологию искусственного интеллекта (машинного обучения) для преобразования и продвижения человеческого самообучения (повышение эффективности обучения и эффекта обучения) является основной проблемой интернет-образования больших данных и майнинга; краткое введение к применению технологии ИИ Различные линейки продуктов Shanghai Jiang (основная часть включает в себя помощь студентам в «персонализированном» обучении и помощь учителям в преподавательской работе), уделяя особое внимание совместному использованию: использование технологии DM, ML в сочетании с RM (Модель удержания), IRT (IRT (Item Response Theory), DKT (Deep Knowledge Tracing)) и другие модели для применения практики и познания в области счастливых слов.
Об образовании и интернет-образовании
Образование — самая традиционная, сложная и широкомасштабная социальная деятельность, а учеба болезненна, человек не любит учиться, но стремится расти.
Интернет-образование характеризуется низкой частотой и высокой интерактивностью. Наша миссия состоит в том, чтобы использовать технологию машинного обучения для преобразования и продвижения человеческого самообучения, сделать обучение более счастливым, а также повысить эффективность обучения и эффект обучения.
Применение машинного обучения в Hujiang.com
Применение машинного обучения в Hujiang.com в основном начинается с четырех измерений: учителя (сетевые учителя), ученики, контент и инструменты, и создает четыре сценария применения:
Адаптивное обучение, взаимодействие человека с компьютером, мониторинг учебного процесса, обработка контента.
сетевой мастер
Машинное обучение, основанное на больших данных, может помочь веб-мастерам лучше понять студентов, самих себя и весь рынок.
Понимание студентов заключается в том, чтобы знать, как учатся все студенты, которые изучают курс, и знать степень мастерства в каждой детали знаний.
Понимание самого себя заключается в том, чтобы обнаружить, какие точки знаний, процессы или узлы в ходе лекций сетевого учителя вызовут у всех проблемы с пониманием, и помочь сетевому учителю изменить программное обеспечение курса.
Взгляд на рынок — это обобщение того, какие курсы будут более популярны из общего направления.
С постепенным применением и развитием искусственного интеллекта в образовании и интернет-образовании роль учителей (сетевых учителей) также меняется, постепенно переходя от роли «передачи знаний» к «тренировке способностей» и «тренировке нравственности».
ученик
Адаптивное обучение делится на интеллектуальные услуги репетиторства и интеллектуальные помощники в обучении. Интеллектуальное руководство по обучению должно разделить курс на разные блоки знаний и предоставить разные разумные пути обучения для каждого человека. Интеллектуальный помощник по обучению должен переопределить расположение учителя и машины и передать часть повторяющейся работы учителя машине.
На основе обширных больших данных мы в полной мере используем технологии анализа данных, интеллектуального анализа данных и машинного обучения и строим пользовательские модели с учетом потребностей в обучении, готовности учиться, способностей, экономических способностей и настойчивости на основе подробного обучения учащихся. данные траектории.
Внесите некоторые высокоинтерактивные улучшения в процесс обучения (система обучения), оптимизируйте содержание и дизайн учебных программ, порекомендуйте темы и учебные материалы в библиотеках контента, таких как банки вопросов, и обеспечьте разумный цикл оценки в процессе экзамена, привнося богатый и разнообразный обучение, опыт.
содержание
На образовательной сцене существуют различные роли, такие как учителя, ученики и помощники преподавателей. Во время взаимодействия с персонажем генерируется большой объем данных, включая, помимо прочего, текст, изображения, аудио, видео, поведение пользователя и другие формы контента. В традиционном обучении, за исключением нескольких частей, которые могут быть восприняты учителями, не используется большой объем данных.
Полностью собрать данные и построить систему маркировки для образовательной отрасли; с одной стороны, эти данные депонируются в структурированные знания, так что они имеют обучающую ценность; с другой стороны, в различных сценариях применения эти данные также могут помочь с коммерциализация.
Система маркировки и измерения: в образовательных сценариях существует большое количество измерений.Благодаря интеллектуальному анализу данных и машинному обучению содержимое помечается, и выводятся соответствующие метки, корреляции и индексы измерения корреляции.
Создавайте карты знаний, банки вопросов и базы данных различных дисциплин и уровней. Содержание всех курсов и баллов знаний будет связано с графом знаний. Мы можем проделать большую работу на графе знаний, например, если точка знаний плохо усвоена, мы можем проанализировать и связать ее через граф знаний.
Обеспечьте некоторую поддержку данных с открытым исходным кодом и алгоритмов для ускорения производства контента и повышения коммерциализации контента.
инструмент
Применение машинного обучения в линейке инструментов в основном включает следующие три аспекта:
Глубокая интеграция с учебными сценариями через открытые интерфейсы;
Открытое восприятие поведения пользователей и анализ данных;
Применяйте интеллектуальные облачные сервисы.
Создавайте интеллектуальные и персонализированные инструменты для всего процесса обучения, обучения и тестирования с помощью технологий данных и машинного обучения.
Применение машинного обучения в поле счастливых слов
Happy Word Field - это инструмент для практики повторения слов под управлением Hujiang.Благодаря игровому режиму обучения, тестирования и повторения вы можете овладеть словарным запасом и сделать обучение более увлекательным. Применение машинного обучения в области счастливых слов в основном представляет два модуля: адаптивный словарный тест на основе модели IRT и персонализированный путь прорыва на основе модели памяти.
Тест адаптивного словарного запаса на основе модели IRT: на основе минимального взаимодействия пользователя с моделью IRT точно оценивается словарный запас пользователя, и на основе теста адаптивного словарного запаса рекомендуются некоторые разумные словари.
Персонализированный сквозной путь на основе модели памяти: в процессе запоминания слов кривая памяти рассчитывается в соответствии с характеристиками памяти каждого человека, и кривая памяти используется для установления разумных уровней.
Адаптивный словарный тест на основе модели IRT
статическая экзаменационная работа: У всех одни и те же вопросы, и студенты тратят больше времени на простые вопросы, которые они точно ответят, и сложные вопросы, которые точно не ответят, что влияет на пользовательский опыт.
Динамическое интерактивное тестирование: у каждого учащегося свой вопрос, и следующий вопрос динамически меняется в зависимости от ответов на исторические вопросы. Алгоритмы могут фокусироваться на вопросах, в отношении которых алгоритм не уверен, и просить студентов ответить, тем самым избегая траты слишком большого количества времени на вопросы, которые они точно ответят и точно не ответят.
IRT (Item Response Theory)
Чем выше способности человека, тем больше вероятность правильного ответа;
Чем выше сложность слова, тем ниже вероятность правильного ответа и тем правильнее кривая;
Человеческие способности = сложность слова, тогда вероятность правильного ответа равна 0,5.
Как выбрать следующее слово?
Выберите слово, сложность которого наиболее близка к текущей оценке способности, и пользователь не ответил. Для этого слова P (правильный ответ | сложность слова, человеческая способность) ~ 0,5, что является наиболее неопределенным, что позволяет избежать двух слов, которые могут привести к пустой трате времени.
направление на улучшение
Гибридную IRT можно использовать при наличии нескольких путей обучения.
Используя глубокие нейронные сети, существующие данные можно хорошо объяснить.
Улучшение стратегии выдвижения вопросов заключается в использовании MDP.
Персонализированный сквозной путь на основе модели памяти
Персонализированный сквозной путь на основе модели памяти: в процессе запоминания слов кривая памяти рассчитывается в соответствии с характеристиками памяти каждого человека, и кривая памяти используется для установления разумных уровней. Алгоритмическая модель пути персонифицированного прорыва на основе модели памяти прошла три основных этапа: кривая памяти Эббингауза, интервальный эффект, Act-R, затем реализуется модель МКМ. Первый раздел (кривая памяти Эббингауза): в основном строится групповая кривая памяти Эббингауза и индивидуальная кривая памяти каждого учащегося; второй этап рассматривает эффект интервала для построения модели кривой; третий этап основан на алгоритмическом моделировании Act-R.
Кривая памяти Эббингауза→эффект интервала→Act-R→MCM
Вероятность экспоненциально убывает со временем:
где m, h, f — константы, которые интерпретируются как степень начального обучения (0
Кривая памяти Эббингауза: y=1-0,56x^0,06
Влияние многократного обучения на память: Эффект интервала (Spacing effect) Интервал между двумя обучениями записывается как ISI (межсессионный интервал), а время между вторым обучением и финальным тестом записывается как RI (retention interval).
Act-R
ACT-R предполагает, что для каждого обучения будут разные траектории вероятности запоминания, а вероятность запоминания затухает как степенная функция со временем: tk, dk относятся к времени запоминания и индексу затухания k-й траектории, β равно студенту или Параметры, связанные с запоминанием вещей, которые влияют на силу памяти. bk относится к значимости каждой дорожки памяти.Чем больше число, тем лучше эффект обучения.
Затухание траектории связано с моментом времени, когда происходит обучение: здесь c и α - константы.Если интервал между k-м обучением и предыдущим относительно короткий, текущее будет затухать быстрее.
Вероятность припоминания монотонно связана с активностью памяти m: где и – соответствующие параметры. Вся модель имеет 6 свободных параметров.
MCM предлагает предположение, что каждое новое обучение хранится по разным траекториям и затухает с разной скоростью. Хотя каждая трасса затухает экспоненциально, сумма этих траекторий со временем затухает как степенная функция Например, трасса i xi затухает следующим образом:
где - постоянная времени затухания, а последующие трассы имеют относительно небольшие постоянные времени затухания, трассы 1-k используют средневзвешенное значение и, наконец, синтезируют общую интенсивность трассы.
в. yi — весовой коэффициент, представляющий вклад i-й траектории, причем среди всего k траекторий вероятность памяти минимальна среди них:
Основной причиной возникновения интервальных эффектов является правило обновления траекторий (Staddon et al., 2002). Трек обновляется только в том случае, если другие треки не могут сохранить память о материале. Это правило влияет на эффект запоминания информации при разной частоте появления и в разной среде. При усвоении материала рост вклада i-й траектории отрицательно связан с суммарной интенсивностью предшествующих траекторий:
Вот и все на сегодняшнем обмене, спасибо всем!