Что такое отслеживание знаний?
Основная задача отслеживания знаний состоит в том, чтобы автоматически оценивать изменение баллов овладения учащимися знаниями с течением времени в соответствии с их историческими траекториями обучения. Поняв уровень владения баллами знаний учащихся, они могут предоставить учащимся индивидуальное обучение, которое соответствует их собственным условиям обучения. В сфере образования по-прежнему необходимо использовать научные методы для целенаправленного отслеживания усвоения студентами знаний. Основываясь на массивных исторических данных обучения студентов, можно завершить моделирование процесса обучения студентов, чтобы модель могла автоматически отслеживать статус обучения студентов на каждом этапе, чтобы достичь цели адаптивного обучения. Некоторые ученые считают, что набор баллов знаний, освоенных учащимися, очень тесно связан с их внешней эффективностью при ответе на вопросы, поэтому мы можем попытаться смоделировать статус освоения учащимися баллов знаний через их результаты при ответе на вопросы [1].
В общем, задачи отслеживания знаний могут быть выражены в следующей математической форме: Дана историческая последовательность обучения учащегося А по конкретной учебной задаче., чтобы предсказатьпроизводительность на. как правиломожно представить в виде упорядоченной пары, упорядоченное выравниваниеуказывает на то, что ученикОтветы на вопросы все время,ипредставляет студентов вОтветы выше, вообще говоряПринимает значение 0 (неправильный ответ) или 1 (правильный ответ). На самом деле, если вы посмотрите на отслеживание знаний с точки зрения вероятности, оно по существу использует историческую эффективность ответов учащихся для прогнозирования правильных ответов учащихся в следующий момент времени.вероятность, то есть, которую можно интерпретировать как последовательность исторической успеваемости данного учащегося.И ввсегда в темеВ случае если учащиеся правильно отвечают на вопросывероятность .
Что такое глубокое отслеживание знаний?
После предварительного понимания того, что такое концепция отслеживания знаний, мы далее представляем нашего главного героя — DKT (Deep Knowledge Tracking) [2]. В настоящее время в мире существует множество интеллектуальных образовательных компаний, использующих родственные модели отслеживания знаний, такие как BKT (байесовское отслеживание знаний) и DKT (глубокое отслеживание знаний).Глубокое отслеживание знаний — это простое и интуитивно понятное использование методов глубокого обучения для получения знаний. отслеживание. Из экспериментальных результатов в статье DKT было обнаружено, что точность DKT лучше, чем у традиционных методов без большого экспертного опыта и большого количества функций. Далее мы представим, как работает алгоритм отслеживания глубоких знаний DKT.
Чтобы партнеры с любым опытом хорошо понимали DKT, мы сначала кратко расскажем о том, что такое рекуррентная нейронная сеть (RNN), используемая в DKT [3]. Традиционная рекуррентная нейронная сеть принимаетв качестве входных данных, то входные данные отображаются на. Это можно сделать через скрытые переменныеДля этого скрытые переменные в каждый момент времени можно рассматривать как своего рода кодировку всей информации в прошлом, которая используется для прогнозирования будущих выходных результатов вместе с текущими входными данными. Мы можем выразить это следующей формулой:
В приведенной выше формулеи— функция активации, а основные параметры модели включают входные веса, вес петли, начальная скрытая переменная, выходной веси перехват скрытой переменной и выводи. Рекуррентную нейронную сеть также можно упростить до следующей схемы:Конечно, поскольку на чистую RNN легко влияют такие факторы, как исчезновение градиента, на практике для замены RNN обычно используется сеть с долговременной кратковременной памятью, а именно LSTM.Ссылка на сайтЧтобы понять, здесь мы можем посмотреть на LSTM как на расширенную версию RNN.
Далее нам нужно использовать эту рекуррентную нейронную сеть, чтобы помочь нам построить модель для отслеживания знаний. Первый момент, который нам нужно рассмотреть, это то, как представить исторические данные о траектории обучения учащегося в форме, приемлемой для рекуррентной сети. Здесь мы говорим о более прямом способе представления, а именно о One-Hot Encoding (горячем кодировании). Как упоминалось выше, при введении отслеживания знаний мы можем поставитьВыражается как. Предположим, мы хотим отслеживатьразличные точки знаний, мы можем сделатьдлинавектор (перед векторомОпишите, какую точку знаний учащийся сделал по вопросу, а затемБит описывает, сделал ли студент очко знаний), возможное значение которого может быть 0 или 1 (если студент сделал правильноточка знаний, тобит равен 1, первыйтакже равно 1, а остальные равны 0; если студент ошибаетсяточка знаний, только перваябит 1, остальные 0), то математическиможно выразить как,такЕго можно использовать как вход рекуррентной нейронной сети. в то время как выводдлинаявляется непрерывным вектором , где первыйпредставителя, если студент находится вДелай это правильно все времяВероятность точки знания, поэтому мы начинаем сПо каждому баллу знаний можно судить о текущем уровне мастерства учащихся.
Что касается функции потерь при обучении, мы можем рассмотреть возможность использования классической бинарной перекрестной энтропии. Используйте горячие векторывыразить вНа какой пункт знаний ответят в любое время, и в то же время сделатьпредставляет собой бинарную кросс-энтропийную функцию. Тогда функция потерь для студента:
С точки зрения непрофессионала, например, мывремя делатьДля вопроса на очки знаний мы найдем выходной результатсреднее знаниепредсказанное значение, а затем сравните это предсказанное значение с реальными учениками вОчки знаний о времениответДля сравнения, чем ближе прогнозируемое значение к этому реальномуСоответствующее значение потерь меньше, и наоборот. Наша тренировочная цель состоит в том, чтобы сделать окончательный проигрышМинимум, потери можно уменьшить градиентным спуском, чтобы достичь цели оптимизации параметров сети.Чтобы предотвратить переоснащение, в обучении также могут быть приняты некоторые распространенные методы, такие как отсев.
Давайте теперь посмотрим на рендеры после обучения DKT (это фото для студента):Каждый цветной кружок в левой части изображения выше можно рассматривать как другую точку знаний, которую можно получить из изображения, которое мы хотим проверить.Информация о различных баллах знаний. Горизонтальные цветные кружки обозначают, какие баллы знаний студенты на самом деле делали в разное время и их ответы. Если кружок пустой, это означает, что студент ответил на вопрос неправильно, а сплошной цвет означает, что студент правильно ответил на вопрос. Число под прямоугольником представляет собой количество вопросов, на которые ответил учащийся (то есть время ответа, на рисунке выше учащийся ответил в общей сложности на 50 вопросов в истории). И первый в прямоугольникеГлубина цвета 6 квадратов в столбце представляет собой прогноз 6 баллов знаний учащегося, освоенных моделью в каждый момент времени ответа (чем зеленее, тем выше уровень мастерства), то есть результат в модели.. мы можем согласнопредсказыватьуспеваемость студентов в любое время и в то же время,Его также можно использовать в качестве описания уровня знаний учащихся в момент времени t.
Каковы сценарии применения отслеживания глубоких знаний?
Цель отслеживания знаний при обучении состоит в том, чтобы использовать исторические данные об обучении учащихся, чтобы предсказать, как учащиеся будут работать в будущем. Если глубокое отслеживание знаний действительно может достичь желаемого эффекта, мы можем использовать данные ежедневной практики студентов, чтобы судить о текущих способностях студента, тогда необходимость и частота организации единых экзаменов может быть значительно снижена.
Адаптивное обучение повышает эффективность обучения
Одним из самых больших потенциальных применений отслеживания глубоких знаний является помощь учащимся в оптимизации эффективности обучения баллов знаний и помощь учащимся в выборе наилучшего порядка обучения в соответствии с их уровнем владения баллами знаний в реальном времени. НапримерВсегда студенты в точке знанийплохо владеетв точке знанияЗначение соответствующего измерения самое низкое, тогда мы можем попытаться улучшить объяснение для учащихся.Приоритет очков знаний, которые могут помочь учащимся целенаправленно восполнить самый большой недостаток в их текущих знаниях.
Откройте для себя связи между различными точками знаний
Модель DKT также можно использовать для обнаружения связей между различными точками знаний. За очки знанийи очки знанийС точки зрения мы можем использоватьпредставлять силу связи между двумя точками знаний,
вЭто означает, что если учащийся делает знание правильно в данный момент, он делает правильную точку знания в следующий момент времениВероятность , приведенную выше формулу можно легко понять как точку знанияи очки знанийОтношения на самом деле для завершения точки знанийДелайте правильные очки знаний позжеВероятность завершения всех очков знанийЗатем сделайте правильные очки знанийдоля вероятности. Потому что, если точка знанийи очки знанийЧем ближе отношения, тем больше очков знаний набирается.Делайте правильные очки знаний позжеВероятность выполнения правильной точки знаний после завершения других точек знанийВероятность относительно высока, поэтому соответствующиетакже будет выше. Так что мы можем пройтизначение, чтобы судить о взаимосвязи между двумя точками знаний.
Резюме и перспективы
По сравнению с байесовским отслеживанием знаний (BKT) отслеживание глубоких знаний (DKT) имеет много преимуществ:
- Модель может отражать степень усвоения знаний в течение длительного времени.По сравнению с традиционной БКТ, предполагается, что знания не будут забыты после усвоения.Внедрение рекуррентной нейросетевой модели в глубокое отслеживание знаний может хорошо имитировать поведение, которое знания будут быть забытым, если это не делается в течение длительного времени. , что более соответствует познанию людей.
- Он может моделировать связь между сложными точками знаний, чтобы обнаружить внутреннюю связь между различными точками знаний.
- В отличие от BKT, который использует 0/1 для представления уровня владения баллами знаний учащихся, DKT выводитявляется постоянным значением, DKT может отражать непрерывное изменение уровня знаний учащихся.
Конечно, у модели отслеживания глубоких знаний есть и недостатки [4]:
- Существует вероятность того, что модель не может быть реконструирована, например, студент делает это прямо в данный момент.очки знаний, но в некоторых случаях модель считает, что следующий момент является правильнымУровень владения очками знаний уменьшился.
- Во временном ряду учащиеся имеют прерывистое владение баллами знаний, и некоторые учащиеся могут слишком сильно колебаться.
Вышеуказанные два недостатка могут быть решены путем изменения функции потерь.В некоторых связанных статьях была улучшена модель отслеживания глубоких знаний, предложены соответствующие решения и еще больше улучшена точность.В то же время, проблемы, упомянутые в вышеупомянутых недостатках, были улучшены. Приятные улучшения и исправления.
В целом модель отслеживания глубоких знаний (DKT) можно использовать в качестве метода искусственного интеллекта для автоматического обнаружения взаимосвязи между точками знаний и разумного проектирования путей обучения учащихся для повышения эффективности обучения. DKT также является относительно передовой моделью в соответствующей области.Также возникают различные связанные DKT+.Вы можете уделять больше внимания новым исследованиям в этой области.Если у вас возникнут связанные проблемы, вы можете общаться и обсуждать вместе в любое время время. Давайте брать взаймы вместе. Мощь моделей и данных создает большую ценность для бизнес-аналитики!
использованная литература
[1]. LIU Heng-yu, ZHANG Tian-cheng, WU Pei-wen, et al. A review of knowledge tracking[J]. Journal of East China Normal University (Natural Science), 2019, (5): 1-15. DOI: 10.3969/j.issn.1000-5641.2019.05.001.
[2]. Piech, C., Bassen, J., Huang, J., Ganguli, S., Sahami, M., Guibas, L. J., & Sohl-Dickstein, J. (2015). Deep Knowledge Tracing. In Advances in Neural Information Processing Systems (pp. 505-513).
[3] З. Цуй, Р. Ке и Ю. Ван, «Двунаправленная и однонаправленная рекуррентная нейронная сеть LSTM с глубоким стеком для прогнозирования скорости трафика в масштабах всей сети», на 6-м Международном семинаре по городским вычислениям (UrbComp 2017), 2016.
[4] Чун-Кит Йенг и Дит-Ян Юнг. Решение двух проблем в отслеживании глубоких знаний с помощью регуляризации, согласованной с прогнозированием. В материалах 5-й конференции ACM по обучению в масштабе, страницы 5: 1–5: 10. ACM, 2018.
END
Предложения о работе
Техническая команда TAL набирает должности старшего инженера-разработчика в области тестирования, серверной части, эксплуатации и обслуживания, а также на стороне клиента. Вы можете отсканировать QR-код ниже или выполнить поиск по запросу «Follow».ТАЛ Технология", нажмите "Технический набор"Подробности в колонке, приглашаем заинтересованных партнеров присоединиться к нам!
Наука, стоящая за «экзаменами»: теории и модели измерения образования (IRT)
Использование технологий для помощи в образовании | Вместе почувствуйте силу образцов для подражания
Хотите понять эволюцию архитектуры удаленной мультишкольной платформы? позвольте мне сказать вам!
Дизайн и реализация игровой системы переодевания Mobixiu (на основе анимации киля Egret+DragonBones)
Как реализовать плагин пера для перелистывания страниц
Нет передышки в эпидемической битве промышленности и научных кадров