Что такое отслеживание знаний?
Основная задача отслеживания знаний состоит в том, чтобы автоматически оценивать изменение баллов овладения учащимися знаниями с течением времени в соответствии с их историческими траекториями обучения. Поняв уровень владения баллами знаний учащихся, они могут предоставить учащимся индивидуальное обучение, которое соответствует их собственным условиям обучения. В сфере образования по-прежнему необходимо использовать научные методы для целенаправленного отслеживания усвоения студентами знаний. Основываясь на массивных исторических данных обучения студентов, можно завершить моделирование процесса обучения студентов, чтобы модель могла автоматически отслеживать статус обучения студентов на каждом этапе, чтобы достичь цели адаптивного обучения. Некоторые ученые считают, что набор баллов знаний, освоенных учащимися, очень тесно связан с их внешней эффективностью при ответе на вопросы, поэтому мы можем попытаться смоделировать статус освоения учащимися баллов знаний через их результаты при ответе на вопросы [1].
В общем, задачи отслеживания знаний могут быть выражены в следующей математической форме: Дана историческая последовательность обучения учащегося А по конкретной учебной задаче., чтобы предсказать
производительность на. как правило
можно представить в виде упорядоченной пары
, упорядоченное выравнивание
указывает на то, что ученик
Ответы на вопросы все время
,и
представляет студентов в
Ответы выше, вообще говоря
Принимает значение 0 (неправильный ответ) или 1 (правильный ответ). На самом деле, если вы посмотрите на отслеживание знаний с точки зрения вероятности, оно по существу использует историческую эффективность ответов учащихся для прогнозирования правильных ответов учащихся в следующий момент времени.
вероятность, то есть
, которую можно интерпретировать как последовательность исторической успеваемости данного учащегося.
И в
всегда в теме
В случае если учащиеся правильно отвечают на вопросы
вероятность .
Что такое глубокое отслеживание знаний?
После предварительного понимания того, что такое концепция отслеживания знаний, мы далее представляем нашего главного героя — DKT (Deep Knowledge Tracking) [2]. В настоящее время в мире существует множество интеллектуальных образовательных компаний, использующих родственные модели отслеживания знаний, такие как BKT (байесовское отслеживание знаний) и DKT (глубокое отслеживание знаний).Глубокое отслеживание знаний — это простое и интуитивно понятное использование методов глубокого обучения для получения знаний. отслеживание. Из экспериментальных результатов в статье DKT было обнаружено, что точность DKT лучше, чем у традиционных методов без большого экспертного опыта и большого количества функций. Далее мы представим, как работает алгоритм отслеживания глубоких знаний DKT.
Чтобы партнеры с любым опытом хорошо понимали DKT, мы сначала кратко расскажем о том, что такое рекуррентная нейронная сеть (RNN), используемая в DKT [3]. Традиционная рекуррентная нейронная сеть принимаетв качестве входных данных, то входные данные отображаются на
. Это можно сделать через скрытые переменные
Для этого скрытые переменные в каждый момент времени можно рассматривать как своего рода кодировку всей информации в прошлом, которая используется для прогнозирования будущих выходных результатов вместе с текущими входными данными. Мы можем выразить это следующей формулой:
В приведенной выше формулеи
— функция активации, а основные параметры модели включают входные веса
, вес петли
, начальная скрытая переменная
, выходной вес
и перехват скрытой переменной и вывод
и
. Рекуррентную нейронную сеть также можно упростить до следующей схемы:
Конечно, поскольку на чистую RNN легко влияют такие факторы, как исчезновение градиента, на практике для замены RNN обычно используется сеть с долговременной кратковременной памятью, а именно LSTM.Ссылка на сайтЧтобы понять, здесь мы можем посмотреть на LSTM как на расширенную версию RNN.
Далее нам нужно использовать эту рекуррентную нейронную сеть, чтобы помочь нам построить модель для отслеживания знаний. Первый момент, который нам нужно рассмотреть, это то, как представить исторические данные о траектории обучения учащегося в форме, приемлемой для рекуррентной сети. Здесь мы говорим о более прямом способе представления, а именно о One-Hot Encoding (горячем кодировании). Как упоминалось выше, при введении отслеживания знаний мы можем поставитьВыражается как
. Предположим, мы хотим отслеживать
различные точки знаний, мы можем сделать
длина
вектор (перед вектором
Опишите, какую точку знаний учащийся сделал по вопросу, а затем
Бит описывает, сделал ли студент очко знаний), возможное значение которого может быть 0 или 1 (если студент сделал правильно
точка знаний, то
бит равен 1, первый
также равно 1, а остальные равны 0; если студент ошибается
точка знаний, только первая
бит 1, остальные 0), то математически
можно выразить как
,так
Его можно использовать как вход рекуррентной нейронной сети. в то время как вывод
длина
является непрерывным вектором , где первый
представителя, если студент находится в
Делай это правильно все время
Вероятность точки знания, поэтому мы начинаем с
По каждому баллу знаний можно судить о текущем уровне мастерства учащихся.
Что касается функции потерь при обучении, мы можем рассмотреть возможность использования классической бинарной перекрестной энтропии. Используйте горячие векторывыразить в
На какой пункт знаний ответят в любое время, и в то же время сделать
представляет собой бинарную кросс-энтропийную функцию. Тогда функция потерь для студента:
С точки зрения непрофессионала, например, мывремя делать
Для вопроса на очки знаний мы найдем выходной результат
среднее знание
предсказанное значение, а затем сравните это предсказанное значение с реальными учениками в
Очки знаний о времени
ответ
Для сравнения, чем ближе прогнозируемое значение к этому реальному
Соответствующее значение потерь меньше, и наоборот. Наша тренировочная цель состоит в том, чтобы сделать окончательный проигрыш
Минимум, потери можно уменьшить градиентным спуском
, чтобы достичь цели оптимизации параметров сети.Чтобы предотвратить переоснащение, в обучении также могут быть приняты некоторые распространенные методы, такие как отсев.
Давайте теперь посмотрим на рендеры после обучения DKT (это фото для студента):Каждый цветной кружок в левой части изображения выше можно рассматривать как другую точку знаний, которую можно получить из изображения, которое мы хотим проверить.
Информация о различных баллах знаний. Горизонтальные цветные кружки обозначают, какие баллы знаний студенты на самом деле делали в разное время и их ответы. Если кружок пустой, это означает, что студент ответил на вопрос неправильно, а сплошной цвет означает, что студент правильно ответил на вопрос. Число под прямоугольником представляет собой количество вопросов, на которые ответил учащийся (то есть время ответа, на рисунке выше учащийся ответил в общей сложности на 50 вопросов в истории). И первый в прямоугольнике
Глубина цвета 6 квадратов в столбце представляет собой прогноз 6 баллов знаний учащегося, освоенных моделью в каждый момент времени ответа (чем зеленее, тем выше уровень мастерства), то есть результат в модели.
. мы можем согласно
предсказывать
успеваемость студентов в любое время и в то же время,
Его также можно использовать в качестве описания уровня знаний учащихся в момент времени t.
Каковы сценарии применения отслеживания глубоких знаний?
Цель отслеживания знаний при обучении состоит в том, чтобы использовать исторические данные об обучении учащихся, чтобы предсказать, как учащиеся будут работать в будущем. Если глубокое отслеживание знаний действительно может достичь желаемого эффекта, мы можем использовать данные ежедневной практики студентов, чтобы судить о текущих способностях студента, тогда необходимость и частота организации единых экзаменов может быть значительно снижена.
Адаптивное обучение повышает эффективность обучения
Одним из самых больших потенциальных применений отслеживания глубоких знаний является помощь учащимся в оптимизации эффективности обучения баллов знаний и помощь учащимся в выборе наилучшего порядка обучения в соответствии с их уровнем владения баллами знаний в реальном времени. НапримерВсегда студенты в точке знаний
плохо владеет
в точке знания
Значение соответствующего измерения самое низкое, тогда мы можем попытаться улучшить объяснение для учащихся.
Приоритет очков знаний, которые могут помочь учащимся целенаправленно восполнить самый большой недостаток в их текущих знаниях.
Откройте для себя связи между различными точками знаний
Модель DKT также можно использовать для обнаружения связей между различными точками знаний. За очки знанийи очки знаний
С точки зрения мы можем использовать
представлять силу связи между двумя точками знаний,
вЭто означает, что если учащийся делает знание правильно в данный момент
, он делает правильную точку знания в следующий момент времени
Вероятность , приведенную выше формулу можно легко понять как точку знания
и очки знаний
Отношения на самом деле для завершения точки знаний
Делайте правильные очки знаний позже
Вероятность завершения всех очков знаний
Затем сделайте правильные очки знаний
доля вероятности. Потому что, если точка знаний
и очки знаний
Чем ближе отношения, тем больше очков знаний набирается.
Делайте правильные очки знаний позже
Вероятность выполнения правильной точки знаний после завершения других точек знаний
Вероятность относительно высока, поэтому соответствующие
также будет выше. Так что мы можем пройти
значение, чтобы судить о взаимосвязи между двумя точками знаний.
Резюме и перспективы
По сравнению с байесовским отслеживанием знаний (BKT) отслеживание глубоких знаний (DKT) имеет много преимуществ:
- Модель может отражать степень усвоения знаний в течение длительного времени.По сравнению с традиционной БКТ, предполагается, что знания не будут забыты после усвоения.Внедрение рекуррентной нейросетевой модели в глубокое отслеживание знаний может хорошо имитировать поведение, которое знания будут быть забытым, если это не делается в течение длительного времени. , что более соответствует познанию людей.
- Он может моделировать связь между сложными точками знаний, чтобы обнаружить внутреннюю связь между различными точками знаний.
- В отличие от BKT, который использует 0/1 для представления уровня владения баллами знаний учащихся, DKT выводит
является постоянным значением, DKT может отражать непрерывное изменение уровня знаний учащихся.
Конечно, у модели отслеживания глубоких знаний есть и недостатки [4]:
- Существует вероятность того, что модель не может быть реконструирована, например, студент делает это прямо в данный момент.
очки знаний, но в некоторых случаях модель считает, что следующий момент является правильным
Уровень владения очками знаний уменьшился.
- Во временном ряду учащиеся имеют прерывистое владение баллами знаний, и некоторые учащиеся могут слишком сильно колебаться.
Вышеуказанные два недостатка могут быть решены путем изменения функции потерь.В некоторых связанных статьях была улучшена модель отслеживания глубоких знаний, предложены соответствующие решения и еще больше улучшена точность.В то же время, проблемы, упомянутые в вышеупомянутых недостатках, были улучшены. Приятные улучшения и исправления.
В целом модель отслеживания глубоких знаний (DKT) можно использовать в качестве метода искусственного интеллекта для автоматического обнаружения взаимосвязи между точками знаний и разумного проектирования путей обучения учащихся для повышения эффективности обучения. DKT также является относительно передовой моделью в соответствующей области.Также возникают различные связанные DKT+.Вы можете уделять больше внимания новым исследованиям в этой области.Если у вас возникнут связанные проблемы, вы можете общаться и обсуждать вместе в любое время время. Давайте брать взаймы вместе. Мощь моделей и данных создает большую ценность для бизнес-аналитики!
использованная литература
[1]. LIU Heng-yu, ZHANG Tian-cheng, WU Pei-wen, et al. A review of knowledge tracking[J]. Journal of East China Normal University (Natural Science), 2019, (5): 1-15. DOI: 10.3969/j.issn.1000-5641.2019.05.001.
[2]. Piech, C., Bassen, J., Huang, J., Ganguli, S., Sahami, M., Guibas, L. J., & Sohl-Dickstein, J. (2015). Deep Knowledge Tracing. In Advances in Neural Information Processing Systems (pp. 505-513).
[3] З. Цуй, Р. Ке и Ю. Ван, «Двунаправленная и однонаправленная рекуррентная нейронная сеть LSTM с глубоким стеком для прогнозирования скорости трафика в масштабах всей сети», на 6-м Международном семинаре по городским вычислениям (UrbComp 2017), 2016.
[4] Чун-Кит Йенг и Дит-Ян Юнг. Решение двух проблем в отслеживании глубоких знаний с помощью регуляризации, согласованной с прогнозированием. В материалах 5-й конференции ACM по обучению в масштабе, страницы 5: 1–5: 10. ACM, 2018.
END
Предложения о работе
Техническая команда TAL набирает должности старшего инженера-разработчика в области тестирования, серверной части, эксплуатации и обслуживания, а также на стороне клиента. Вы можете отсканировать QR-код ниже или выполнить поиск по запросу «Follow».ТАЛ Технология", нажмите "Технический набор"Подробности в колонке, приглашаем заинтересованных партнеров присоединиться к нам!
Наука, стоящая за «экзаменами»: теории и модели измерения образования (IRT)
Использование технологий для помощи в образовании | Вместе почувствуйте силу образцов для подражания
Хотите понять эволюцию архитектуры удаленной мультишкольной платформы? позвольте мне сказать вам!
Дизайн и реализация игровой системы переодевания Mobixiu (на основе анимации киля Egret+DragonBones)
Как реализовать плагин пера для перелистывания страниц
Нет передышки в эпидемической битве промышленности и научных кадров