Python подсчитывает частоту слов на экзаменах CET-4 и CET-6

искусственный интеллект Python робот WeChat


Эта статья была впервые опубликована в общедоступной учетной записи «Python Knowledge Circle», перейдите в общедоступную учетную запись, чтобы просмотреть ее напрямую.

Чтение текста занимает около 4,6 минут.

Сегодня День Учителя. Во-первых, я желаю всем учителям мира счастливого Дня Учителя. Спасибо вам за то, что вы усердно учили меня в студенческие годы.

На дворе начало учебного года, и юные таланты в расцвете сил уже должны были занять свои места в библиотеке и начать подготовку к ЕГЭ 4 и 6 в декабре! В то время П.К. некоторое время оставался в библиотеке перед тестом СЕТ-4, позже он сдал тест СЕТ-4 с результатом 450. Он впервые провалил тест СЕТ-6 с 400 баллами. Когда дело дошло до входного билета, я обнаружил его застрявшим в бумажной тетради на следующий день после экзамена. Мы знаем, что на экзамене CET-4 и CET-6 словарный запас слов является ключевым моментом.Если мы не будем знать слова при чтении, это повлияет на наше понимание предложений, что также снизит правильный показатель ответа.

Как эффективно запоминать слова — тоже головная боль: сегодня вы их запомните, а завтра забудете.

Сегодня я использовал Python, чтобы проанализировать реальные вопросы экзаменов CET-4 и CET-6 за последние 10 лет, посчитать в нем слова, отсортировать их по убыванию и сделать наглядный график.

Среда проекта

Язык: Питон 3
Редактор: Пичарм

Я скачал настоящие вопросы для экзаменов CET-4 и CET-6 за последние 10 лет из Интернета, все они представляют собой файлы в текстовом формате txt. Сначала я создал отдельную папку для Женти четвертого и шестого класса, чтобы сохранить ее.

Объединить текст

Взяв в качестве примера Женти четвертого уровня, для удобства статистики я сначала объединил все незашифрованные Женти за последние 10 лет в один текстовый файл. Пройдите и прочитайте содержимое всех файлов по заданному пути и сохраните в новый текст.

статистика слов

весь контентПожалуйста, нажмите здесь, чтобы просмотреть