[⭐Fun Play] Потенциальный сайт обратного словаря для задач НЛП

глубокое обучение

«Это 12-й день моего участия в ноябрьском испытании обновлений, ознакомьтесь с подробностями события:Вызов последнего обновления 2021 г."

В этой статье представленУниверситет Цинхуа с открытым исходным кодомОнлайн-словарь обратного слова万词王

Название веб-сайта:wantwords.thunlp.org/home/

Адрес источника:GitHub.com/Dizzy Wife/хочу…

Что такое обратный словарь? Обратный словарь предназначен не для предоставления словаря антонимов, а для предоставления противоположного обычному (прямому) словарю определений слов запроса, слов, которые семантически соответствуют описанию запроса.

Что делает обратный словарь?

Роль, предоставленная официальным сайтом:

  • Решите проблему кончика языка, явление невостребованности слова из памяти, слова или формулы и т. д., которые не могут быть запомнены, когда они попадают в рот, но внезапно вспоминаются после экзамена.)
  • Помогите новичкам в изучении языка
  • Помогите подобрать слово (или словарь слов) больным аномией, людям, которые могут распознать и описать предмет, но не могут назвать его из-за неврологического расстройства

В области NLP замена синонимов, переписывание текста и замена текста часто используются для улучшения данных.Библиотеки словарей с открытым исходным кодом часто становятся лучшим корпусом для улучшения данных.

Словарь поддерживает независимый запрос на китайском и английском языках, а также поддерживает запрос преобразования китайский-английский, англо-китайский.

от太棒了Это слово является примером. Вы можете видеть, что возвращаются некоторые интересные примеры, некоторые из которых связаны с комментариями и мемами Weibo.

Официальная рекомендация — сотрудничать с поисковым фильтром, чтобы получить лучшие результаты.

Фильтр включает в себя простое количество слов, количество штрихов и пиньинь, а также сложную словоформу, рифму и т. д. Это также должно быть полезно для генерации стихов и лирики.

Мы фильтруем слова длиной не менее 4 символов, и в основном появляются все четырехсимвольные идиомы, а также будут такие слова, как人逢喜事精神爽и惊天地泣鬼神такие фразы

Исходя из текущего опыта, запрошенные слова довольно интересны и могут использоваться в качестве корпуса или базы знаний.Если вызовы API открываются позже, их можно использовать для улучшения данных, сопоставления текста, генерации текста и чат-ботов. Эффект преобразования английский-китайский/китайский-английский также очень хорош.