из Гитхаба
Автор: Кьюбён Пак
Сборник "Сердце машины"
Участие: Лю Сяокунь, Ли Цзэнань
Обработка естественного языка (NLP) — чрезвычайно сложная область исследований искусственного интеллекта. С появлением таких технологий, как глубокое обучение, область НЛП развивается беспрецедентными темпами. Но какие текущие исследования и ресурсы в этой области обязательны к прочтению новичками? Недавно Кьюбён Пак составил для нас полный список.
Ссылка на проект GitHub:GitHub.com/K против Альтернативы/Где…
Я давно работаю над задачами обработки естественного языка (НЛП), и однажды мне пришло в голову, что мне нужно сделать обзор огромной области НЛП, и я знаю, что я не первый, кто хочет увидеть всю картину задач НЛП.
Я сделал все возможное, чтобы изучить как можно больше типов задач НЛП, но из-за ограниченности моих личных знаний я признаю, что эта область далека от исчерпывающей. В настоящее время ссылки, выбранные в рамках этого проекта, сосредоточены на последних результатах исследований в области глубокого обучения. Я надеюсь, что они дадут старт тем, кто хочет глубже погрузиться в задачу НЛП. Этот проект будет продолжать обновляться, однако я бы предпочел работать с большим количеством людей. Вклад в этот проект приветствуется, если вы хотите.
Анафора
- См. Разрешение базовой ссылки (GitHub.com/K против Альтернативы/Где…)
Автоматическая оценка эссе
- Бумага: Автоматическая оценка текста с использованием нейронных сетей (АР Вест V.org/ABS/1606.04…)
- Диссертация: Нейронный подход к автоматизированной оценке эссе (Woohoo. ACL Web.org/old_ant ho... )
- Конкурс: Kaggle: The Hewlett Foundation: автоматизированная оценка эссе (www.kaggle.com/c/asap-aes)
- Проект: EnhancedAI Scoring Engine (github.com/edx/ease)
автоматическое распознавание речи
- ВИКИ Распознавание речи (Эн. Wikipedia.org/wiki/speech…)
- Документ: DeepSpeech 2: Сквозное распознавание речи на английском и китайском языках (АР Вест V.org/ABS/1512.02…)
- Документ: WaveNet: генеративная модель для необработанного аудио (АР Вест V.org/ABS/1609.03…)
- Проект: TensorFlow, реализация архитектуры Baidu DeepSpeech (GitHub.com/Mozilla/Ди…)
- Проект: Speech-to-Text-WaveNet: распознавание английской речи на уровне предложений от начала до конца с использованием WaveNet от DeepMind (GitHub.com/Обычные люди…)
- Конкурс: 5-е соревнование по разделению и распознаванию речи CHiME (Судебная ассамблея. Большой город. Управляемый. AC.UK/Eat_Чай холодный...)
- Источник: 5thCHiME Speech Separation and Recognition Challenge (Судебная ассамблея. Большой город. Управляемый. AC.UK/Eat_Чай холодный...)
- Источник: Корпус ЦСТРЦТК (homepages.inf.quota.AC.UK/decompression codeGIS/afraid…)
- Источник: корпус LibriSpeechASR (www.openslr.org/12/)
- Источник: Switchboard - 1Telephone Speech Corpus (catalog.ldc.upenn.edu/ldc97s62)
- Источник: TED-LIUMCorpus (Woohoo-Rogue.UN IV-LeMans.Поместить в /en/content/…)
автоматическое резюме
- WIKI Автоматическое суммирование (Итак, Wikipedia.org/wiki/auto…)
- Книга: Автоматическое суммирование текста (Woohoo.Amazon.com/automatic-T…)
- Бумага: Суммирование текста с использованием нейронных сетей (Эта функция работает. Я упоминал. Простой. Quota/view doc/Dow…)
- Бумага: Ранжирование с помощью рекурсивных нейронных сетей и его применение для суммирования нескольких документов (Woohoo. AA Love.org/OCS/index. Боюсь…)
- Источник: конференции TextAnalytics (TAC) (Он из .yourbody.gov/data/index. …)
- Источник: DocumentUnderstanding Conferences (DUC) (woohoo-слабая энергия.вашебоди.гов/проекты/степени…)
Ссылочное разрешение
- ИНФОРМАЦИЯ Базовое разрешение (НЛП.Stanford.quota/projects/co…)
- Бумага: DeepReinforcement Learning for Mention-Ranking Coreference Models (АР Вест V.org/ABS/1609.08…)
- Бумага: Улучшение разрешения корреференции путем изучения распределенных представлений на уровне объекта (АР Вест V.org/ABS/1606.01…)
- Конкурс: CoNLL2012 Общая задача: Моделирование многоязычной неограниченной кореференции в OntoNotes (con LL. sidemanreminders.org/2012/task-of-…)
- Конкурс: CoNLL2011 Общая задача: Моделирование неограниченной кореференции в OntoNotes (con LL. sidemanreminders.org/2011/task-of-…)
ссылка на сущность
- См. раздел «Устранение неоднозначности именованных объектов».
Исправление грамматических ошибок
- Бумага: Модели перевода NeuralNetwork для исправления грамматических ошибок (АР Вест V.org/ABS/1606.00…)
- Конкурс: CoNLL-2013 Общее задание: Исправление грамматических ошибок (woohoo.comp.glare.quote.is a /~NLP/con LL1…)
- Конкурс: CoNLL-2014 Общее задание: Исправление грамматических ошибок (woohoo.comp.glare.quote.is a /~NLP/con LL1…)
- Источник: NUSNon-commercial research/trial corpus license (woohoo.comp.glare.quote.is a /~NLP/con LL1…)
- Источник: Lang-8Learner Corpora (Кроме. Это Бог. Клавиатура/Старше его/Волк...)
- Источник: CornellMovie -- Корпус диалогов (У-у-у. В это время. Корнелл. Квота/~ Четыре дня сегодня/C…)
- Проект: Корректор глубокого текста (GitHub.com/A Suspension no/ О...)
- Продукт: Deepgrammar (deepgrammar.com/)
преобразование графемы в фонему
- Диссертация: Модели преобразования графем в фонемы для (почти) любого языка (PDF-файл: .semantic Scholar.org/№ 9 из 8/ поделиться 9 № 6…)
- Бумага: PolyglotNeural Language Models: Case Study in Cross-Lingual Fontetic RepresentationLearning (АР Вест V.org/PDF/1605.03…)
- Бумага: Многозадачные модели последовательностей для преобразования графем в фонемы (PDF-файл был выпущен 0/09959 с сайта .semantic Scholar.org/26…)
- Проект: Инструментарий G2P для последовательного взаимодействия (GitHub.com/GrassSphinx/…)
- Источник: данные о многоязычном произношении (drive.Google.com/drive/Фландрия…)
угадать язык
- См. раздел «Идентификация языка».
идентификация языка
- Идентификация языка WIKI (En. Wikipedia.org/wiki/LAN висит…)
- Тема диссертации: АВТОМАТИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ (репозит oh day oh.uam.starved/bitstream/ также…)
- Конкурс: 2015Оценка распознавания языка (woohoo.yourbody.gov/it-classes/ia's/maze…)
языковое моделирование
- WIKI Языковая модель (En. Wikipedia.org/wiki/LAN висит…)
- Инструментарий: Инструментарий модели KenLMLanguage (kheafield.com/code/kenlm/)
- Бумага: Распределенные представления слов и фраз и их композиционность (Бумаги.Грязевой Бодхисаттва.Цао Цао/бумага/5021-…)
- Диссертация: Модели нейронного языка с учетом символов (Woohoo. AA Love.org/OCS/index. Боюсь…)
- Источник: PennTreebank (GitHub.com/townie/PT B-…)
идентификация языка
- См. раздел «Идентификация языка».
одна и та же часть речи
- ВИКИ Лемматизация (Эн. Wikipedia.org/wiki/lemma T…)
- Бумага: Совместная лемматизация и морфологическая маркировка с помощью LEMMING (Уууууу. В это время. Колонка. /~ Wood Elle ts/ Боюсь...)
- Инструментарий: лемматизатор WordNet (воооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооооо заем)
- Источник: Treebank-3 (catalog.ldc.upenn.edu/ldc99t42)
Посмотри на губы
- WIKI Чтение по губам (En. Wikipedia.org/wiki/lip_hot…)
- Тема диссертации: Чтение предложений по губам в дикой природе (АР Вест V.org/ABS/1611.05…)
- Бумага: 3DConvolutional Neural Networks for Cross Audio-Visual Matching Recognition (АР Вест V.org/ABS/1706.05…)
- Проект: чтение по губам — кросс-аудио-визуальное распознавание с использованием трехмерных сверточных нейронных сетей (GitHub.com/AST или FI/Подарки…)
- Источник: аудиовизуальный корпус предложений TheGRID (spandh.dcs.shef.ac.uk/gridcorpus/)
машинный перевод
- Диссертация: NeuralMachine Translation путем совместного обучения выравниванию и переводу (АР Вест V.org/ABS/1409.04…)
- Бумага: Перевод NeuralMachine в линейное время (АР Вест V.org/ABS/1610.10…)
- бумага:AttentionIs All You Need(АР Вест V.org/ABS/1706.03…)
- Конкурс: ACL2014 ДЕВЯТЫЙ СЕМИНАР ПО СТАТИСТИЧЕСКОМУ МАШИННОМУ ПЕРЕВОДУ (woohoo.stat Mt.org/Desperado14/trans…)
- Конкурс: EMNLP2017 ВТОРАЯ КОНФЕРЕНЦИЯ ПО МАШИННОМУ ПЕРЕВОДУ (WMT17) (woohoo.stat Mt.org/Desperado17/trans…)
- Источник: OpenSubtitles2016 (opus.Lingfeng IL.UU.color/open sub выгнал...)
- Источник: WIT3: веб-инвентаризация расшифрованных и переведенных выступлений (wit3.fbk.eu/)
- Источник: TheQCRI Educational Domain (QED) Corpus (alt.nextday.org/resources/please…)
генерировать лексическое словоизменение
- ВИКИ Инфлексия (En. Wikipedia.org/wiki/inf C…)
- Диссертация: Генерация морфологической инфлекции с использованием последовательности символов для обучения последовательности (АР Вест V.org/ABS/1512.06…)
- Конкурс: СИГМОРФОН 2016 Общее задание: Морфологическая рефлексия (Райан Коттер Elblue.GitHub.IO/ Four Morphs Oh You 2…)
- Источник: sigmorphon2016 (GitHub.com/Райан Коттер Э…)
Значение именованной сущности
- Ссылка на объект WIKI (En. Wikipedia.org/wiki/entity…)
- Бумага: Устранение неоднозначности коллективных объектов Robusand с помощью семантических вложений (Woohoo.Stefan как IC Cary Bauer.info/PDF/Sig IR_2…)
Распознавание именованных объектов
- WIKI Распознавание именованных объектов (En. Wikipedia.org/wiki/named-…)
- Диссертация: NeuralArchitectures для распознавания именованных сущностей (АР Вест V.org/ABS/1603.01…)
- Проект: Инструменты НЛП OSUTwitter (GitHub.com/Ах Риттер/Тайвань Я…)
- Конкурс: Признание NamedEntity в Твиттере (шумный-текст.GitHub.IO/2016/дочь-это…)
- Конкурс: CoNLL2002 Распознавание именованных объектов, не зависящее от языка (woohoo.clips.u Антверпен ан.не голоден/против LL2002/ты…)
- Конкурс: Введение в общую задачу CoNLL-2003: Распознавание именованных объектов, не зависящее от языка (ACL Web.org/anthology/W…)
- Источник: корпус NER CoNLL-2002 (GitHub.com/плод о боится/НЛП/…)
- Источник: корпус NER CoNLL-2003 (GitHub.com/так что жена/н э/…)
- Источник: Распознавание объектов NUTNamed в общей задаче Twitter (GitHub.com/Ах Риттер/Тайвань Я…)
Обнаружение перефразирования
- Бумага: Рекурсивные автоэнкодеры DynamicPooling и Unfolding Recursive Autoencoders для обнаружения парафраз (Эта функция работает. Я упоминал. Простой. Quota/view doc/Dow…)
- Проект: Paralex: обучение, основанное на парафразах, для ответов на открытые вопросы (knowitall.cs.washington.edu/paralex/)
- Источник: Microsoft Research Paraphrase Corpus (Woohoo. Microsoft.com/en-US/down…)
- Источник: Корпус описания видео Microsoft Research (Woohoo. Microsoft.com/en-US/down…)
- Источник: ПаскальДатасет (НЛП. В это время. Иллинойс. Quota / hoc Кен Майер…)
- Источник: набор данных мерцания (НЛП. В это время. Иллинойс. Quota / hoc Кен Майер…)
- Источник: набор данных TheSICK (Очистные сооружения.раз.ед.н.ит/составов/четыре…)
- Источник: PPDB: База данных Paraphrase (www.cis.upenn.edu/~ccb/ppdb/)
- Источник: WikiAnswers Paraphrase Corpus (знаю ЭТО все. В это время. Вашингтон. Квота /par Alex/ IK…)
Разбор
- Разбор ВИКИ (En. Wikipedia.org/wiki/par sin…)
- Комплект: TheStanford Parser: Статистический анализатор (НЛП.Стэнфорд.квота/программное обеспечение/...)
- Инструментарий: spaCyparser (Из-за боязни вмешаться.IO/docs/usage/…)
- Диссертация: Быстрый и точный анализатор зависимостей с использованием нейронных сетей (Woohoo.ACL Web.org/anthology/D…)
- Соревнование: CoNLL2017 Общая задача: многоязычный синтаксический анализ от необработанного текста до универсальных зависимостей (universaldependencies.org/conll17/)
- Конкурс: CoNLL2016 Общее задание: Разбор поверхностного многоязычного дискурса (У-у-у. В это время. Брандейс. Quota/~Chen Liping/con LL1…)
- Конкурс: CoNLL2015 Общая задача: поверхностный разбор дискурса (У-у-у. В это время. Брандейс. Quota/~Chen Liping/con LL1…)
- Конкурс: СемЭвал-2016 Задание 8: Смысловые представления могут быть абстрактными, но это задание конкретное!(alt.nextday.org/SEM eval2016…)
тег части речи
- WIKI Тегирование частей речи (Ну... Wikipedia.org/wiki/part - о...)
- Бумага: Многоязычная маркировка частей речи с двунаправленными моделями долговременной кратковременной памяти и вспомогательной потерей (АР Вест V.org/PDF/1604.05…)
- Бумага: Неконтролируемая маркировка частей речи с помощью марковских моделей со скрытой привязкой (Внезапно пролилось .org/о, это /index. Боюсь...)
- Источник: Treebank-3 (catalog.ldc.upenn.edu/ldc99t42)
- Инструментарий: пакет nltk.tag (woohoo. Стремитесь к расширению.org/API/ Стремитесь к расширению. Он…)
Пиньинь-китайское преобразование
- Бумага: Языковая модель нейронной сети для механизма ввода китайских пиньинь (ACL Web.org/anthology/Y…)
- Проект: NeuralChinese Transliterator (GitHub.com/K против альтернативы/Итак…)
Система ответов на вопросы
- WIKI Ответ на вопрос (Итак, Wikipedia.org/wiki/quest я…)
- Статья: Ask MeAnything: Dynamic Memory Networks for Natural Language Processing (Woohoo.the кашалот.com/ja-color Weston/…)
- Бумага: Сети DynamicMemory для визуальных и текстовых ответов на вопросы (разбирательства.malays.press/v48/bear16…)
- Конкурс: задание на ответ на вопрос TREC (Снятие лихорадки.Ваш Body.gov/data/QA main…)
- Конкурс: NTCIR-8: Расширенный доступ к межъязыковой информации (ACLIA) (aclia.lti.cs.cmu.edu/ntcir8/Home)
- Конкурс: трек ответов на вопросы CLEFQuestion (nlp.uned.es/clef-qa/)
- Конкурс: SemEval-2017 Задание 3: Ответы на вопросы сообщества (alt.nextday.org/SEM eval2017…)
- Источник: MSMARCO: набор данных для понимания машинного чтения Microsoft (www.msmarco.org/)
- Источник: Maluuba NewsQA (GitHub.com/MA Road U Bar/новый…)
- Источник: SQuAD: более 100 000 вопросов для машинного понимания текста (Карточка слуги раджа people.GitHub.IO/squad-exp)
- Источник: GraphQuestions: Набор данных для ответов на вопросы, богатый характеристиками (GitHub.com/factor1989/gr ах…)
- Источник: StoryCloze Test и ROCStories Corpora (В настоящее время Рочестер, Квота/НЛП/РПЦ Тор...)
- Источник: Microsoft Research WikiQA Corpus (Woohoo. Microsoft.com/en-US/down…)
- Источник: набор данных вопросов и ответов DeepMind (cs.nyu.edu/~kcho/DMQA/)
- Источник: QASent (В это время в Стэнфорде квота/люди/мечта…)
извлечение отношений
- WIKI Извлечение отношений (Итак, Wikipedia.org/wiki/Re-ATI…)
- Диссертация: Подход глубокого обучения для извлечения отношений из контекста взаимодействия в парадигме социального производства (woohoo.science direct.com/science/art…)
Аннотация семантической роли
- WIKI Семантическая маркировка ролей (En. Wikipedia.org/wiki/SEM и…)
- Книга: Маркировка семантических ролей (Woohoo.Amazon.com/semantic-LA…)
- Бумага: Сквозное изучение семантической маркировки ролей с использованием рекуррентных нейронных сетей (Woohoo.ACL Web.org/anthology/P…)
- Диссертация: Нейросемантическая маркировка ролей с помощью встраивания путей зависимостей (АР Вест V.org/ABS/1605.07…)
- Конкурс: CoNLL-2005 Общая задача: Маркировка семантической роли (У-у-у. В это время. UPC. quota/~S calendar con LL/ yes…)
- Конкурс: CoNLL-2004 Общая задача: Маркировка семантической роли (У-у-у. В это время. UPC. quota/~S calendar con LL/ yes…)
- Комплект: Маркировщик семантических ролей штата Иллинойс (SRL) (co comp.org/afraid/soft вау…)
- Источник: CoNLL-2005 Общая задача: маркировка семантических ролей (У-у-у. В это время. UPC. quota/~S calendar con LL/ yes…)
Заявление Границы Устранение неоднозначности
- WIKI Устранение неоднозначности границы предложения (En. Wikipedia.org/wiki/sent en…)
- Бумага: Количественная и качественная оценка обнаружения границы предложения для клинической области (Ууху. Достаньте ручку. Девушка-хулиганка. hello.gov/racetrack/article…)
- Инструментарий: NLTKTokenizers (Woohoo. Попытка расширить .org/_modules/where…)
- Источник: Британский национальный корпус (англ.www.natcorp.ox.ac.uk/)
- Источник: Телефонный речевой корпус Switchboard-1 (catalog.ldc.upenn.edu/ldc97s62)
анализ настроений
- WIKI Анализ настроений (En. Wikipedia.org/wiki/sent IM…)
- INFO Потрясающий анализ настроений (GitHub.com/ниже во-первых/трепет так…)
- Соревнование: Kaggle: UMICH SI650 - Классификация настроений (woohoo.cardreform.com/from/four 650-битный интервал…)
- Конкурс: SemEval-2017 Задание 4: Анализ настроений в Twitter (alt.nextday.org/SEM eval2017…)
- Конкурс: SemEval-2017 Задание 5: Детальный анализ настроений в финансовых микроблогах и новостях (alt.nextday.org/SEM eval2017…)
- Проект: SenticNet (sentic.net/about/)
- Источник: Многодоменный набор данных о настроениях (версия 2.0) (Уууу.В этот раз.Почти.Сумма/~ Чтобы не провоцировать/большой...)
- Источник: Stanford Sentiment Treebank (НЛП.Стэнфорд.Количество/настроение/от…)
- Источник: Twitter Sentiment Corpus (Уууу. Три analytics.com/horn/twitter… )
- Источник: Учебный корпус по анализу настроений в Твиттере (думаю, нет OK.com/Twitter - Сен…)
- Источник: AFINN: Список английских слов с рейтингом валентности (Woo Woo 2.IM Mai.Map.Open /pub для заказа солдат/просмотров…)
разделение источника
- WIKI Разделение источника (En. Wikipedia.org/wiki/source…)
- Диссертация: От слепых к управляемому разделению аудиоисточников (Harry-UN IV-Rennes1.archives- Euro V и TE раздают.Вставил /Harry-0092237…)
- Бумага: Совместная оптимизация масок и глубоких рекуррентных нейронных сетей для монофонического разделения источников (АР Вест V.org/ABS/1502.04…)
- Конкурс: Кампания по оценке SignalSeparation (SiSEC) (sisec.inria.fr/)
- Соревнование: CHiMESpeech Separation and Recognition Challenge (Судебная ассамблея. Большой город. Управляемый. AC.UK/Eat_Чай холодный...)
аутентификация говорящего
- См. раздел «Распознавание говорящего».
разделение голосовой идентификации
- WIKI Диариза динамиков (En. Wikipedia.org/wiki/speak E…)
- Бумага: кластеризация говорящих на основе DNN для диаризации говорящих (Электронная печать.белая роза.AC.UK/109281/1/m…)
- Бумага: Неконтролируемые методы диаризации говорящих: комплексный и итеративный подход (группы.Участвовал.Персик.Квота/Храм Шаолинь/публика…)
- Документ: Аудиовизуальная диаризация говорящего на основе пространственно-временного байесовского слияния (АР Вест V.org/PDF/1603.09…)
- Конкурс: Оценка RichTranscription (woohoo.yourbody.gov/it-classes/ia's/maze…)
распознавание говорящего
- WIKI Распознавание говорящего (En. Wikipedia.org/wiki/speak E…)
- Диссертация: НОВАЯ СХЕМА РАСПОЗНАВАНИЯ ГОВОРЯЩЕГО С ИСПОЛЬЗОВАНИЕМ ФОНЕТИЧЕСКИ ОСВЕДОМЛЕННОЙ ГЛУБОКОЙ НЕЙРОННОЙ СЕТИ (Файл в формате .semantic Scholar.org/204ah/method8oh21…)
- Диссертация: ГЛУБОКИЕ СЕТИ ДЛЯ ТЕКСТОВО-ЗАВИСИМОЙ ВЕРИФИКАЦИИ ДИКТОРОВ НА МАЛОЙ ПЛОЩАДКЕ (static.Google user content.com/Media/Hot colors…)
- Соревнование: NISTSpeaker Recognition Evaluation (SRE) (woohoo.yourbody.gov/it-classes/ia's/maze…)
- ИНФОРМАЦИЯ Есть ли предложения по бесплатным базам данных для распознавания говорящих? (woohoo.research gate.net/post/are_days…)
чтение по губам
- См. раздел «Губы и разум».
Распознавание речи
- См. раздел «Автоматическое распознавание речи».
сегментация речи
- ВИКИ Speech_segmentation (Эн. Wikipedia.org/wiki/speech…)
- Документ: WordSegmentation by 8-Month Olds: когда речевые подсказки учитывают больше, чем статистика (Woohoo.UTM.Toronto.Amount/детское питание...)
- Бумага: Сегментация слова без присмотра и обнаружение лексики с использованием акустических вложений слов (АР Вест V.org/ABS/1603.02…)
- Диссертация: Неконтролируемое обнаружение лексикона на основе акустического ввода (Woohoo. ACL Web.org/old_ant ho... )
- Диссертация: Обнаружение устных терминов под слабым наблюдением с использованием межъязыковой дополнительной информации (Woohoo.research.quota.AC.UK/portal/file…)
- Источник: Испанская речь CALLHOME (catalog.ldc.upenn.edu/ldc96s35)
синтез речи
- ВИКИ Синтез речи (Эн. Wikipedia.org/wiki/speech…)
- Документ: WaveNet: генеративная модель для необработанного аудио (АР Вест V.org/ABS/1609.03…)
- Документ: Tacotron: на пути к сквозному синтезу речи (АР Вест V.org/ABS/1703.10…)
- Документ: DeepVoice 2: нейронный преобразователь текста в речь с несколькими динамиками (АР Вест V.org/ABS/1705.08…)
- Источник: Всемирная английская Библия (GitHub.com/K & Alternate/Он…)
- Источник: набор данных LJSpeech (GitHub.com/Кит ИТО/Он…)
- Источник: LessacData (Woohoo. В это время вдруг. Quota. AC.UK/projects/ Первоначально...)
- Соревнование: Blizzard Challenge 2017 (Итак, эти четыре .org/index.PHP/B…)
- ПРОДУКТ Лирохвост (lyrebird.ai/)
- Проект: Проект TheFestvox (www.festvox.org/index.html)
- Инструментарий: Merlin: система синтеза речи на основе нейронной сети (NN) (GitHub.com/C str-Edi внутри…)
улучшение речи
- WIKI Улучшение речи (Эн. Wikipedia.org/wiki/speech…)
- Книга: Развитие речи: теория и практика (Woohoo.Amazon.com/speech-en ha…)
- Статья «Экспериментальное исследование улучшения речи на основе DeepNeuralNetwork(staff.u STC. Quota. Talent/~Cointreau/SPE E…)
- Бумага: Регрессионный подход к улучшению речи на основе глубоких нейронных сетей (woohoo.research gate.net/profile/ты…)
- Документ: Улучшение речи на основе автоэнкодера с глубоким шумоподавлением (woohoo.research gate.net/profile/Y U_…)
преобразование речи в текст
- См. раздел «Автоматическое распознавание речи».
Обнаружение разговорного термина
- См. раздел «Сегментация речи».
выведение
- WIKI Стемминг (En. Wikipedia.org/wiki/стем м…)
- Диссертация: НЕЙРОННАЯ СЕТЬ ОБРАТНОГО РАСПРОСТРАНЕНИЯ ДЛЯ УЛУЧШЕНИЯ АРАБСКОГО ПРОГРАММИРОВАНИЯ (Уууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууууу за.)
- Комплект: NLTKStemmers (Уууу. Попробуйте расширить.org/how to/stem. …)
извлечение термина
- Извлечение терминологии WIKI (En. Wikipedia.org/wiki/term в…)
- Бумага: Модели NeuralAttention для классификации последовательностей: анализ и применение к извлечению ключевых терминов и обнаружению акта диалога (АР Вест V.org/PDF/1604.00…)
упрощение текста
- WIKI Упрощение текста (Хорошо. Wikipedia.org/wiki/text_is…)
- Бумага: выравнивание предложений из стандартной Википедии в простую Википедию (Летальность. О, о. Вашингтон. Квота/~ Ханнэм ухудшается/ Боится...)
- Документ: Проблемы текущих исследований по упрощению текста: новые данные могут помочь (PDF-файл: .semantic Scholar.org/2not8/ah01396…)
- Источник: данные Ньюсела (newsela.com/data/)
текст в речь
- См. раздел «Синтез речи».
текстовое следствие
- WIKI Текстовое следование (En. Wikipedia.org/wiki/text UA…)
- Проект: Textual Entailment с TensorFlow (GitHub.com/Стивен-Хе...)
- Бумага: Textual Entailment со структурированным вниманием и композицией (АР Вест V.org/PDF/1701.01…)
- Конкурс: SemEval-2014 Задание 1: Оценка композиционно-распределительных семантических моделей на полных предложениях через семантическую родственность и текстуальное следствие (alt.nextday.org/SEM eval2014…)
- Конкурс: SemEval-2013 Задание 7: Совместный анализ ответов учащихся и 8-е задание «Распознавание текстовых последствий» (Woohoo. В это время York.AC.UK/SEM eval-201…)
преобразование звука
- Тема диссертации: ФОНЕТИЧЕСКИЕ ПОСТЕРИООРГРАММЫ ДЛЯ ПРЕОБРАЗОВАНИЯ ГОЛОСОВ МНОГИЕ К ОДНОМУ БЕЗ ПАРАЛЛЕЛЬНОЙ ОБУЧЕНИЯ ДАННЫХ (Woohoo 1. Цвет. Толстая черная рамка. Количество. Скоро/~Синтетические материалы/паб…)
- Проект: Реализация системы преобразования голоса с использованием фонетических апостериорограмм (GitHub.com/sese нет трех лет К…)
- Конкурс: VoiceConversion Challenge 2016 (Woohoo.VC-challenge.org/VCC2016/Ind…)
- Конкурс: VoiceConversion Challenge 2018 (www.vc-challenge.org/)
- Источник: базы данных синтеза речи CMU_ARCTIC (festvox.org/cmu_arctic/)
- Источник: TIMITAcoustic-Fonetic Continuous Speech Corpus (catalog.ldc.upenn.edu/ldc93s1)
распознавание голоса
- См. раздел «Распознавание говорящего».
вложение слов
- Встраивание WIKI Word (Э-э. Wikipedia.org/wiki/word_ ой…)
- Инструментарий: Gensim: word2vec (Люди, земля, горячее озеро, горячая шахта.com/Touch Sim/…)
- Инструментарий: fastText (GitHub.com/Facebook Рес…)
- Инструментарий: GloVe: Global Vectors for Word Representation (НЛП.Стэнфорд.Количество/проектов/км…)
- ИНФО Где взять предварительно обученную модель (GitHub.com/3top/word2V…)
- Проект: Предварительно обученные векторы слов для 30+ языков (GitHub.com/K & Alternate/Я…)
- Проект: Полиглот: Распределенные представления слов для многоязычного НЛП (sites.Google.com/site/People также ID…)
предсказание слов
- ИНФОРМАЦИЯ Что такое прогнозирование слов? (woohoo 2.EDC.org/yourdisk/lib rar…)
- Диссертация: Предсказание характера на основе языковой модели рекуррентной нейронной сети (IE, о, исследуйте.IEEE.org/stamp/stamp…)
- Бумага: Предсказание слов на основе встроенного глубокого обучения (АР Вест V.org/ABS/1707.01…)
- Бумага: Оценка подсказки слов: сокращение количества нажатий клавиш (ACL Web.org/anthology/P…)
- Источник: Предсказание слов на основе встроенного глубокого обучения (GitHub.com/mein welcom/woh…)
- Проект: WordPrediction с использованием сверточных нейронных сетей — можете ли вы добиться большего успеха, чем клавиатура iPhone™? (GitHub.com/K & Alternate/Я…)
сегментация слов
- Сегментация слова WIKI (Хорошо. Wikipedia.org/wiki/text_is…)
- Диссертация: Обучение сегментации NeuralWord для китайского языка (АР Вест V.org/ABS/1606.04…)
- Проект: сверточная нейронная сеть для сегментации китайских слов (GitHub.com/превзойти ожидания/co…)
- Инструментарий: Stanford Word Segmenter (НЛП.Стэнфорд.Количество/программное обеспечение/цвет…)
- Инструментарий: NLTKTokenizers (Woohoo. Попытка расширить .org/_modules/where…)
смысл слова
- Источник: определение смысла слова (En.wikipedia.org/wiki/word - это...)
- Бумага: Train-O-Matic: крупномасштабное контролируемое устранение неоднозначности смысла слов на нескольких языках без данных ручного обучения (Woohoo.ACL Web.org/anthology/D…)
- Источник: данные Train-O-Matic (поезд OMA-theme.org/data/train-…)
- Источник: БабельНет (babelnet.org/)