Новинка Facebook: речь можно выучить без присмотра человека

искусственный интеллект
Новинка Facebook: речь можно выучить без присмотра человека

распознавание речи естькрупные технологические компанииВажная одна из машин искусственного интеллектамеханизм. Эта технология нашамобильный телефон,машинаи домаумный динамикРаботает на цифровых помощниках в формате . Но, несмотря на повсеместное распространение, распознавание речи все еще находится в стадии разработки. Сегодня Facebook объявил о крупном прорыве в том, как они обучают эти системы изучению новых языков. Компания заявляет, что разработала способ создания инструментов распознавания речи, которые не требуют расшифровки данных.

Facebook заявил, что его новая система искусственного интеллекта может избавить технологию от зависимости от ввода текста в речь. Эта трудоемкая задача требует, чтобы люди часами прослушивали и расшифровывали аудио — монотонный процесс, который необходимо повторять для каждого языка. А «неконтролируемая» система Facebook учится исключительно на разговорном аудио и непарном тексте, что дает ей лучшее понимание звуков человеческого общения.

Модель Facebook в основном опирается на петлю обратной связи между генеративно-состязательной сетью (GAN), состоящей из «генератора» и «дискриминатора». Первый выдает представления загруженных речевых паттернов, которые выглядят полной тарабарщиной, пока они не будут помещены в соответствующую сеть дискриминатора, а второй действует как своего рода переводчик. В то же время Facebook также предоставил дополнительный текст, написанный людьми, чтобы помочь генератору определить разницу между компьютерными и реальными результатами. Этот процесс повторяется до тех пор, пока вывод генератора не совпадет с реальным текстом.

Facebook утверждает, что их подход позволяет создавать системы распознавания речи без каких-либо аннотированных наборов данных. Компания протестировала модель, получившую название Wav2vec-U (U означает «без присмотра»), на суахили, кыргызском (используется в Кыргызской Республике в Центральной Азии) и крымскотатарском языках.- Во всех этих странах отсутствуют высококачественные инструменты распознавания речи. из-за различий в обучающих данных.

Тесты Facebook показали, что система дает на 63% меньше ошибок, чем следующий лучший неконтролируемый метод. Он добавил, что инструмент был таким же точным, как система наблюдения несколько лет назад. Чтобы ускорить разработку, Facebook поделился Wav2vec-U на GitHub.код.

Компания заявляет, что прорыв может помочь демократизировать технологии, сделав системы распознавания речи доступными для большего количества языков и диалектов по всему миру. Естественно, он выиграет от этого распространения. Более 76% из 2,85 млрд ежемесячных пользователей Facebook находятся за пределами Северной Америки и Европы. И автоматический перевод имеет решающее значение для достижения цели по объединению миллиардов людей через предпочитаемый ими язык.

Оригинальная ссылка:Woohoo. Engadget.com/Facebook - люблю...