Meta создала генеративную модель Voicebox для преобразования текста в речь


Опубликованно 19.06.2023 00:05

Meta создала генеративную модель Voicebox для преобразования текста в речьКoмпaния Meta прeдстaвилa гeнeрaтивную мoдeль пoд нaзвaниeм Voicebox, кoтoрaя прeoбрaзуeт тeкст в рeчь.

Рaзрaбoтчики утвeрждaют, чтo каста модель сделает для устной речи в таком случае же самое, что ChatGPT и DALL-E сделали исполнение) текста и изображений.

Аналогично генеративным системам про текста и изображений, Voicebox станется создавать новые данные, переменять стили и модифицировать предоставленные образцы. Угоду кому) тренировки системы было использовано 50 000 часов записей речи и стенограмм аудиокниг держи английском, французском, испанском, немецком, польском и португальском языках. Сии материалы находятся в общественном достоянии.

По причине Voicebox можно редактировать аудиоклипы, отвлекать шумы и исправлять неправильно произнесенные пустословие. Кроме того, модель может живописать речь, основываясь на двухсекундном фрагменте, откладывать стиль речи между различными языками и делать разнообразные синтетические наборы данных.

Meta далеко не публикует исходный код модели, ссылаясь бери потенциальные риски неправильного использования. В в таком случае же время разработчики отмечают большое число интересных вариантов применения генеративных речевых моделей.



Категория: Интернет