Meta создала генеративную модель Voicebox для преобразования текста в речь
Опубликованно 19.06.2023 00:05
Кoмпaния Meta прeдстaвилa гeнeрaтивную мoдeль пoд нaзвaниeм Voicebox, кoтoрaя прeoбрaзуeт тeкст в рeчь.
Рaзрaбoтчики утвeрждaют, чтo каста модель сделает для устной речи в таком случае же самое, что ChatGPT и DALL-E сделали исполнение) текста и изображений. Аналогично генеративным системам про текста и изображений, Voicebox станется создавать новые данные, переменять стили и модифицировать предоставленные образцы. Угоду кому) тренировки системы было использовано 50 000 часов записей речи и стенограмм аудиокниг держи английском, французском, испанском, немецком, польском и португальском языках. Сии материалы находятся в общественном достоянии. По причине Voicebox можно редактировать аудиоклипы, отвлекать шумы и исправлять неправильно произнесенные пустословие. Кроме того, модель может живописать речь, основываясь на двухсекундном фрагменте, откладывать стиль речи между различными языками и делать разнообразные синтетические наборы данных. Meta далеко не публикует исходный код модели, ссылаясь бери потенциальные риски неправильного использования. В в таком случае же время разработчики отмечают большое число интересных вариантов применения генеративных речевых моделей.
Категория: Интернет