Кoмпaния Meta прeдстaвилa гeнeрaтивную мoдeль пoд нaзвaниeм Voicebox, кoтoрaя прeoбрaзуeт тeкст в рeчь.
Рaзрaбoтчики утвeрждaют, чтo этa мoдeль сделает про устной itservice.zp.ua
речи так же самое, словно ChatGPT и DALL-E сделали на текста и изображений.
Так и генеративным системам ради текста и изображений, Voicebox горазд создавать новые талантливость, изменять стили и ревизовать предоставленные образцы. Ради тренировки системы было использовано 50 000 часов записей речи и стенограмм аудиокниг для английском, французском, испанском, немецком, польском и португальском языках. Сии материалы находятся в общественном достоянии.
По причине Voicebox впору редактировать аудиоклипы, долой шумы и подтягивать неправильно произнесенные словоблудие. Кроме того, трафарет может восстанавливать в памяти речь, основываясь нате двухсекундном фрагменте, узнавать стиль речи посередине различными языками и образовывать разнообразные синтетические наборы данных.
Meta без- публикует отправной код модели, ссылаясь получи потенциальные риски неправильного использования. В так же срок разработчики отмечают мириады интересных вариантов применения генеративных речевых моделей.