
Компании Screenlife Technologies Тимура Бекмамбетова и «Стафори» (создатели HR-сервиса «Робот Вера») представили технологию Vera Voice — проект по синтезу голоса знаменитостей. В её основе лежит работа рекуррентных и свёрточных нейронных сетей.
Сооснователь «Стафори» Владимир Свешников рассказал, что копия голоса воссоздаётся с учётом специфического произношения слов, скорости речи, интонаций и тембра. В комментариях к ролику разработчики пояснили, что для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает.
В видеоролике нейросеть говорит тремя голосами — Владимира Путина, Владимира Познера и Ксении Собчак. Разработчики планируют использовать технологию в рекламе, озвучке аудиокниг, голосовых помощниках и тому подобных проектах.
В ролике и на сайте компания уточняет, что прежде всего заботится о безопасности клиентов:
Мы понимаем, что данные технологии могут использоваться как во благо, так и во вред, поэтому делаем всё возможное, чтобы построить легальную и прозрачную основу для их развития.
Приватность, авторские права и этичность являются для нас основными принципами.
из заявления на сайте
Как сообщает VC.ru, компания уже подписала договор на легальное использование голоса сооснователя студии «Кубик в кубе» Руслана Габидуллина.
По словам разработчиков, Vera Voice — первая программа, способная синтезировать голоса знаменитостей на русском языке. В июле 2018-го был представлен синтезатор, который сгенерировал голос Стивена Хокинга и Билла Гейтса, а ранее стартап AI Dessa продемонстрировал ролик, в котором звучит синтезированный голос радиоведущего.
Читайте также

Нейросети: что это такое и как работает
Нейронные сети уже опознают людей по фотографиям, водят автомобили и совершают научные открытия. При этом не все понимают, что же это такое.

Краудфандинг
Рекомендуем
Оставляя комментарии на сайте «Мира фантастики», я подтверждаю, что согласен с пользовательским соглашением Сайта.