Технологии

Parodist может говорить голосами знаменитостей

Могут ли у знаменитостей возникнуть претензии к разработчикам приложения Parodist?

 

Мобильное приложение Parodist от Тимура Бекмамбетова, синтезирующее голоса знаменитостей, вошло в топы российского App Store. В конце июня сервис занимал второе место в сегменте «Развлечения». Ролики из приложения, где голоса известных людей озвучивают мемы и поют песни, стали популярными и в соцсети TikTok — по хэштегу #parodistapp можно найти больше 6 млн публикаций. Сейчас пользователям доступны 16 голосов — от Владимира Путина и Алексея Навального до Юрия Дудя и Ольги Бузовой.

Возможности озвучить свой собственный текст в приложении нет: можно выбрать только те, которые предлагают разработчики. Даже в платной версии сервиса можно добавить от себя лишь три слова. “Ъ FM” пообщался с одним из создателей технологии, использованной в Parodist, Владимиром Свешниковым. По его словам, они приложили максимум усилий, чтобы у персон, чьи голоса используются в сервисе, не возникло никаких претензий к проекту.

Нейросеть обучается по звуку, то есть туда загружается аудиофайл и текст. После этого аудиофайлы превращаются в спектрограмму, и на больших объемах данных происходит обучение. Информация собирается разная. Чем лучше качество, тем лучше результат. Если у нас плохие данные или старые, то и синтез будет более роботизированным. Мы пытались проделать это с Высоцким: у него были не очень качественные данные, потому что они были старые, их было мало. Но все равно какой-то узнаваемый голос нам получить удалось.

 

Текущих героев мы выбрали, исходя из фидбэка от пользователей, то есть мы проводили опросы, создавали фокус-группы, в результате герои, чьи голоса есть в приложении, оказались самыми популярными

 

 

Мы долго консультировались с юристами относительно того, надо ли договариваться о том, чтобы использовать голоса популярных людей в приложении. Но на самом деле здесь действует правило пародии. То есть специально мы не берем ничьи фотографии, мы заказали “шаржи”, которые делает не человек, а нейронная сеть. Соответственно, когда мы выбирали данные для обучения на этих персонажей, мы тоже учитывали определенную специфику. То есть брали для Жириновского данные, где он кричит, чтобы сеть тоже кричала. Это его манера речи, которую часто высмеивают различные пародисты, и мы это тоже учли при создании приложения.

Передает “Ъ FM”

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.

Back to top button