kudaza4em (kudaza4em) wrote,
kudaza4em
kudaza4em

Category:

Нейросеть научили копировать голос при синтезе текста в речь





Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Оригинал взят у bamymih в Нейросеть научили копировать голос при синтезе текста в речь

Subscribe
promo kudaza4em august 8, 2018 08:33 118
Buy for 10 tokens
По случаю дня Рождения запускаю марафон для всех моих друзей и друзей друзей) Приглашайте всех! Благодарю за поздравления !!! Спасибо, что Вы у меня есть !!! Те кто не знаком с моими друзьями - дружите друг друга, общайтесь, угощайтесь !!! За таким огромным столом можно найти самых…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment