Tacotron 2 от Google способен в точности имитировать человеческий голос

Google создала программу, способную в точности имитировать человеческий голос. Tacotron 2 служит для преобразования текста в речь. Система состоит из двух нейросетей глубинного обучения, первая преобразует текст в спектрограмму и передает алгоритму WaveNet, который озвучивает ее, генерируя соответствующие звуковые элементы.

Отмечается, что Tacotron 2 справляется с трудными для произношения словами и названиями, а также меняет интонации в зависимости от знаков препинания.

Пока Tacotron 2 может озвучивать тексты только на английском языке и только женским голосом. Ожидается, что программа будет внедрена в сервисы Google, например Google Assistant или фирменный онлайн-переводчик.

Поделиться с друзьями
ASTERA