VALL-E от Microsoft может подделать любой голос всего за 3 секунды прослушивания

Microsoft с помощью своего нового искусственного интеллекта теперь может подделать любой голос человека, причем для этого будет достаточно записи голоса продолжительностью три секунды.

Microsoft рассказала про модель искусственного интеллекта VALL-E, которая разработан на базе EnCodec и является нейронной языковой моделью.

Вся система прослушивает голос человека, разделяет его на компоненты и может синтезировать его с учетом эмоционального тона.

Для системы достаточно записи продолжительностью три секунды. VALL-E не будет распространятся в открытом доступе с целью безопасности, чтобы нейросетью не воспользовались мошенники.

Поделиться с друзьями
ASTERA