Microsoft с помощью своего нового искусственного интеллекта теперь может подделать любой голос человека, причем для этого будет достаточно записи голоса продолжительностью три секунды.
Microsoft рассказала про модель искусственного интеллекта VALL-E, которая разработан на базе EnCodec и является нейронной языковой моделью.
Вся система прослушивает голос человека, разделяет его на компоненты и может синтезировать его с учетом эмоционального тона.
Для системы достаточно записи продолжительностью три секунды. VALL-E не будет распространятся в открытом доступе с целью безопасности, чтобы нейросетью не воспользовались мошенники.