OpenAI разработала ИИ, который за 15 секунд может клонировать голос

OpenAI вновь привлекает внимание в сфере искусственного интеллекта, на этот раз новым инструментом под названием Voice Engine, который возможно так и не быть выпущен в свет.

Эта впечатляющая технология способна генерировать реалистичные синтетические голоса после обучения всего на 15-секундной аудиозаписи.

К сожалению, компания пока не планирует делать Voice Engine общедоступным. Представьте себе инструмент, который может читать любой текст естественным голосом, даже имитируя эмоции. Вот потенциал Voice Engine, который в настоящее время используется в ограниченном предпросмотре для функции чтения вслух в приложении ChatGPT от OpenAI. Возможности его применения огромны: от развлечений до революции в образовании, перевода подкастов на новые языки и помощи в общении невербальным людям.

Однако сила этой технологии требует ответственности. OpenAI признает потенциал злоупотребления, такого как распространение дезинформации или подделка чьего-либо голоса. По этой причине Voice Engine пока остается закрытым для общего доступа. OpenAI стремится решить эти проблемы через исследования и открытый диалог. Они надеются определить лучший способ внедрения этого мощного инструмента и подготовить общество к новой эре, ориентированной на ИИ.

Этот акцент на ответственной разработке критически важен. С увеличением убедительности deepfake и другого контента, созданного ИИ, становится всё труднее отличать реальное от искусственного. OpenAI признает эти вызовы, включая потенциальные проблемы с аутентификацией голоса и телефонными мошенничествами. Нахождение решений этих проблем будет критически важно по мере развития технологии синтетического голоса.

Источник: gizmochina