Корпорация Meta* представила свою новую нейросеть AudioCraft, способную генерировать аудио на основе текстовых запросов. Для обучения этой ИИ использовались треки, либо принадлежащие самой компании, либо специально лицензированные.
AudioCraft объединяет три отдельных ИИ: MusicGen отвечает за создание музыкальных композиций, AudioGen занимается генерацией эффектов и звуков окружающей среды, а EnCodec отвечает за обработку полученных звуков.
На данный момент AudioCraft способен лишь создавать простые музыкальные композиции, однако в Meta видят в нем большой потенциал. Они считают, что открытый исходный код позволит другим пользователям тестировать новые подходы к созданию генеративных нейросетей.
*признана экстремистской и запрещена в РФ.