Нейросеть от Сбера может создать изображение из текстового описания на русском языке.
Платформа получила название Kandinsky, и как объяснили разработчики, это улучшенная версия нейросети ruDALL-E.
Ранее ruDALL-E работала с 1,3 млрд параметров, но ее обучили новым приемам на основе 179 млн изображений, которые к тому же содержат текстовые описания. Для улучшения нейросети использовался суперкомпьютер Christofari Neo.
После модернизации ruDALL-E система смогла улучшать качество картинки, генерировать изображения с произвольным соотношением сторон, а также накладывать тени, отражения и передавать качество текстуры.
Платформа для работы использует три алгоритма, где один генерирует заданное количество изображений, второй выбирает самые лучшие из них, а третий увеличивает их размеры и повышает качество.
Kandinsky можно запустить в приложении Салют по запросу «Включи художника».