Alibaba представила семейство ИИ-моделей Qwen3, которые ведут к новым стандартам

Китайская компания Alibaba Group Holdings на этой неделе представила семейство языковых моделей искусственного интеллекта Qwen3, использующих метод «смешения экспертов» для повышения скорости и эффективности решения задач. По заявлению Alibaba, модели Qwen3 в ряде сфер, включая решение математических задач и написание программного кода, демонстрируют производительность, сопоставимую или превосходящую разработки DeepSeek, при этом масштабирование моделей обходится значительно дешевле большинства аналогов. Такой подход основан на разбиении задачи на несколько сегментов, каждый из которых обрабатывается специализированным «экспертом», что повышает вычислительную эффективность.

Модели Qwen3 поддерживают 119 языков и обучены на наборе данных из почти 36 триллионов токенов, что обеспечивает широкий спектр применения — от обработки текста и кода до генерации изображений и видео. Семейство включает модели с параметрами от 600 миллионов до 235 миллиардов, позволяя пользователям выбирать оптимальный вариант под задачи разной сложности. Qwen3 обладают гибридным режимом работы: они могут быстро отвечать на простые запросы или тратить больше времени на пошаговое рассуждение при решении сложных проблем.

Alibaba сделала модели Qwen3 доступными под открытой лицензией на платформах Hugging Face и GitHub, что способствует развитию экосистемы искусственного интеллекта. Появление Qwen3 усиливает конкуренцию на рынке ИИ, стимулируя американские компании, такие как OpenAI, к разработке более открытых и эффективных решений. Новый этап развития технологий искусственного интеллекта помогает Alibaba укрепить позиции на мировом рынке и выйти из кризиса, связанного с регулированием бизнеса и внутренними вызовами последних лет.

Поделиться с друзьями
ASTERA