Исследователи из Microsoft Research совместно с учёными Университета Китайской академии наук представили новую модель искусственного интеллекта, не требующую графических процессоров для своей работы. Разработка, получившая название BitNet b1.58 2B4T, функционирует на обычных центральных процессорах (CPU), предлагая энергоэффективную альтернативу традиционным ИИ-моделям.
В опубликованной на сервере препринтов arXiv научной работе подробно описываются принципы функционирования модели и её производительность в сравнении с аналогами на базе GPU. Одним из ключевых отличий BitNet является использование 1-битной архитектуры, полностью отказавшейся от чисел с плавающей точкой. Весовые коэффициенты модели хранятся в виде значений -1, 0 и 1, что позволяет выполнять вычисления при помощи элементарных операций сложения и вычитания, эффективно обрабатываемых обычным CPU.
Такой подход позволяет резко сократить энергопотребление, а также объём необходимой памяти. Тестирование показало, что BitNet может конкурировать с рядом моделей, работающих на GPU, а в некоторых случаях даже превосходить их по эффективности.
Для работы модели была создана специальная среда выполнения — bitnet.cpp, оптимизированная под 1-битную систему. Благодаря такой архитектуре, появляется возможность запускать интеллектуальных чат-ботов и другие ИИ-приложения на обычных ПК или даже смартфонах, без подключения к облачным дата-центрам.
Если представленные результаты подтвердятся, BitNet может стать важным этапом в развитии ИИ — от масштабных вычислений в центрах обработки данных к доступной и энергоэффективной локальной работе, с сохранением конфиденциальности и автономности пользователей.