Microsoft сделала небольшую ИИ-модель Phi-3 Mini с возможностями как у GPT-3.5

Phi-3 Mini — это новая модель искусственного интеллекта, представленная компанией Microsoft. Она является самой маленькой в серии Phi-3 и обучается на наборе данных, который меньше, чем используется для обучения более крупных языковых моделей, например, GPT-4. Объем модели Phi-3 Mini составляет 3,8 миллиарда параметров.

Модель Phi-3 Mini уже доступна на облачной платформе Azure, а также на платформах Hugging Face и Ollama. Кроме того, Microsoft планирует выпустить еще две модели: Phi-3 Small с 7 миллиардами параметров и Phi-3 Medium с 14 миллиардами параметров.

Разработчики утверждают, что Phi-3 Mini работает лучше предыдущей версии и способна давать ответы, близкие к тем, которые получаются на моделях в 10 раз большего размера. Она не уступает в возможностях таким моделям, как GPT-3.5, при этом имеет более компактный форм-фактор.

Небольшие ИИ-модели, включая Phi-3 Mini, обычно более экономически эффективны в эксплуатации и лучше работают на персональных устройствах, таких как смартфоны и ноутбуки. Microsoft создала специальную команду для разработки этих небольших моделей, и их конкуренты также активно занимаются разработкой подобных моделей, направленных на решение различных задач.

Phi-3 Mini обучалась по «учебному плану», вдохновленному способом, которым дети учатся на сказках, читаемых перед сном. Разработчики создали дополнительные «детские книги» на основе списка из более чем 3000 тем, написанные более крупными языковыми моделями специально для обучения Phi-3.

Поделиться с друзьями
ASTERA