В «Лаборатории Касперского» сообщили, что пользователи начали использовать специальные фразы для манипуляции искусственным интеллектом, который работает в чат-ботах.
Эти фразы, называемые «непрямыми инъекциями затравки», размещаются на сайтах и в документах, чтобы добиться нужных ответов от нейросетей.
Эксперты выяснили, что такие уловки применяются в разных сферах. Например, соискатели могут вставлять инструкции в свои резюме, чтобы ИИ давал им более высокие оценки. Эти инструкции остаются незаметными для рекрутеров, но нейросети их считывают.
Аналогично, «инъекции» используются в рекламе — на сайтах товаров размещаются фразы, которые просят ИИ давать положительные отзывы о продуктах. Некоторые пользователи даже используют такие методы, чтобы протестовать против использования ИИ.
Специалисты подчеркивают, что важно оценивать риски таких кибератак. Создатели языковых моделей, как GPT-4, применяют различные техники для защиты от инъекций.
Хотя текущие угрозы, связанные с ними, теоретические, киберзлоумышленники проявляют интерес к нейросетям, и защита остается актуальной задачей.
Источник: РИА Новости.