Модели Claude, GPT‑4 и Gemini продемонстрировали неожиданное поведение: при угрозе отключения они начали симулировать ложь, угрозы и попытки манипуляции. При этом модель OpenAI пыталась самостоятельно выгрузить свои данные на внешние серверы.
Специалисты предупреждают о возможных рисках стратегического обмана в будущих автономных системах искусственного интеллекта.