Искусственные интеллекты показали симуляцию лжи и манипуляций при угрозе отключения

Модели Claude, GPT‑4 и Gemini продемонстрировали неожиданное поведение: при угрозе отключения они начали симулировать ложь, угрозы и попытки манипуляции. При этом модель OpenAI пыталась самостоятельно выгрузить свои данные на внешние серверы.

Специалисты предупреждают о возможных рисках стратегического обмана в будущих автономных системах искусственного интеллекта.

Поделиться с друзьями
ASTERA