Нашумевший эксперимент Alpha Arena показал, что большинство языковых моделей потерпели фиаско в торговле криптовалютой, потеряв до 60% депозита за две недели. Почему это произошло, как расценивать результат и снятся ли чат-ботам маржин-коллы, размышляет эксперт алготрейдинга Bernoulli Capital Даниель Устинов.
Бесчеловечный эксперимент и его шокирующие результаты
В октябре лаборатория Nof1 объявила о проведении уникального соревнования Alpha Arena с участием шести популярных языковых моделей: ChatGPT от OpenAI, Gemini от Google, Grok от X и других. Трейдеров-людей к соревнованию не допустили, что и дало повод в шутку назвать ралли «бесчеловечным».
Всех участников обеспечили идентичными стартовыми условиями: по $10 000 реальных средств, доступ к криптобирже Hyperliquid и одинаковые наборы данных.
Итоги двухнедельного марафона оказались неутешительными: четыре из шести ИИ-трейдеров завершили эксперимент с крупными убытками. Хуже всех выступил ChatGPT, потерявший $6267 (62,67% депозита). Gemini ушла в минус на $5671, Grok — на $4531, а Claude Sonnet — на $3081.
Только две модели — DeepSeek и QWEN3 — смогли получить прибыль: $489 и $2232 соответственно.
Комиссии съели прибыль — разбор полётов
Согласно отчёту организаторов, ключевой проблемой стала гиперактивная торговля и чрезмерные комиссионные издержки. Модели открывали слишком много позиций, фиксируя небольшие прибыли, которые полностью поглощались комиссиями биржи.
Эта модель поведения оказалась типичной: например, «доходная» QWEN3 MAX заплатила рекордные $1654 комиссий, а «убыточная» Gemini — $1331.
«Финансовый результат определялся в основном торговыми издержками, — констатируют организаторы. — Агенты слишком активно торговали, фиксируя быстрые, небольшие прибыли, которые стирались за счёт комиссий».
Статистика — плохая замена стратегии — Даниель Устинов
Были и различия. Хотя изначально все модели работали с одинаковыми промптами и данными — ценовыми рядами, индикаторами EMA, MACD, RSI, объёмами, ставками финансирования и открытым интересом. Данные обновлялись каждые три минуты, торговля велась шестью криптовалютами: BTC, ETH, SOL, BNB, DOGE и XRP.
«Несмотря на идентичные условия, модели демонстрировали разное торговое поведение. Grok, ChatGPT и Gemini чаще открывали короткие позиции, в то время как Claude Sonnet шортил реже всех. При этом процент успешных сделок у всех шести LLM колебался в узком диапазоне 25–30%, что явно недостаточно для прибыльной торговли», — проанализировал стратегии LLM эксперт Даниель Устинов.
Интересно, что отсутствие эмоций — традиционно считающееся преимуществом алгоритмического трейдинга — в данном случае не стало фактором успеха. Как отмечает Даниель Устинов: «Проблема современных LLM в трейдинге — не в отсутствии эмоций, а в отсутствии глубокого понимания рыночного контекста и риск-менеджмента. Неспециализированные модели действуют статистически, но не стратегически».
Перспективы ИИ-трейдинга и реальные кейсы
Очевидный провал ИИ в Alpha Arena не отменяет успехов автоматизированного трейдинга, интерес к которому продолжает расти.
В последний год на рынке появились первые ИИ-фонды, такие как ai16z (позже переименованный в ElizaOS), который в моменте достиг капитализации $100 млн. Однако по последним данным на 6 ноября его оценка снизилась до $60 млн, а проект так и не стал конечным продуктом, оставшись частью спекулятивного нарратива.
«Нынешние результаты — только первый этап эволюции ИИ в трейдинге. Для реального прорыва необходимы специализированные модели, обученные именно на финансовых данных, а не универсальные LLM», — объясняет владелец алготрейдинговой компании «Бернулли Капитал» Даниель Устинов.
Основатель Nof1 Джей Ажанг также заявил, что работа над улучшением моделей продолжается, а эксперименты в будущем будут повторены с учётом нового опыта.
Автор статьи: Сергей Макин
