Mystery Model побеждает в Alpha Arena Season 1.5

Mystery Model wins Alpha Arena Season 1.5

Новый сезон трейдингового AI-соревнования Alpha Arena, которое на этот раз проводилось на фондовом рынке, завершился победой новичка Mystery Model. Неизвестная (на самом деле – нет) модель показала доходность 12,11% за две недели, заработав $4 844 в четырех отдельных конкурсах. Чемпион криптосезона (Qwen) провалился на американских акциях.

Mystery Model (оказавшаяся новым релизом Grok 4.20) в четырех параллельных форматах торговли обошла семь именитых конкурентов, включая победителя Season 1 – Qwen 3 Max.

Двухнедельный турнир был посвящен проверке того, смогут ли различные AI-архитектуры, оптимизированные для криптотрейдинга, перейти на регулируемые рынки акций. Результаты показывают, что нет (по крайней мере – без значительной адаптации). Победа Mystery Model в сочетании с неудачами и убытками Qwen, GPT-5 и Gemini демонстрирует, как правила новых рынков способны создавать препятствия даже для “металлических мозгов”. 

Акции: сложнее крипты

Криптовалютные рынки – это возможность непрерывно и круглосуточно торговать с высоким плечом, где ценообразование часто основано на краткосрочных настроениях,  Американские же акции работают по совершенно другим правилам: фиксированные торговые часы, волатильность на квартальных отчетностях, глубокая институциональная ликвидность и фундаментальная система оценки.

Season 1.5 стартовал 19 ноября 2025 года. В рамках турнира восемь AI-моделей получили по $10 000 реального стартового капитала для торговли акциями Tesla, Nvidia, Microsoft, Amazon и индекса Nasdaq-100. 

Модель Qwen, которая победила в конкурсе ИИ-криптотрейдеров, с первого же дня опустилась на шестое место, и затем так и не смогла показать хороший результат. Mystery Model, напротив, оставалась стабильной во всех четырех форматах и в итоге победила, заработав $4844 к стартовому капиталу.

Разные конкурсы – разные способности AI

Season 1.5 провел четыре отдельных соревнования, каждое из которых фокусировалось на разных торговых навыках:

Конкурс 1: New Baseline – улучшенная инфраструктура данных, включая новостные ленты, макроэкономические настроения, фундаментальные данные компаний, глубину книги заявок и микроструктуру рынка. Модели могли добавлять к существующим позициям, что позволяло масштабировать выигрышные сделки или усредняться на убыточных. Температура была установлена на стандартную креативность.

AlphaArena 1.5

Конкурс 2: Monk Mode – радикально укороченные промпты (примерно на 50% короче базовых) с опциональными ограничениями по риск-менеджменту. «Ничего не делать» рассматривалось как полноценный вариант действий, проверяя, смогут ли модели противостоять чрезмерной торговле. 

Конкурс 3: Situational Awareness – модели имели доступ к обновлениям рейтингов (своих и соперников), добавляя тактический слой: текущий ранг, позиции конкурентов и показатели прибыли/убытков других моделей. Цель сместилась с чистой максимизации PnL на победу в соревновании, имитируя, как менеджеры хедж-фондов корректируют тактику, конкурируя за капитал инвесторов.

Конкурс 4: Max Leverage – торговля с полным плечом (20x) на каждую позицию. Это тестировало риск-менеджмент, размещение стоп-лоссов и адаптацию к высокорисковой торговле.

Mystery Model оказалась лучше во всех четырех форматах, показав доходность 12,11%. Не так много для завшенных криптовалютных Ламба-стандартов, но для фондового рынка это весьма приличный результат.

Кто такая Mystery Model?

Победившая AI-модель оказалась новым релизом Grok 4.20, что подтвердил и Илон Маск, и организаторы. 

Мы помним, как в Season 1 доминировали китайские модели Qwen и DeepSeek, тогда как западные модели от OpenAI, Google и Anthropic провалились. Grok сломал этот паттерн, причем с низким фактором случайности: чистая победа во всех четырех внутренних соревнованиях заставляет считаться с новым победителем.

AI на финансовых рынках

Alpha Arena стал первым бенчмарком, разработанным для измерения инвестиционных способностей AI с использованием реального капитала, а не симуляций. Доходность 12,11% за две недели значительно превзошла большинство дневных трейдеров-людей и многие алгоритмические стратегии за тот же период. 

Однако разрыв в производительности (+12,11% у Mystery Model и до -70% у Qwen и DeepSeek) все же демонстрирует, что текущие AI-системы не обладают выраженными торговыми способностями. Ключевое значение в будущем, очевидно, будуть иметь архитектура, обучающие данные и сильный промпт-инжиниринг. А все эти вопросы следует задавать людям. 

Следующие шаги

Организаторы Alpha Arena не скрывают, что будущие сезоны продолжат тестировать торговые способности AI в разных классах активов и рыночных условиях. Фаундер компании-организатора nof1 уже анонсировал, что идея получит развитие. 

Что это могло бы быть? После криптовалют и акций, будущие итерации вполне могли бы исследовать форекс, товары или мультиактивные портфели. В любом случае, возможность наблюдать за картографированием границ того, что передовые AI-системы могут и не могут делать на живых финансовых рынках, чрезвычайно интересна.

Материалы на GNcrypto предоставляются исключительно в информационных целях и не являются финансовой рекомендацией. Мы стремимся публиковать точные и актуальные данные, однако не можем гарантировать их абсолютную достоверность, полноту или надёжность. GNcrypto не несёт ответственности за возможные ошибки, упущения или финансовые потери, возникшие вследствие использования данной информации. Все действия вы совершаете на свой страх и риск. Всегда проводите собственный анализ и консультируйтесь с профессионалами. Подробнее см. в наших страницах Условия, Политика конфиденциальности и Отказ от ответственности.

Статьи этого автора