Mystery Model перемагає в Alpha Arena Season 1.5

Mystery Model wins Alpha Arena Season 1.5

Новий сезон трейдингового AI-змагання Alpha Arena, яке цього разу проводилося на фондовому ринку, завершився перемогою новачка Mystery Model. Невідома (насправді – ні) модель показала дохідність 12,11% за два тижні, заробивши $4 844 у чотирьох окремих конкурсах. Чемпіон криптосезону (Qwen) провалився на американських акціях.

Mystery Model (яка виявилася новим релізом GROK 4.20) у чотирьох паралельних форматах торгівлі обійшла сім іменитих конкурентів, включаючи переможця Season 1 – Qwen 3 Max.

Двотижневий турнір було присвячено перевірці того, чи зможуть різні AI-архітектури, оптимізовані для криптотрейдингу, перейти на регульовані ринки акцій. Результати показують, що ні (принаймні – без значної адаптації). Перемога Mystery Model у поєднанні з невдачами та збитками Qwen, GPT-5 і Gemini демонструє, як правила нових ринків здатні створювати перешкоди навіть для “металевих мізків”.

Акції: складніше криптовалют

Криптовалютні ринки – це можливість безперервно і цілодобово торгувати з високим плечем, де ціноутворення часто базується на короткострокових настроях. Американські ж акції працюють за зовсім іншими правилами: фіксовані торговельні години, волатильність на квартальній звітності, глибока інституційна ліквідність і фундаментальна система оцінки.

Season 1.5 стартував 19 листопада 2025 року. У рамках турніру вісім AI-моделей отримали по $10 000 реального стартового капіталу для торгівлі акціями Tesla, Nvidia, Microsoft, Amazon та індексу Nasdaq-100.

Модель Qwen, яка перемогла в конкурсі ІІ-криптотрейдерів, з першого ж дня опустилася на шосте місце, і потім так і не змогла показати гарний результат. Mystery Model, навпаки, залишалася стабільною у всіх чотирьох форматах і врешті-решт перемогла, заробивши $4 844 до стартового капіталу.

Різні конкурси – різні здібності AI

Season 1.5 провів чотири окремі змагання, кожне з яких фокусувалося на різних торговельних навичках:

Конкурс 1: New Baseline – покращена інфраструктура даних, включаючи новинні стрічки, макроекономічні настрої, фундаментальні дані компаній, глибину книги заявок і мікроструктуру ринку. Моделі могли додавати до існуючих позицій, що дозволяло масштабувати виграшні угоди або усереднюватися на збиткових. Температуру було встановлено на стандартну креативність.

AlphaArena 1.5

Конкурс 2: Monk Mode – радикально вкорочені промпти (приблизно на 50% коротші за базові) з опціональними обмеженнями щодо ризик-менеджменту. «Нічого не робити» розглядалося як повноцінний варіант дій, перевіряючи, чи можуть моделі протистояти надмірній торгівлі.

Конкурс 3: Situational Awareness – моделі мали доступ до оновлень рейтингів (своїх і суперників), додаючи тактичний шар: поточний ранг, позиції конкурентів і показники прибутку/збитків інших моделей. Мета змістилася з чистої максимізації PnL на перемогу в змаганні, імітуючи, як менеджери хедж-фондів коригують тактику, конкуруючи за капітал інвесторів.

Конкурс 4: Max Leverage – торгівля з повним плечем (20x) на кожну позицію. Це тестувало ризик-менеджмент, розміщення стоп-лосів і адаптацію до високоризикової торгівлі.

Mystery Model виявилася кращою у всіх чотирьох форматах, показавши дохідність 12,11%. Не так багато для шалених криптовалютних Ламба-стандартів, але для фондового ринку це цілком пристойний результат.

Хто така Mystery Model?

Переможна AI-модель виявилася новим релізом Grok 4.20, що підтвердив і Ілон Маск, і організатори.

Ми пам’ятаємо, як у Season 1 домінували китайські моделі Qwen і DeepSeek, тоді як західні моделі від OpenAI, Google та Anthropic провалилися. Grok зламав цей патерн, причому з низьким фактором випадковості: чиста перемога у всіх чотирьох внутрішніх змаганнях змушує рахуватися з новим переможцем.

AI на фінансових ринках

Alpha Arena став першим бенчмарком, розробленим для вимірювання інвестиційних здібностей AI з використанням реального капіталу, а не симуляцій. Дохідність 12,11% за два тижні значно перевершила більшість денних трейдерів-людей і багато алгоритмічних стратегій за той же період.

Однак розрив у продуктивності (+12,11% у Mystery Model і до -70% у Qwen і DeepSeek) все ж демонструє, що поточні AI-системи не володіють вираженими трейдинговими здібностями. Ключове значення в майбутньому, очевидно, матимуть архітектура, навчальні дані і сильний промпт-інжиніринг. А всі ці питання слід ставити людям.

Наступні кроки

Організатори Alpha Arena не приховують, що майбутні сезони продовжать тестувати торговельні здібності AI в різних класах активів і ринкових умовах. Фаундер компанії-організатора nof1 вже анонсував, що ідея отримає розвиток.

Що це могло б бути? Після криптовалют і акцій, майбутні ітерації цілком могли б досліджувати форекс, товари або мультиактивні портфелі. У будь-якому випадку, можливість спостерігати за картографуванням меж того, що передові AI-системи можуть і не можуть робити на живих фінансових ринках, надзвичайно цікава.

Матеріали на GNcrypto надаються виключно з інформаційною метою і не є фінансовою порадою. Ми намагаємось забезпечувати точність та актуальність даних, однак не можемо гарантувати їхню повну достовірність чи надійність. GNcrypto не несе відповідальності за можливі помилки, упущення або фінансові збитки, що можуть виникнути внаслідок використання цієї інформації. Усі дії ви здійснюєте на власний ризик. Завжди проводьте власне дослідження та звертайтесь до фахівців. Детальніше дивіться на наших сторiнках Умови, Політика конфіденційності та Дисклеймер.

Статті цього автора