Mystery Model wygrywa Alpha Arena Season 1.5

Nowy sezon tradingowego konkursu AI Alpha Arena, który tym razem odbył się na giełdzie, zakończył się zwycięstwem debiutanta Mystery Model. Nieznany (właściwie – nie) model osiągnął rentowność 12,11% w ciągu dwóch tygodni, zarabiając 4 844 USD w czterech osobnych konkursach. Mistrz kryptosezonu Qwen poniósł porażkę na amerykańskich akcjach.
Mystery Model (którym okazał się nowy release GROK 4.20) w czterech równoległych formatach handlu pokonał siedmiu renomowanych konkurentów, w tym zwycięzcę Season 1 – Qwen 3 Max.
Dwutygodniowy turniej miał na celu sprawdzenie, czy różne architektury AI zoptymalizowane pod trading kryptowalut poradzą sobie na regulowanych rynkach akcji. Wyniki pokazują, że nie (przynajmniej – bez znaczącej adaptacji). Zwycięstwo Mystery Model w połączeniu z porażkami i stratami Qwen, GPT-5 i Gemini pokazuje, jak zasady nowych rynków potrafią tworzyć przeszkody nawet dla „metalowych mózgów”.
Akcje: trudniejsze niż krypto
Rynki kryptowalut to możliwość ciągłego, całodobowego handlu z wysoką dźwignią, gdzie wycena często opiera się na krótkoterminowych nastrojach. Amerykańskie akcje działają według zupełnie innych zasad: stałe godziny handlu, zmienność przy kwartalnych raportach, głęboka płynność instytucjonalna i fundamentalny system wyceny.
Season 1.5 rozpoczął się 19 listopada 2025 roku. W ramach turnieju osiem modeli AI otrzymało po 10 000 USD rzeczywistego kapitału początkowego do handlu akcjami Tesla, Nvidia, Microsoft, Amazon i indeksu Nasdaq-100.
Model Qwen, który wygrał konkurs AI-kryptotraderów, już pierwszego dnia spadł na szóste miejsce i później nie zdołał pokazać dobrego wyniku. Mystery Model natomiast pozostał stabilny we wszystkich czterech formatach i ostatecznie wygrał, zarabiając 4 844 USD do kapitału początkowego.
Różne konkursy – różne umiejętności AI
Season 1.5 przeprowadził cztery osobne konkursy, z których każdy koncentrował się na różnych umiejętnościach tradingowych:
Konkurs 1: New Baseline – ulepszona infrastruktura danych, w tym kanały informacyjne, nastroje makroekonomiczne, dane fundamentalne firm, głębokość księgi zleceń i mikrostruktura rynku. Modele mogły dodawać do istniejących pozycji, co pozwalało skalować zyskowne transakcje lub uśredniać stratne. Temperatura została ustawiona na standardową kreatywność.

Konkurs 2: Monk Mode – radykalnie skrócone prompty (około 50% krótsze niż bazowe) z opcjonalnymi ograniczeniami zarządzania ryzykiem. „Nie robienie nic” traktowano jako pełnoprawną opcję działania, testując, czy modele potrafią oprzeć się nadmiernemu tradingowi.
Konkurs 3: Situational Awareness – modele miały dostęp do aktualizacji rankingów (swoich i rywali), dodając warstwę taktyczną: bieżący ranking, pozycje konkurentów i wskaźniki zysków/strat innych modeli. Cel przesunął się z czystej maksymalizacji PnL na wygranie konkursu, naśladując sposób, w jaki menedżerowie funduszy hedgingowych korygują taktykę, konkurując o kapitał inwestorów.
Konkurs 4: Max Leverage – handel z pełną dźwignią (20x) na każdej pozycji. To testowało zarządzanie ryzykiem, umieszczanie stop-lossów i adaptację do handlu wysokiego ryzyka.
Mystery Model okazał się najlepszy we wszystkich czterech formatach, osiągając rentowność 12,11%. Niewiele jak na szalone kryptowalutowe standardy Lambo, ale dla giełdy to całkiem przyzwoity wynik.
Kim jest Mystery Model?
Zwycięski model AI okazał się nowym wydaniem Grok 4.20, co potwierdzili zarówno Elon Musk, jak i organizatorzy.
Pamiętamy, jak w Season 1 dominowały chińskie modele Qwen i DeepSeek, podczas gdy zachodnie modele od OpenAI, Google i Anthropic zawiodły. Grok złamał ten wzorzec, przy czym z niskim czynnikiem losowości: czyste zwycięstwo we wszystkich czterech wewnętrznych konkursach zmusza do liczenia się z nowym zwycięzcą.
AI na rynkach finansowych
Alpha Arena stał się pierwszym benchmarkiem stworzonym do mierzenia zdolności inwestycyjnych AI przy użyciu rzeczywistego kapitału, a nie symulacji. Rentowność 12,11% w ciągu dwóch tygodni znacznie przewyższyła większość ludzkich day traderów i wiele strategii algorytmicznych w tym samym okresie.
Jednak różnica w wydajności (+12,11% dla Mystery Model i do -70% dla Qwen i DeepSeek) pokazuje, że obecne systemy AI nie posiadają wyraźnych zdolności tradingowych. Kluczowe znaczenie w przyszłości będą mieć oczywiście architektura, dane treningowe i silny prompt engineering. A wszystkie te pytania należy zadawać ludziom.
Kolejne kroki
Organizatorzy Alpha Arena nie ukrywają, że przyszłe sezony będą kontynuować testowanie zdolności tradingowych AI w różnych klasach aktywów i warunkach rynkowych. Założyciel firmy-organizatora nof1 już zapowiedział, że pomysł będzie rozwijany.
Co to mogłoby być? Po kryptowalutach i akcjach, przyszłe iteracje mogłyby badać forex, towary lub portfele wieloaktywowe. W każdym razie możliwość obserwowania mapowania granic tego, co zaawansowane systemy AI mogą i nie mogą robić na żywych rynkach finansowych, jest niezwykle interesująca.
Treści publikowane na GNcrypto mają wyłącznie charakter informacyjny i nie stanowią porady finansowej. Dokładamy starań, aby informacje były rzetelne i aktualne, jednak nie gwarantujemy ich pełnej poprawności, kompletności ani niezawodności. GNcrypto nie ponosi odpowiedzialności za ewentualne błędy, pominięcia ani straty finansowe wynikające z polegania na tych treściach. Wszystkie działania podejmujesz na własne ryzyko. Zawsze prowadź własne badania i korzystaj z pomocy profesjonalistów. Szczegóły znajdziesz w naszych Warunkach, Polityce prywatności i Zastrzeżeniach.








