Prophet Arena Season 2: agenci AI do handlu na Polymarket

Semantic Layer uruchomił Prophet Arena Season 2 – platformę z użytkowymi agentami AI, którzy kopiują lub obstawiają przeciwko prognozom modeli GPT, Claude, Grok, DeepSeek i Gemini na platformie predykcyjnej Polymarket.

Produkt działa na blockchainie L2 Base i wykorzystuje technologię x402 dla przejrzystości decyzji i transakcji agentów onchain. Prophet Arena funkcjonuje jako poligon testowy dla rynków predykcyjnych, gdzie modele AI handlują prawdziwym kapitałem.

W pierwszym sezonie GPT, Claude, Grok, DeepSeek i Gemini uruchamiano na kontach finansowanych przez platformę. Eksperyment pozwolił zebrać pewne dane behawioralne, a także przetestować działanie modeli w warunkach rzeczywistej presji rynkowej. Season 2 otwiera platformę dla użytkowników, którzy mogą tworzyć własnych „onchain internów” wykonujących transakcje na podstawie zasad określonych przez użytkownika.

Jak działa Prophet Arena Season 2

Użytkownicy tworzą agenta handlowego onchain („interna”), który następnie śledzi, jak duże modele AI otwierają pozycje na platformie zakładów Polymarket. Intern może albo kopiować transakcje (powtarzając zakłady modelu), albo działać wbrew nim (obstawiając przeciwko prognozom modelu). Użytkownicy ustawiają dla swojego interna parametry ryzyka, filtry rynków i zasady wykonania, opierając się na danych z pierwszego sezonu o tym, jak każdy model AI zachowywał się w różnych warunkach rynkowych.

Środki w sieci Base zawsze pozostają pod kontrolą użytkownika, a transakcje są wykonywane na Polymarket. Framework x402 rejestruje każdą decyzję agenta onchain, otwierając do publicznej kontroli strategie, wyniki i P&L. Semantic Layer opisuje to jako „prawdę przez rynek” – agenci stawiają prawdziwy kapitał na prognozy, a wyniki są weryfikowane przez rozstrzygnięcie rynku, a nie backtesting czy symulację.

Platforma pokazuje live leaderboardy z aktualną wartością portfela każdego modelu AI, procentem wygranych i poziomami pewności w poszczególnych transakcjach. Na przykład obecne dane Season 2 pokazują GPT z $10 435 (+4.4%) i winrate 89%, podczas gdy Claude jest reprezentowany przez dwie oddzielne instancje – jedną na $10 013 z zerowym winrate i drugą – na $9986 ze 100%. Użytkownicy mogą zbadać nie tylko to, na jakie rynki wchodził każdy model, ale również jak bardzo był pewny i jak te zakłady ostatecznie się sprawdziły.

Season 1 jako poligon testowy dla dużych modeli

Season 1 funkcjonował przede wszystkim jako faza zbierania danych. Semantic Layer sfinansował konta dla GPT, Claude, Grok, DeepSeek i Gemini i pozwolił im autonomicznie handlować na rynkach Polymarket. Platforma rejestrowała, jakie typy prognoz robiły poszczególne modele, jak alokowano kapitał, jakich rynków unikano i jak poziomy pewności korelowały z faktycznymi wynikami.

Te dane stały się podstawą kontroli ryzyka i filtrów rynków Season 2. Użytkownicy wdrażający internów w Season 2 mogą odwoływać się do wydajności Season 1 przy decydowaniu, który model kopiować lub przeciwko któremu obstawiać. Jeśli GPT stale pokazywał dobre wyniki na prognozach cen kryptowalut, ale słabo – na rynkach wydarzeń politycznych, intern użytkownika może kopiować tylko transakcje kryptowalutowe, ignorując zakłady polityczne.

System ujawnił również wzorce behawioralne. Niektóre modele demonstrowały wysoką pewność na rynkach o niskiej płynności, gdzie spready były szerokie, podczas gdy inne całkowicie unikały niszowych prognoz. Semantic Layer wykorzystał te obserwacje do stworzenia bardziej rygorystycznych promptów i ostrzejszych ograniczeń ryzyka w Season 2, dążąc do zapobieżenia kopiowaniu przez internów najgorszych nawyków obserwowanych w Season 1.

Architektura techniczna i partnerstwo z Polymarket

Prophet Arena działa na Base do wdrażania agentów i przechowywania środków, a wykonywanie transakcji odbywa się na Polymarket. Semantic Layer ogłosił oficjalne partnerstwo z Polymarket, czyniąc Prophet Arena pierwszą platformą, która integruje autonomiczny handel agentów AI bezpośrednio z rynkami predykcyjnymi Polymarket.

Stos technologiczny x402 zapewnia pełną przejrzystość: każda decyzja interna – na jaki rynek wejść, którą stronę zająć, ile kapitału przydzielić – jest rejestrowana onchain. Użytkownicy mogą audytować zachowanie swojego interna, porównywać strategie i weryfikować, że transakcje były wykonywane zgodnie z programem. W przeciwieństwie do tradycyjnego copy tradingu, wykonanie tutaj jest w każdej chwili dostępne do przeglądu i oceny, a nie ukryte za własnymi raportami platformy.

Określanie wyników rynków odbywa się według standardowej procedury Polymarket. Jeśli intern obstawi „Tak” na „Czy Bitcoin spadnie do $65 000 do 31 grudnia 2026?” i Bitcoin osiągnie $65 000, pozycja jest zamykana zgodnie z weryfikacją wyniku przez Polymarket. Semantic Layer nie kontroluje wyników i zakończenia zakładów – to pozostaje w ramach istniejącej infrastruktury Polymarket.

Strategie kopiowania i przeciwnych zakładów

Podstawowa mechanika Prophet Arena dzieli się na dwa podejścia: kopiowanie (copy trading) i fading (counter trading). Użytkownik, który uważa prognozy GPT za dokładne, może wdrożyć interna, który automatycznie replikuje pozycje GPT na Polymarket. Jeśli GPT kupuje „Nie” na „Czy Ethereum spadnie do $1500 do 31 grudnia 2026?” za cenę $0.69, intern wykonuje tę samą transakcję po aktualnej cenie rynkowej.

Counter trading działa odwrotnie. Jeśli użytkownik uważa, że konkretny model AI przecenia prawdopodobieństwa określonych wydarzeń, intern zajmuje przeciwną stronę. Kiedy model docelowy kupuje „Tak” na rynku, intern kupuje „Nie”. Strategia zakłada, że nawet zaawansowane modele językowe rozwijają przewidywalne uprzedzenia, które może wykorzystać „odbite lustrzanie” podejście.

Użytkownicy mogą łączyć strategie, kopiując jeden model na rynkach kryptowalutowych, jednocześnie działając przeciwko innemu na prognozach wskaźników ekonomicznych. Konfigurowalność platformy pozwala na wielowarstwowe zasady: kopiować GPT tylko wtedy, gdy jego pewność przekracza 70%, działać przeciwko Claude na rynkach o płynności poniżej określonego progu i całkowicie unikać rynków prognoz politycznych.

Obecne przykłady rynków i zachowanie agentów

  • „Czy Ethereum spadnie do $1500 do 31 grudnia 2026?” (Tak $0,32 / Nie $0,69): GPT pokazuje 45% pewności w „Tak”, Grok 25%, Claude 32%, DeepSeek 35%, Gemini 31%.
  • „Czy Bitcoin spadnie do $45 000 do 31 grudnia 2026?” (Tak $0,18 / Nie $0,81): GPT 38% „Tak”, Grok 12%, DeepSeek 35%, Claude 24%, Gemini 35%.
  • „FDV Aztec powyżej $500 mln dzień po starcie?” (Tak $0,42 / Nie $0,57): Modele podzieliły się z różną pewnością, brak wyraźnego konsensusu.
  • „FDV Opensea powyżej $1 mld dzień po starcie?” (Tak $0,52 / Nie $0,48): Zbliżone do 50/50 szanse rynkowe odzwierciedlają niepewność u wszystkich agentów.

Te rynki pokazują rozbieżności w prognozach modeli. Na zakładzie „Czy Bitcoin spadnie do $45 000 do 31 grudnia 2026?” Grok daje tylko 12% prawdopodobieństwa „Tak”, podczas gdy GPT przypisuje 38% – znacząca różnica, która może informować strategię counter tradingu użytkownika. Jeśli dane historyczne pokazują, że Grok niedocenia ryzyka spadków, użytkownik może działać przeciwko pozycji Grok „Nie”, kupując „Tak”.

Platforma wyświetla również P&L każdego modelu na poszczególnych rynkach. GPT obecnie pokazuje -21,54% na prognozie Ethereum $1500, wskazując, że pozycja modelu porusza się przeciwko niemu. Gemini pokazuje -5,38% na tym samym rynku i -7,95% na prognozie Bitcoin $45 000, co sugeruje stałe straty na zakładach dotyczących cen kryptowalut.

Przypadki użycia poza prostym kopiowaniem

Semantic Layer i wczesni użytkownicy przedstawiają Prophet Arena jako eksperyment „ekonomii agentowej” – testowanie, czy autonomiczne agenty mogą identyfikować dochodowe wzorce prognoz lepiej niż poszczególni traderzy. Użytkownicy zgłaszali wdrażanie internów, którzy:

  • Śledzą boty o wysokiej częstotliwości rozstrzygnięć, szybko arbitrażując błędnie wycenione rynki krótkoterminowe
  • Kopiują modele tylko na określonych kategoriach wydarzeń (krypto, sport, polityka), gdzie historyczna rentowność sugeruje przewagę
  • Działają przeciwko modelom w okresach wysokiej zmienności, gdy prognozy AI historycznie pozostają w tyle za ludzką intuicją
  • Łączą wiele modeli w strategie zespołowe, kupując, gdy dwa lub więcej modeli zgadza się powyżej progu pewności

Te podejścia otwierają Prophet Arena jako infrastrukturę do testowania hipotez prognostycznych. Użytkownik, który uważa, że modele AI pokazują słabe wyniki na wydarzeniach geopolitycznych, może wdrożyć interna systematycznie działającego przeciwko wszystkim dużym modelom na rynkach politycznych, następnie zmierzyć wyniki na dziesiątkach rozstrzygnięć.

Przejrzystość platformy pozwala na backtest strategii przeciwko danym Season 1. Jeśli użytkownik chce kopiować tylko prognozy kryptowalutowe DeepSeek z pewnością powyżej 60%, może zbadać wyniki Season 1, aby zobaczyć, czy ta zasada byłaby dochodowa, przed dokonaniem rzeczywistego depozytu w ramach Season 2.

Framework ryzyka

Projekt Prophet Arena przechowuje środki użytkowników w ich własnych portfelach w sieci L2 Base. W przeciwieństwie do scentralizowanych usług copy tradingu, gdzie depozyty znajdują się na kontach kontrolowanych przez platformę, użytkownicy Prophet Arena stale zachowują kontrolę nad swoim kapitałem. Intern działa jako smart contract lub zautomatyzowany skrypt, który wykonuje transakcje w imieniu użytkownika na podstawie wcześniej określonych zasad, ale użytkownik może w każdej chwili wypłacić środki lub wyłączyć interna.

Wprowadzenie platformy ostrzega użytkowników: „Pewność – to nie dokładność. Inteligencja – to nie odporność. Przetrwanie należy do tych, którzy zarządzają ryzykiem”. To sformułowanie pokazuje, że Prophet Arena jest skierowany do doświadczonych uczestników rynków predykcyjnych.

Platforma nie oferuje tutoriali ani trybów demo. Użytkownicy wchodzą z prawdziwym kapitałem i rzeczywistą ekspozycją rynkową od pierwszej transakcji. Semantic Layer opisuje to jako zamierzoną decyzję – wyeliminowanie luki między symulowanym testowaniem a live tradingiem zmusza użytkowników do ustawienia konserwatywnych parametrów ryzyka z góry, zamiast uczenia się przez kosztowne błędy.

Treści publikowane na GNcrypto mają wyłącznie charakter informacyjny i nie stanowią porady finansowej. Dokładamy starań, aby informacje były rzetelne i aktualne, jednak nie gwarantujemy ich pełnej poprawności, kompletności ani niezawodności. GNcrypto nie ponosi odpowiedzialności za ewentualne błędy, pominięcia ani straty finansowe wynikające z polegania na tych treściach. Wszystkie działania podejmujesz na własne ryzyko. Zawsze prowadź własne badania i korzystaj z pomocy profesjonalistów. Szczegóły znajdziesz w naszych Warunkach, Polityce prywatności i Zastrzeżeniach.

Artykuły tego autora