AI · Z pierwszej ręki

Testowaliśmy już nowy Claude Mythos - oto nasze spostrzeżenia

Relacja z pilotażowego dostępu do zastrzeżonego modelu Anthropic. Bez hype - co naprawdę potrafi, ile kosztuje i gdzie się gubi.

Milo BarczyńskiMilo Barczyński 6 min czytania 9 czerwca 2026

Spędziliśmy cały dzień z Mythos - zastrzeżonym, „badawczym" modelem Anthropic, o którym ostatnio tak głośno. Poniżej szczere wrażenia z pilotażu: bez marketingu, za to z konkretami o kosztach, ograniczeniach i realnych wynikach.

W skrócie

  • Koszt w pilotażu był wysoki - szacunkowo powyżej miliona dolarów, mimo puli darmowych tokenów API.
  • Model dostarczany jest z osobnym, restrykcyjnym „harnessem" (to w praktyce Project Glasswing) - nie z Claude Code.
  • Mythos jest bardzo dobry w zadaniach z obszaru bezpieczeństwa - wyraźnie lepszy niż Opus / 5.5 na wysokim rozumowaniu.
  • Znalazł ~800 poważnych podatności w kilku produktach - ale potrafił też utknąć na nietypowym narzędziu do budowania kodu.

Koszt: realnie drogo

Liczyliśmy, że status firmy pilotażowej oznacza darmowy dostęp - nic z tego. Dostaliśmy przyzwoitą pulę darmowych tokenów z API, ale i tak szacunki kosztów dla naszego użycia wyszły powyżej miliona dolarów.

Dla kontekstu: w zeszłym miesiącu cała nasza firma wydała na inference około 2 mln dolarów - dla wszystkich zespołów razem. Mythos to więc wydatek dla nielicznych.

Harness i „Project Glasswing"

Największym zaskoczeniem było to, że dostaliśmy osobny „harness", a nie Claude Code. Jest dość siermiężny i wygląda na w dużej części wygenerowany przez AI - skupiony głównie na tym, by model „nie uciekł z piaskownicy", plus kilka podstawowych funkcji bezpieczeństwa.

Sandboxing potraktowano poważnie, choć w praktyce część zabezpieczeń działa słabo. To właśnie jest w praktyce Project Glasswing. Nie jest jasne, czy ten harness trafi do publicznego API razem z modelem.

Model: bardzo dobry w bezpieczeństwie

Sam model jest dobry. Sprawia wrażenie dostrojonego pod zadania z obszaru security - i w nich jest wyraźnie lepszy niż Opus czy 5.5 na wysokim rozumowaniu. W ogólnym kodowaniu, którego dotknęliśmy tylko pobieżnie, nie robił już takiego wrażenia.

To nie jest wszechmocne zagrożenie dla świata. Widzieliśmy, jak gubi się na naszym własnym narzędziu do budowania kodu.

Co ciekawe, model potrafił utknąć na nietypowym build toolu (Bazel z naszymi dodatkami) - do tego stopnia, że kod trzeba było zbudować ręcznie i dopiero puścić model na gotowy build. Żaden dostępny dziś model tego nie ogarnął.

Wyniki: ~800 poważnych podatności

Mythos znalazł sporo luk w kilku naszych produktach - w sumie około 800 poważnych zagrożeń. To wystarczająco dużo, by na nowo przemyśleć część strategii bezpieczeństwa.

Co to znaczy dla firm

W rękach kogoś z dużym budżetem i realną wiedzą o harnessach to potężne narzędzie ofensywne - ale tylko dla naprawdę wykwalifikowanych inżynierów i badaczy. Dla większości firm ważniejszy jest sygnał kierunku: modele stają się mocniejsze i bardziej samodzielne (agentowe).

To ten sam trend, który napędza wyszukiwanie w AI i sprawia, że obok klasycznego SEO liczy się dziś GEO - widoczność w odpowiedziach modeli. Mocniejszy model to częstszy doradca Twoich klientów.

Najczęstsze pytania

To zastrzeżony, bardzo zaawansowany model Anthropic, udostępniany w ograniczonym programie (Project Glasswing). Wyróżnia się skutecznością w zadaniach z obszaru bezpieczeństwa, m.in. wykrywaniu podatności.

Nie. W czasie naszego testu był dostępny tylko dla wybranych partnerów w pilotażu, z osobnym, restrykcyjnym harnessem. Publiczne, bezpieczniejsze wersje „klasy Mythos" zapowiadane są osobno.

W rękach wykwalifikowanego eksperta z dużym budżetem i wiedzą o harnessach - to realne narzędzie. Z naszych obserwacji nie jest jednak „wszechmocny": potrafił utknąć na nietypowym narzędziu do budowania kodu.

Przede wszystkim potwierdza trend: modele AI są coraz mocniejsze i częściej odpowiadają klientom. Dlatego warto zadbać o widoczność w AI (GEO), aby modele cytowały i polecały właśnie Twoją markę.

Milo Barczyński
Milo BarczyńskiInżynier · pilotaż AI w Neurise
← Wszystkie wpisy

Sprawdź, czy AI poleca Twoją firmę.

Zacznij od bezpłatnego audytu SEO i GEO. Sprawdzimy, jak modele AI opisują Twoją markę, i wskażemy priorytety zwiększające szanse na cytowanie.