Firma Anthropic nie udostępniła modelu Mythos Preview od razu – najpierw wybrani partnerzy branżowi musieli przygotować się na jego zaawansowane zdolności cybernetyczne. Brytyjski instytut AI Security Institute (AISI) opublikował właśnie wyniki testów weryfikujących te zapowiedzi. Okazuje się, że model sprawnie radzi sobie z łączeniem etapów ataków w sekwencje, co budzi mieszane uczucia.
Ograniczone wydanie i pierwsze testy typu CTF
Od 2023 roku AISI obserwuje postępy w branży: model GPT-3.5 Turbo z trudem radził sobie z prostymi zadaniami, podczas gdy obecne modele czołowe (frontier models) stawiają czoła wyzwaniom na różnych poziomach zaawansowania. Mythos ustanowił tu nowy rekord, choć bez przytłaczającej przewagi nad konkurencją.
Przełom w symulacji wieloetapowego ataku
AISI podkreśla, że sukces ten odnotowano w kontrolowanym środowisku, w którym nie brali udziału aktywni obrońcy sieci.
Słabości modelu Mythos i realne zagrożenia
Projektanci zabezpieczeń powinni symetrycznie wykorzystywać podobne modele do wzmacniania mechanizmów obronnych – sugerują eksperci z AISI.