Firma Anthropic postanowiła nie udostępniać publicznie modelu Claude Mythos po odkryciu jego zdolności do masowego hakowania. Wywołuje to pytania o to, jak tego typu modele mogą wpłynąć na stabilność instytucji państwowych.
Długoterminowe pytania o ład i zarządzanie
Przypadek Mythos pokazuje napięcie między bezpieczeństwem a koncentracją władzy. Projekt Glasswing chroni wybrane podmioty, ale jednocześnie ogranicza szerszą debatę publiczną. Decyzje o dostępie pozostają w rękach kilku graczy. Może to opóźnić rozwój regulacji na poziomie państwowym, choć jednocześnie kupuje czas na przygotowanie odpowiedniej obrony.
Pytanie, czy inne laboratoria powtórzą ten model działania, pozostaje otwarte. Szybkie rozprzestrzenianie się zdolności technologicznych sugeruje, że restrykcje będą miały charakter tymczasowy. Konieczne są szersze badania nad zamachami stanu wspomaganymi przez AI, aby przygotować instytucje na nadchodzące zmiany.
Źródła:
LessWrong, 80,000 Hours, Forethought, AISI, SACR substack