Claude Fable 5 znów działa. Najpotężniejszy publiczny model Anthropic wrócił 1 lipca — dwa i pół tygodnia po tym, jak nagle wyłączono go na polecenie władz USA.
Powód był poważny. W połowie czerwca badacze z Amazona zdołali obejść wbudowane zabezpieczenia Fable 5 i skłonili model do znajdowania realnych luk w oprogramowaniu oraz pisania kodu do ich wykorzystania. W odpowiedzi amerykański Departament Handlu nagle nałożył kontrole eksportowe na Fable 5 i jego bardziej zamkniętego „starszego brata" Mythos 5, powołując się na bezpieczeństwo narodowe.
Formalnie Anthropic nakazano odciąć dostęp „każdemu obcokrajowcowi — w USA i poza nimi, w tym własnym pracownikom z zagranicy". Firma nie potrafiła weryfikować obywatelstwa użytkowników w czasie rzeczywistym, więc musiała wyłączyć oba modele na całym świecie, by nie złamać przepisów.
Aby przywrócić model, Anthropic przez dwa tygodnie budował nowy klasyfikator bezpieczeństwa, który blokuje dokładnie tę technikę ataku znalezioną przez Amazon — ze skutecznością 99%. Przez cały ten czas Departament Handlu sprawdzał modele wspólnie z firmą. W zamian Anthropic zgodził się sam szukać luk, koordynować przyszłe premiery i zgłaszać wszelkie próby nadużyć. Ograniczenia zniesiono 30 czerwca, a dostęp wrócił 1 lipca.
Ta historia pokazuje, jak ściśle zaawansowana AI jest dziś związana z państwem. Jeden udany atak i potężny model zostaje na dwa tygodnie wyłączony na całym świecie. Dla Anthropic to zarazem lekcja i cena przywództwa: im silniejszy model, tym bliżej regulatorzy.



