Claude Fable 5 och Mythos 5 tillgängliga igen

Den 9 juni 2026 lanserade Anthropic två nya modeller: Claude Fable 5 och Claude Mythos 5. Båda bygger på samma underliggande modell, men gavs olika skyddsnivåer. Fable 5 fick starka skyddsmekanismer för allmänt bruk, medan Mythos 5 — med färre begränsningar — bara släpptes till ett fåtal betrodda partners inom det så kallade Glasswing-programmet, för defensivt cybersäkerhetsarbete.

Vad hände den 12 juni?

Den amerikanska regeringen fick kännedom om en rapport där forskare på Amazon hittat ett sätt att kringgå Fable 5s skyddsmekanismer. Genom att ställa specifika frågor kunde de få modellen att identifiera ett antal mjukvarusårbarheter — och i ett fall producerade modellen kod som visade hur sårbarheten kunde utnyttjas. Samma dag, fredag 12 juni, införde regeringen exportkontroller mot Fable 5 och Mythos 5. Kontrollerna krävde att åtkomst begränsades för utländska medborgare, oavsett om de befann sig i eller utanför USA. Eftersom beslutet gällde omedelbart, och Anthropic saknade ett tillförlitligt sätt att verifiera användares nationalitet i realtid, stängde man av åtkomsten till båda modellerna för samtliga användare.

Anthropics utredning

I sin genomgång testade Anthropic om andra, mindre kapabla modeller kunde göra samma sak som Fable 5 gjorde i rapporten.

Resultatet: flera modeller — bland andra Claude Opus 4.8, GPT-5.5 och Kimi K2.7 — kunde identifiera samma sårbarheter. När det gällde att visa hur den specifika sårbarheten kunde utnyttjas kunde samtliga testade modeller (inklusive Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 och Kimi K2.7) producera samma typ av demonstration som Fable 5. Anthropic betonar att den rapporterade tekniken inte gav tillgång till några unika Mythos-nivå-cyberförmågor. Det handlade om ett gränsfall i Fable 5s skyddsmekanismer — en typ av uppgift som sällan är farlig men som ändå blockeras av försiktighetsskäl. I det här fallet rörde det sig om rutinmässigt, defensivt säkerhetsarbete.

Ny säkerhetsklassificerare — och lättade kontroller

Anthropic arbetade tillsammans med myndigheterna fram en förbättrad säkerhetsklassificerare som specifikt riktar in sig på den rapporterade tekniken. Den blockerar nu den specifika metoden i över 99 % av fallen. Om en förfrågan till Fable 5 blockeras meddelas användaren, och förfrågan skickas i stället till Opus 4.8. Forskare vid det amerikanska handelsdepartementets CAISI (Center for AI Standards and Innovation) har granskat både de tidigare och de nya skyddsmekanismerna och bedömer dem som mycket starka. Den 26 juni godkände regeringen återställd åtkomst till Mythos 5 för en grupp amerikanska organisationer inom Glasswing-programmet. Den 30 juni hävdes exportkontrollerna på Fable 5 och Mythos 5 helt. Sedan onsdagen den 1 juli är Fable 5 tillgänglig globalt via Claude-plattformen, Claude.ai, Claude Code och Claude Cowork. För Pro-, Max-, Team- och vissa Enterprise-planer ingår Fable 5 i upp till 50 % av veckans användningsgräns fram till den 7 juli, därefter nås modellen via användningskrediter. Åtkomst via AWS, Google Cloud och Microsoft Foundry återställs så snart som möjligt.

Så fungerar Anthropics säkerhetsklassificerare

Anthropic beskriver sin metod som "försvar på djupet" — flera lager av skydd som var för sig är ofullständiga, men som tillsammans gör modellen svår att missbruka. En central del är klassificerare: mindre AI-system som under en konversation upptäcker om modellen ombeds utföra en potentiellt skadlig cybersäkerhetsuppgift, och då blockerar svaret. Klassificerarna sätts medvetet med en säkerhetsmarginal — de blockerar även en del förfrågningar som sannolikt är ofarliga, för att minska risken att missa något som faktiskt är skadligt. För Fable 5 gjordes den marginalen större än i någon tidigare lansering, vilket innebär fler blockerade men ofarliga förfrågningar. Anthropic beskriver det som en medveten avvägning för att kunna göra modellens övriga förmågor brett tillgängliga. Anthropic delar även in jailbreak-försök (tekniker som kringgår en modells skyddsmekanismer) i allvarlighetsgrad: mindre jailbreaks som bara når in i säkerhetsmarginalen, smala skadliga jailbreaks som låser upp enstaka skadliga beteenden, och universella jailbreaks som låser upp en bred uppsättning skadliga beteenden. Enligt Anthropic har inga universella jailbreaks hittats för Fable 5 hittills, men modellen granskas löpande av externa säkerhetsforskare.

Ett gemensamt branschramverk för jailbreaks Händelsen visade att branschen saknar en gemensam standard för att bedöma hur allvarlig en given AI-jailbreak är.

Tillsammans med Amazon, Microsoft, Google och övriga Glasswing-partners håller Anthropic nu på att ta fram ett sådant ramverk. Förslaget bedömer en jailbreak utifrån fyra kriterier:

  • Förmågevinst — hur mycket längre tar tekniken användaren jämfört med redan tillgängliga verktyg? Bredd — fungerar samma teknik för flera olika typer av skadliga uppgifter

  • Enkelhet att vapenisera — hur mycket mänskligt arbete krävs för att omsätta tekniken i en attack?

  • Upptäckbarhet — hur lätt är tekniken att komma över? För de allvarligaste fallen — exempelvis en jailbreak som aktivt används för att orsaka allvarlig skada på kritisk infrastruktur som elnät eller banksystem kommer Anthropic att börja driftsätta preliminära motåtgärder omedelbart vid bekräftad allvarlighetsgrad.

Företaget sätter också upp ett team för dygnet-runt-bevakning av kanaler där jailbreaks rapporteras, och lanserar ett nytt HackerOne-program där säkerhetsforskare kan lämna in cyberrelaterade jailbreaks i Fable 5 för granskning.

Djupare samarbete med myndigheter

Anthropic beskriver även en fördjupad samverkan med amerikanska myndigheter, byggt vidare på nästan två års tidigare samarbete kring testning och utvärdering före lansering:

Tidig myndighetsåtkomst

för modeller som väsentligt flyttar fram kapacitetsgränsen inom områden med koppling till nationell säkerhet får utvalda myndighetspartners utökad tidig åtkomst till både modellerna och deras skyddsmekanismer, för att kunna köra egna utvärderingar före bred lansering.

Snabb informationsdelning

vid allvarliga jailbreaks eller missbruksmönster kommer Anthropic snabbt utreda, prioritera och informera berörda myndighetskontakter, samt dela de nya skyddsmekanismer som byggs som svar.

Dedikerade resurser för gemensam forskning

Anthropic skalar upp samarbetet kring AI-säkerhet, med dedikerade team, beräkningskapacitet och sin egen säkerhets- och red teaming-expertis.

En gemensam branschstandard

arbete tillsammans med myndigheter och branschkollegor mot en delad, frivillig säkerhets- och utvärderingsstandard för leverantörer av frontier-modeller.

För vanliga Enterprise-platser ingår ingen Fable 5-kvot, men åtkomst kan fås via användningskrediter. För premium Enterprise-platser ingår Fable 5 utan extra kostnad fram till den 7 juli, därefter krävs användningskrediter för fortsatt åtkomst.

Se källhänvisning längre ner i artikeln.