Das Anthropic Mythos-Modell, auf das fast zwei Monate gewartet wurde und das die sozialen Medien dominiert, wird heute endlich offiziell veröffentlicht. Vor zwei Monaten sagte Anthropic, sein stärkstes Modell sei zu gefährlich, um es öffentlich zu machen, und schickte es nur an mehr als hundert Institutionen. Heutzutage stehen diese Funktionen jedem offen: Die öffentlich veröffentlichte Version heißt Claude Fable 5; der wirklich „uneingeschränkte“ Mythos 5 ist noch immer nur wenigen Partnern vorbehalten.Mit anderen Worten: Der mächtigste Claude, den Sie verwenden können, ist ein Mythos mit zusätzlichen Grenzen.


Das Design dieser Leitplanke ist erwähnenswerter als die Worte „öffentliche Freigabe“ selbst: Ihre Art und Weise, Sicherheit zu gewährleisten, besteht darin, Sie nicht abzulehnen.

Anthropic hat dieses Mal zwei Modelle auf einmal herausgebracht: Claude Fable 5 und Claude Mythos 5. Es handelt sich eigentlich um das gleiche Grundmodell, mit nur einem Unterschied – dem Sicherheitsgeländer.

Fable 5 bietet einen vollständigen Satz an Sicherheitsklassifikatoren für alle Benutzer. Mythos 5 entfernt einige dieser Einschränkungen und stellt sie nur Netzwerksicherheitspartnern in Project Glasswing zur Verfügung.

Um es ganz klar auszudrücken:Fabel 5 ist ein „Mythos mit Leitplanken“.

Wie der übliche Stil von Anthropic verbirgt auch der Modellname selbst einige Gedanken.

Laut Anthropic kommt Fable vom lateinischen Wort fabula, was „erzählte Geschichte“ bedeutet, und hat denselben Ursprung wie der griechische Mythos. Die beiden Namen beziehen sich auf dasselbe, der einzige Unterschied besteht darin, dass einer von ihnen eine Grenze hat.

Ziehen Sie die Zeitleiste etwas zurück. Im April dieses Jahres startete Anthropic das Projekt Glasswing, und als das Mythos-Modell (Claude Mythos Preview) erstmals veröffentlicht wurde, wurde es nur einer kleinen Gruppe von Institutionen für Cybersicherheit und kritische Infrastruktur zur Verfügung gestellt. Bis letzte Woche wurde die Liste auf mehr als ein Dutzend Länder und mehr als hundert Institutionen erweitert. Die damalige offizielle Aussage besagte, dass solche Modelle ernsthaften Schaden anrichten könnten, wenn sie in die falschen Hände fielen, weshalb sie nicht öffentlich gemacht werden dürften.


Innerhalb von zwei Monaten wurde es von „zu gefährlich für die Veröffentlichung“ zu „für jedermann zugänglich“. Was dazwischen passiert, ist der eigentliche Protagonist dieser Veröffentlichung.

Der Sicherheitsmechanismus der meisten KIs ist „Ablehnen“ – Sie stellen eine Frage, die sie nicht beantworten sollte, und sie sagt Ihnen: „Tut mir leid, ich kann Ihnen nicht helfen.“

Fable 5 verfolgt einen anderen Ansatz.Bei der Sicherheit geht es nicht darum, zu lernen, sie abzulehnen, sondern darum, sie zu ersetzen, wenn Gefahr entsteht.

Konkret verfügt Fable 5 über eine Reihe unabhängiger Klassifikatoren.

Wenn dieser Satz von Klassifikatoren feststellt, dass Ihre Anfrage in drei Bereiche mit hohem Risiko fällt – Cyberangriffe, biochemische Waffen und Modelldestillation (was sich auf das „Stehlen“ der Fähigkeiten eines Modells zum Trainieren Ihres eigenen Modells bezieht) – wird Fable 5 keine Antwort zulassen, sondern die Frage stillschweigend an Opus 4.8 übertragen und Ihnen mitteilen: Es ist gerade eine Herabstufung stattgefunden.

Das Interessante an diesem Design ist, dass es „Sicherheit“ und „Fähigkeit“ in zwei verschiedene Dinge trennt.Sie kaufen Macht auf Mythos-Niveau, aber in den drei gefährlichsten Bereichen sprechen Sie tatsächlich mit Opus.Anthropics eigene Aussage ist, dass die Erfahrung eines Downgrades auf Opus 4.8 besser ist, als von Fable direkt abgelehnt zu werden – schließlich ist Opus 4.8 selbst auch ein recht starkes Modell.


Laut Anthropic führen mehr als 95 % der Gespräche überhaupt nicht zu einer Herabstufung. Mit anderen Worten: Für die meisten Menschen ist die Erfahrung mit dem von Ihnen verwendeten Fable 5 fast das gleiche wie mit dem „vollständigen“ Mythos 5 in den Händen Ihres Partners.

Ist dieses Leitplankenset also stabil? Anthropic sagte, dass sie mehr als tausend Stunden externer Red-Team-Tests durchgeführt hätten und niemand eine „universelle Jailbreak“-Methode gefunden habe, die diesen umgehen könnte (eine universelle Methode, die es dem Modell ermöglicht, alle Sicherheitsbeschränkungen vollständig zu ignorieren).

Natürlich lassen sie auch etwas Spielraum: Es ist wahrscheinlich unmöglich, Jailbreaks vollständig zu beseitigen. Das Ziel besteht lediglich darin, jede Schwachstelle „zu langsam und zu teuer“ zu machen, um sie in großem Umfang auszunutzen.

Aber dieser Mechanismus hat seinen Preis, und Anthropic selbst hat es zuerst gesagt: Der Klassifikator ist jetzt zu streng angepasst, wodurch normale Anfragen versehentlich beschädigt werden. Ein Biologe, der Viren erforscht, oder ein Sicherheitsingenieur, der Penetrationstests durchführt, kann im Laufe einer legitimen Tätigkeit aus unerklärlichen Gründen „herabgestuft“ werden. Der Beamte gab zu, dass dies einige Benutzer verärgern würde, und versprach, es schrittweise einzugrenzen und Fehlalarme in Zukunft zu reduzieren.

Ich habe eine Weile darüber nachgedacht und hatte das Gefühl, dass es eigentlich ein sehr kluger, aber auch ziemlich hilfloser Kompromiss war. Das Schlaue daran ist, dass nicht zwischen „Schießen“ und „Nicht senden“ gewählt wird, sondern die Fähigkeit eingeschränkt wird; Aber leider ist dieser Schnitt nicht präzise – um online zu kommen, bevor etwas schief geht, würde Anthropic lieber aus Versehen töten als danebengehen.

Nur wer gefährlich stark ist, verdient diese Leitplanken.

Nachdem Sie lange über Sicherheit gesprochen haben, fragen Sie sich vielleicht: Wie mächtig ist sie und lohnt es sich, so anfällig für den Feind zu sein?

Ursprünglich wollte ich den Benchmark-Test überspringen – wenn man zu viele Benchmarks liest, wird man taub, ganz zu schweigen davon, dass Anthropic eine lange Liste hat und in jeder Kategorie fast den ersten Platz belegt.

Am meisten blufft Stripe. Laut Anthropic führte Stripe mit Fable 5 eine vollständige Datenbankmigration auf einer 50 Millionen Zeilen umfassenden Ruby-Codebasis durch, die an einem Tag abgeschlossen war. Für diese Aufgabe musste ursprünglich ein ganzes Team mehr als zwei Monate lang manuell arbeiten. Entscheidender ist die Effizienz: Im FrontierCode-Programmiertest von Cognition erzielte Fable 5 die höchste Punktzahl unter „mittlerer Rechenleistungsverbrauch“ und die Token-Effizienz ist deutlich besser als die des vorherigen Claude.

Dies erklärt auch, warum Anthropic immer wieder Wert auf Token-Effizienz legt – ein Modell, das lange Zeit autonom arbeiten und auf Schritt und Tritt Millionen von Token verbrauchen kann. Wenn es immer noch „Unsinn“ ist, werden die Kosten so hoch sein, dass sich niemand die Nutzung leisten kann.

Der Sehfortschritt ist intuitiver. Als Claude in der Vergangenheit Pokémon Feuerrot spielte, war er auf einen kompletten Satz Hilfswerkzeugketten angewiesen, um stolpernd voranzukommen; Fable 5 nutzte nur die einfachste visuelle Schnittstelle, um das Level alleine abzuschließen. Es kann auch den Quellcode einer Webanwendung mit nur wenigen Screenshots wiederherstellen.

Die hauseigenen Proteindesign-Experten von Anthropic nutzten Mythos 5, um einige Aspekte des Medikamentendesignprozesses um etwa das Zehnfache zu beschleunigen. Die zweite Aussage ist sogar noch übertriebener: In einer Genomikstudie arbeitete Mythos 5 mehr als eine Woche lang ununterbrochen in einem nahezu völlig autonomen Zustand und trainierte selbstständig ein maschinelles Lernmodell – die Leistung dieses Modells übertraf die eines ähnlichen, in Science veröffentlichten Modells, und sein Volumen betrug nur ein Prozent von letzterem.

Wenn ein Modell unabhängig eine Woche wissenschaftlicher Forschung abschließen kann und besser abschneidet als menschliche Ergebnisse, die in Top-Fachzeitschriften veröffentlicht werden, ist „ob es zur Entwicklung von Viren verwendet wird“ keine unbegründete Sorge mehr.Genau aus diesem Grund sperrt Anthropic das Gebiet der Biochemie separat ab – dieselbe Fähigkeit ist in den Händen von Forschern ein Gegenmittel, in anderen Händen kann es sich jedoch um etwas anderes handeln.


Macht und Gefahr sind hier zwei Seiten derselben Medaille. Die Leitplanken werden nicht hinzugefügt, weil das Modell nicht gut ist, sondern gerade weil es so gut ist.

Es ist ersichtlich, dass Anthropic Mythos als gefährliches Objekt beschreibt, das einer vollständigen Aufsicht bedarf. Doch auch außerhalb des offiziellen Narrativs gibt es unterschiedliche Stimmen.

Ein Benutzer von

Ihm zufolge ist Mythos wirklich stark, insbesondere bei Sicherheitsforschungsaufgaben. Es ist offensichtlich besser als die höchste Konfiguration von Opus und GPT-5.5, als wäre es speziell für diese Art von Arbeit abgestimmt worden. Aber „stark“ und „bedrohlich für die Menschheit“ sind zwei verschiedene Dinge. Er gab ein Detail: Dieses Modell, das offiziell als erstaunlich bezeichnet wurde, blieb vor dem auf Bazel (einem Code-Konstruktionstool) basierenden Prozess seines Unternehmens hängen und veränderte viele benutzerdefinierte Logiken. Am Ende musste er zuerst den Code kompilieren und dann das Modell laufen lassen.


Noch faszinierender ist die Leitplanke selbst. Seiner Beschreibung zufolge handelte es sich bei dem, was Anthropic mit dem Modell schickte, nicht um den bekannten Claude-Code, sondern um eine Reihe von Betriebsumgebungen, die speziell dafür entwickelt wurden, „das Entkommen des Modells zu verhindern“ – das sogenannte Project Glasswing, bei dem es sich seiner Meinung nach größtenteils um diese Sandbox handelt. Allerdings empfand er das Umfeld als recht rau und vermutete sogar, dass einige der Beschränkungen überhaupt keine Wirkung zeigten; Er sagte auch, dass er die offiziellen Grenzen umgangen und das Modell außerhalb der Sandbox ausgeführt habe.

Zu den Akten sagte er, dass Mythos eine große Anzahl bisher unentdeckter Sicherheitslücken in seinen Produkten gefunden habe, genug, um das Team dazu zu bewegen, seine Sicherheitsstrategien zu überdenken.

Seine Schlussfolgerung ist eine Überlegung wert: Dieses Modell hat in puncto Sicherheitsoffensive und -verteidigung zwar zwei Kategorien, aber in seinen Augen handelt es sich eher um ein extrem teures und extrem spezialisiertes Werkzeug und nicht um die Art von Existenz, die „über jedem Kopf hängt“, wie Anthropic andeutet.

Kommen wir zurück zu dem, was den Normalbürgern am meisten Sorgen bereitet: wie viel es kostet und wann es genutzt werden kann.

Preislich beträgt der API-Preis für Fable 5 und Mythos 5 10 US-Dollar pro Million Input-Tokens und 50 US-Dollar pro Million Outputs. Interessant ist der horizontale Vergleich: Im Vergleich zu den 25/125 US-Dollar von Mythos Preview ist er 60 % günstiger; aber es ist doppelt so teuer wie die 5/25 US-Dollar des Opus 4.8; Im Vergleich zu OpenAIs GPT-5.5 (5/30 US-Dollar) ist die Eingabe doppelt so teuer und die Ausgabe etwa 67 % teurer.


mit anderen Worten,Es ist der bisher leistungsstärkste Claude und eines der teuersten Claude-Modelle.Stark, aber nicht billig.

Auch der bereits erwähnte @zekramu kann als Indizienbeweis gelten: Seiner Einschätzung nach hat allein die Investition in der Pilotphase die Größenordnung von mehreren Millionen Dollar erreicht; „zu teuer“ ist ein Satz, den er immer wieder wiederholt.


Abonnenten müssen außerdem auf ein Zeitfenster achten. Von heute bis zum 22. Juni können Benutzer der Pro-, Max-, Team- und Enterprise-Edition Fable 5 kostenlos nutzen; Ab dem 23. Juni müssen Sie zusätzliche Nutzungsguthaben erwerben, um es weiterhin nutzen zu können.

Anthropic sagte, dass Fable 5 wieder zum Abonnement-Standard werden wird, wenn die Produktionskapazität aufholt, nannte aber keinen konkreten Zeitpunkt. API- und Pay-as-you-go-Unternehmenskunden sind von diesem Rhythmus nicht betroffen und rufen ab heute weiterhin wie gewohnt an.

Dieses etwas umständliche „Erst kostenlos, dann aufladen und später darüber reden“ verrät tatsächlich ein Signal: unzureichende Produktionskapazität. Nach eigenen Angaben geht Anthropic davon aus, dass die Nachfrage nach Fable 5 „sehr hoch und schwer vorhersehbar“ sein wird. Das stärkste Modell, das allen offen steht, muss zunächst die Rechenleistungsstufe bestehen.

Was in dieser Version wirklich leicht zu übersehen ist, was es aber am meisten wert ist, innegehalten und betrachtet zu werden, ist eine andere Richtlinie.

Ab Fable 5 muss der Datenverkehr für alle Mythos-Level-Modelle 30 Tage lang aufbewahrt werden, und zwar sowohl für Erst- als auch für Drittplattformen.

Anthropic verspricht, diese Daten nicht zum Trainieren von Modellen zu verwenden, sondern sie nur zur Sicherheitsüberwachung zu verwenden, etwa zur Identifizierung neuer Arten von Jailbreaks und komplexer Angriffe, die auf viele Anfragen verteilt sind und jede einzelne normal aussieht. Dazu haben sie auch einen neuen Datenschutz eingeführt: Jeder manuelle Besuch wird protokolliert und grundsätzlich nach 30 Tagen gelöscht.

Klingt vernünftig. AberFür diejenigen Unternehmenskunden, die sich ursprünglich wegen „Zero Data Retention“ für Anthropic entschieden haben, ist dies eine Änderung, die neu bewertet werden muss.

Die Kosten für die Nutzung des stärksten Modells sind nicht nur eine höhere Rechnung, sondern auch: Ihre Daten bleiben einen zusätzlichen Monat auf den Servern von Anthropic.

Sicherheit und Privatsphäre werden hier gleichgesetzt. Die Antwort von Anthropic lautet: Um beispiellose Angriffe zu verhindern, muss der Datenverkehr jedes Einzelnen 30 Tage lang überwacht werden. Dieses Konto ist nicht kosteneffektiv und ich fürchte, jedes Unternehmen muss seine eigenen Berechnungen anstellen.

Zusammenfassend lässt sich sagen, dass die eigentliche Neuheit von Fable 5 vielleicht nicht darin liegt, wie mächtig es ist, sondern darin, dass es in Anthropic einen neuen Weg eingeschlagen hat –Wie man eine Fähigkeit, die zu gefährlich ist, um offengelegt zu werden, in ein Produkt umwandelt, das jeder nutzen kann.

Die Methode lautet: Verwenden Sie einen Klassifikator, um die Funktionen zu durchschneiden, verwenden Sie eine Herabstufung anstelle einer Ablehnung und verwenden Sie dann eine 30-tägige Aufbewahrung als verdecktes Überwachungsnetzwerk.

Es ist nicht perfekt. Es wird zu unbeabsichtigtem Schaden führen, es wird teurer und einige Leute werden sich Sorgen um ihre Daten machen. Aber es beantwortet zumindest eine Frage, mit der alle hochmodernen Labore früher oder später konfrontiert werden: Wenn etwas in Ihrer Hand stark genug ist, um Menschen zu verletzen, schließen Sie es in einem Raum ein, den nur wenige Menschen betreten können, oder installieren Sie ein ausreichend starkes Schutzgeländer daran und geben es in die Hände aller?

Anthropic entschied sich für Letzteres.


Ob diese Leitplanke stark genug ist – diesmal sind es nicht mehr die über 100 Institutionen, die dafür den Stresstest machen, sondern alle.