Anthropic veröffentlicht offiziell Claude Fable 5 und Claude Mythos 5. Ersteres steht normalen Benutzern offen, während letzteres weiterhin „vertrauenswürdigen Sicherheitspartnern“ vorbehalten bleibt. Man kann sagen, dass die Namensgebung des neuen Modells dem konsequenten Stil von Claude entspricht.

Von Haiku (Haiku) über Sonnet (Sonett) bis hin zu Opus (künstlerisches Meisterwerk) hat Anthropic Modelle mit literarischen und künstlerischen Konzepten überlagert. Durch Mythos hat sich der Name von literarischen Werken auf die „Mythologie“ selbst ausgeweitet.

Die Fabel kommt vom lateinischen Wort fabula, was „etwas Erzähltes“ bedeutet und hat denselben Ursprung wie der griechische Mythos. Wörtlich übersetzt wird es im Allgemeinen als „Fabel“ bezeichnet. Der Name ist ebenso wie die Positionierung des neuen Modells ein „Mythos-Level“-Modell, ein „offener Mythos“.

Laut der Beschreibung von Anthropic haben Fable 5 und Mythos 5 das gleiche zugrunde liegende Modell, sind jedoch in einer sicheren Hülle verpackt, die sich besser für die öffentliche Verbreitung eignet. In Bezug auf die offiziellen Modellfähigkeiten liegen die beiden auf derselben Position.


Aber Partituren sind Partituren, und wenn Fable und Mythos genau die gleiche Leistung erbringen würden, wäre es meiner Meinung nach nicht nötig, sie in zwei Namen aufzuteilen.

Der umgeschriebene „Mythos“

Mythen wurden umgeschrieben, komprimiert und ermahnt und zu Fabeln.

Laut offizieller Dokumentation handelt es sich bei Fable 5 um eine öffentliche Version. Es steht normalen Benutzern und Entwicklern offen, aber in Bereichen mit hohem Risiko wie Netzwerksicherheit, Biologie, Chemie und Modelldestillation werden zusätzliche Sicherheitsklassifikatoren beteiligt sein. Sobald das System feststellt, dass die Anfrage möglicherweise diese sensiblen Richtungen betrifft, wird die Antwort nicht von Fable 5 fortgesetzt, sondern automatisch auf Claude Opus 4.8 zurückgegriffen.

Mythos 5 basiert auf demselben zugrunde liegenden Modell, hebt jedoch in einigen Bereichen die Leitplanken von Fable 5 auf. Anthropic sagte, dass Netzwerksicherheitspartner im Project Glasswing die „Vollversion“ von Mythos 5 nutzen können; In Zukunft könnten einige Biowissenschaftsforscher im Rahmen des Trusted Access Program auch Versionen verwenden, die biologische und chemische Beschränkungen aufheben.

Wir werden den ungenutzten Mythos vorerst nicht erwähnen, schauen wir uns zunächst einige praktische Dinge an.

Der erste ist die Preisgestaltung. Mit einem Wort: teuer.

Der Preis für Fable 5 beträgt 10 $/Million Token für die Eingabe und 50 $/Million Token für die Ausgabe. Entwickler können jetzt claude-fable-5 (Modellname) über die Claude-API aufrufen.

Dieser Preis ist genau doppelt so hoch wie der von Opus 4.8 und entspricht dem Schnellmodus von Opus 4.8. Anthropic hat es offensichtlich in eine höhere Preisklasse eingeordnet als Opus.

Anthropic sagte jedoch, dass dieser Preis weniger als die Hälfte des vorherigen Claude Mythos Preview beträgt. Da Mythos Preview jedoch kein öffentliches API-Modell ist, hat der Beamte keinen Standardpreis für die Öffentlichkeit angegeben, und dieser Satz kann nicht überprüft werden.

Abonnenten müssen außerdem beachten, dass Fable 5 möglicherweise für längere Zeit nicht direkt im Basis-Abonnementpaket enthalten ist.

Anthropic erwähnte in seiner offiziellen Beschreibung, dass Fable 5 nach dem 23. Juni, selbst wenn Benutzer Claude abonniert haben, möglicherweise auf Volumenbasis basierend auf der Rechenleistung bereitgestellt wird und möglicherweise nicht direkt im Basisabonnementdienst enthalten ist.

Diese Firma wird immer geiziger, hat aber immerhin noch eine Probezeit von einem halben Monat. Der Beamte ließ auch einen gewissen Spielraum: Wenn die Rechenleistungsressourcen nach dem 23. Juni ausreichen, wird Anthropic versuchen, Fable 5 weiterhin in Pro, Max und andere Abonnementdienste aufzunehmen.


Der hohe Preis ist an sich nicht schwer zu verstehen, aber es ist am besten, sicherzustellen, dass seine Fähigkeiten seinen Preis wert sind.

Den laufenden Ergebnissen nach zu urteilen, ist Fable 5/Mythos 5 derzeit im Grunde das stärkste von Anthropic.

Allerdings gibt es in der offiziellen Tabelle einen Hinweis, dass die Werte von Claude Fable 5 und Claude Mythos 5 im Allgemeinen nur 1–3 Prozentpunkte auseinander liegen (außer bei Netzwerksicherheits- und biobezogenen Tests mit Sternchen), sodass die Tabelle den höheren Wert der beiden zeigt. Es ist schwer, sich darüber nicht zu beschweren.


Anthropic konzentriert Fable 5 auf mehrere Richtungen: Softwareentwicklung, Wissensarbeit, Vision, langes Kontextgedächtnis und biowissenschaftliche Forschung.

Software-Engineering ist eines der prominentesten Szenarien. Der Tabelle zufolge erreichte Fable/Mythos 5 auf SWE-Bench Pro 80,3 %, was deutlich über den 69,2 % von Opus 4.8 liegt; Beim schwierigeren FrontierCode Diamond erreichte es 29,3 %, während Opus 4.8 nur 13,4 % und GPT-5.5 nur 5,7 % hatte.



Für Wissensarbeit und visuelle Aufgaben gibt Anthropic zwei Arten von Belegen an.

Ein Typ ist der standardisierte Benchmark. Die offizielle Tabelle zeigt, dass Fable/Mythos 5 beim GDPval-AA einen Wert von 1932 erzielte, höher als Opus 4.8, GPT-5.5 und Gemini 3.1 Pro; Bei der Dokumentaufgabe GDP.pdf mit visuellem Verständnis erreichte es 29,8 % und übertraf damit auch andere große Modelle.

Eine weitere Kategorie sind frühe Kundentests. Anthropic sagte, dass Fable 5 die höchste Punktzahl im Hebbia-Benchmark für fortgeschrittenes finanzielles Denken erreicht habe, wobei seine Vorteile sich auf das Denken in Dokumenten, das Verständnis von Diagrammen und Tabellen sowie die Problemlösung konzentrieren; IMC berichtete außerdem, dass es die Bewertung der Transaktionsanalyse fast vollständig bestanden habe.

Um die visuellen Fähigkeiten von Fable 5 zu demonstrieren, nannte Anthropic ein Beispiel: Bisher benötigte das Claude-Modell komplexe Hilfswerkzeuge, um „Pokémon: Fire Red“ zu spielen, aber Fable 5 kann das Level nur mit visuellem Input abschließen.


In Bezug auf langfristige Aufgaben und Speicherkapazitäten sagte Anthropic, dass Fable 5 sich mit Millionen von Token auf langfristige Aufgaben konzentrieren und seine eigenen Notizen verwenden kann, um die Ausgabe zu verbessern.

In Spielen wie „Slay the Spire“, die eine kontinuierliche Entscheidungsfindung und eine langfristige Strategie erfordern, wird die Leistung von Fable 5 erheblich verbessert, wenn Fable 5 mit einem dauerhaften Dateispeicher verbunden wird, damit frühere Entscheidungen und Erfahrungen aufgezeichnet werden können. Die Verbesserung ist dreimal so hoch wie bei Opus 4.8 und die Häufigkeit, mit der Sie das Endlevel erreichen können, ist ebenfalls dreimal erhöht.

Fable ist übrigens auch der Name eines klassischen RPG-Spiels, übersetzt ins Chinesische als „Fable“ – vielleicht können wir eines Tages Fable „Fable“ spielen sehen.

Darüber hinaus erreichte Fable/Mythos 5 in Bezug auf die Netzwerksicherheitsfunktionen 78,0 % im ExploitBench Cap% und übertraf damit die 69,0 % von Claude Mythos Preview und fast das Doppelte von Opus 4.8.

Hier sollte der Score von Mythos 5 herangezogen werden, da Fable 5 bei High-Risk-Anfragen auf Opus 4.8 zurückgreifen wird.

Starke Modelle müssen geschichtet sein

Dieses Mal stellte Anthropic die Fähigkeiten des Modells visuell auf einer verschiebbaren Seite ähnlich einem „Portfolio“ dar und gab zu jeder Demo nur einen kurzen Absatz mit Kommentaren ab.


Beispielsweise schrieb Fable 5 eine Sonnensystemsimulation, die die Umlaufbewegung des Planeten aus ersten Prinzipien der Physik ableitete und sie zur Vorhersage von Sonnenfinsternissen verwendete.


Als weiteres Beispiel kann „Factory“ unabhängig abgespielt werden. Dies ist ein Fabrikautomatisierungsspiel, das Ingenieure lieben. Die Spieler müssen Ressourcen sammeln, Produktionslinien planen und Logistik- und Energiesysteme aufbauen.

Anthropic nutzte dieses Beispiel, um zu veranschaulichen, dass Fable 5 in einer offenen Umgebung Strategien formulieren und den Aufbau eines komplexen Systems weiterhin vorantreiben kann.


In einer anderen Demo erstellte Fable 5 zunächst einen browserbasierten CAD-Editor und nutzte dann dieses selbst entwickelte CAD-Tool, um ein vollständiges Modell zu entwerfen, das in 3D gedruckt werden kann. Dieser Editor verfügt außerdem über einen integrierten KI-Copiloten zur Unterstützung der Modellierung.

Der Schwerpunkt dieser Demo liegt darauf, dass Fable 5 einen geschlossenen Kreislauf abschließt: Zuerst das Tool erstellen, dann das Tool verwenden und schließlich eine physische Designaufgabe abschließen.


Die letzte Demo, Anthropic, zeigte eine flüssige Simulation von Fable 5, deren Bewegungsrhythmus mit einem EDM-Remix klassischer Musik synchronisiert war. Der Beamte erwähnte auch ausdrücklich, dass die Musik auch von Fable 5 mithilfe von Code generiert wird.


Diese Beispiele sehen schick aus, aber die Idee ist dieselbe: Fable 5 ist großartig darin, Code, Vision, Physik, Design und langfristige Planung in Aufgaben zu integrieren.

Während dieser Teil zeigt, was Fable 5 in den Händen von Entwicklern leisten kann, geht es im folgenden Teil darum, was Mythos 5 in den Händen von Forschern leisten kann – und warum Anthropic Fable und Mythos trennen möchte.

Anthropic sagte, dass Mythos 5 laut Bewertungen durch interne Experten für Proteindesign einige Aspekte des Medikamentendesignprozesses um etwa das Zehnfache beschleunigt habe. In einem Fall wurde Mythos 5 ohne menschliche Hilfe in Proteindesign- und Bioinformatik-Tools eingebunden, um erfahrene menschliche Bediener zu erreichen oder sogar zu übertreffen.

Bei dieser Aufgabe beantwortet Mythos 5 nicht nur Fragen, sondern führt einen vollständigen Satz wissenschaftlicher Arbeitsabläufe durch: Auswahl von Bindungsstellen, Auswahl und Ausführung von Protein-Design-Tools sowie Wiederherstellung nach einem Fehler. Beamte sagten, dass von den 14 Proteinzielen in dieser Studie neun starke Kandidatenmoleküle produzierten und derzeit weiterer Forschung unterzogen würden.


Anthropic erwähnte auch, dass Mythos 5 kontinuierlich neue und attraktive molekularbiologische Hypothesen vorschlagen kann. In einem Blindtestvergleich mit Modellen auf Opus-Ebene bevorzugten interne Wissenschaftler in etwa 80 % der Fälle die von Mythos vorgeschlagenen Hypothesen, von denen einige experimentell evaluiert wurden.

Unterdessen wurde eine der Hypothesen von Mythos 5 über einen neuen Mechanismus für das E. coli-Protein in einer Studie eines anderen Labors bestätigt, das unabhängig dasselbe Problem untersuchte.

Es wurde sogar eine Genomstudie durchgeführt.

Anthropic sagte, Mythos 5 habe eine neue Genomikstudie in etwas mehr als einer Woche fast autonom abgeschlossen. Es organisierte Einzelzelldaten von Millionen von Zellen aus 138 Tierarten und entwarf und trainierte ein individuelles Modell für maschinelles Lernen, um Zellen zu identifizieren, die bei verschiedenen Arten die gleiche Rolle spielen.

Was noch übertriebener ist, ist, dass Anthropic behauptet, dass die Leistung des von Mythos 5 trainierten Modells die eines kürzlich in Science veröffentlichten Modells übertrifft, obwohl sein Maßstab nur ein Prozent davon beträgt. Anthropic sagte, es plane, diese Ergebnisse in den kommenden Monaten zu veröffentlichen.

Natürlich muss dieser Teil noch auf das Papier und die externe Begutachtung warten. Aber wenn man sich nur die offiziellen Informationen von Anthropic anschaut, kommen die Fähigkeiten von Mythos 5 in den Biowissenschaften denen eines wissenschaftlichen Forschungsagenten nahe: Er kann Fragen lesen, Werkzeuge verwenden, Daten verarbeiten, Modelle trainieren, Hypothesen vorschlagen und eine Forschung bis zu dem Punkt vorantreiben, an dem sie veröffentlicht werden kann.

Sobald ein Modell Aufgaben im Arzneimitteldesign, bei viralen Vektoren, beim Proteindesign und in der Genomforschung wirklich vorantreiben kann, wird es natürlich einen doppelten Nutzen haben.

Man kann davon ausgehen, dass der Life-Science-Teil keine gewöhnliche Funktionsdemonstration von Fable 5 ist, sondern eine Demonstration der Obergrenze der Fähigkeiten von Mythos 5.

Es wird jedoch gezeigt, dass das zugrunde liegende Modell in den Händen von Anthropic so mächtig ist, dass es über einen vertrauenswürdigen Zugriff verbreitet werden muss.

Interessanterweise ähnelte die Modellfreigabe in der Vergangenheit eher einem technischen Produkt: Parameter, Laufwerte, Preis, Kontextlänge, API-Name. Stark ist stark, Befreiung ist Befreiung.

Aber hier in Mythos beginnen die Dinge kompliziert zu werden. Das gleiche zugrunde liegende Modell ist in zwei Versionen unterteilt. Normale Benutzer erhalten Fable 5, während Sicherheitsforscher und einige Life-Science-Forscher Mythos 5 erhalten; Ersteres wird in strengeren Leitplanken installiert, und letzteres erfordert vertrauenswürdigen Zugriff.

Modellfähigkeiten werden nicht mehr nur nach hoch und niedrig unterschieden, sondern auch nach Autorität, Szenarien und Verantwortlichkeiten.

In gewisser Weise kann es als Signal dafür gewertet werden, dass die Kommerzialisierung hochmoderner Modelle in eine neue Phase eingetreten ist – je stärker das Modell, desto unwahrscheinlicher ist es, dass es direkt an alle weitergegeben wird. Sie werden in verschiedene Versionen aufgeteilt, mit unterschiedlichen Sicherheitsgrenzen versehen und dann an verschiedene Benutzertypen weitergegeben.

Anthropic tat dies zuerst, weil ihr Modell „zu stark war, um vollständig offengelegt zu werden“. In Zukunft könnten auch andere Unternehmen diesem Ansatz folgen, die Geschichten erzählen und beweisen wollen, dass ihre Modelle stark sind.