Am 1. Juli, Pekinger Zeit, brachte der amerikanische Hauptmodellhersteller Anthropic eine neue Generation des Mittelklasse-Hauptmodells Claude Sonnet 5 auf den Markt. Gleichzeitig bestätigte der Beamte, dass er vom US-Handelsministerium eine Mitteilung erhalten habe, die Beschränkungen für die Top-Flaggschiffmodelle des Unternehmens, Claude Fable 5 und Mythos 5, offiziell aufzuheben und ab morgen den weltweiten Zugang vollständig wiederherzustellen.
Anthropic antwortete jedoch nicht direkt auf die von Internetnutzern gestellte Frage, ob das neue Modell allen oder nur authentifizierten Benutzern/Bürgern offen steht. Zuvor gaben Beamte bekannt, dass Anthropic eng mit der US-Regierung zusammengearbeitet und Mythos5 am 27. Juni bei einigen US-amerikanischen Operationen und verteidigungskritischen Infrastrukturorganisationen eingesetzt hat.
Die Einführung von Sonnet 5 markiert die Fertigstellung des Modellsystems der fünften Generation von Anthropic. In der Produktserie liegt Sonnet 5 zwischen dem leichten Haiku 5 und dem High-End-Flaggschiff Opus 4.8 (und Fable 5). Testdaten zeigen, dass Sonnet 5 in Bezug auf die Kernfunktionen der Agentenprogrammierung eine Punktzahl von 63,2 % erzielte, 5,1 Prozentpunkte mehr als Sonnet 4.6 der vorherigen Generation (58,1 %), und der Abstand zum Top-Flaggschiff Opus 4.8 (69,2 %) verringerte sich auf weniger als 6 %.

Im offiziellen Technologiepositionierungslayout konzentriert sich das Sonnet 5-Longboard auf komplexe Codegenerierung, eingehende Analyse langer Dokumente, mehrstufige Automatisierung und die starke Implementierung von „Computersteuerung“ (einschließlich unabhängiger Übernahme von Browsern, Terminals und GUIs). Das neue Modell bietet die Möglichkeit, unabhängig langfristige Pläne zu formulieren und Anrufe über mehrere Tools hinweg zu koordinieren. Es kann lange Zeit ohne manuelle Eingriffe unabhängig ausgeführt werden und erfüllt so die Anforderungen der aktuellen Entwicklergemeinschaft an die Ausführung langfristiger Aufgaben.
Agenten- und Landeanwendungsfunktionen stehen auch im Mittelpunkt der Kernkonkurrenz von Anthropic mit OpenAI. Um vor dem Börsengang mit den kommerziellen Daten- und Umsatzgrenzen von OpenAI zu konkurrieren, hat Anthropic in Sonnet 5 einen neuen Wortsegmentierer (Tokenizer) eingeführt, der die zugrunde liegende Genauigkeit verbessert und gleichzeitig dazu führt, dass dieselbe Texteingabe 1,0 bis 1,35 Mal mehr Token verbraucht als zuvor.
Um sich gegen den durch den Umbau des Tokenizers verursachten Anstieg der Gesamtbenutzerkosten (TCO) abzusichern, hat Anthropic eine stufenweise Preisaktion gestartet: Während des Aktionszeitraums vor dem 31. August wird der Grundpreis pro Million Token der API auf 2 US-Dollar für die Eingabe und 10 US-Dollar für die Ausgabe gesenkt; Ab dem 1. September wird es jedoch wieder zur Standardabrechnung kommen (3 US-Dollar für die Eingabe und 15 US-Dollar für die Ausgabe). Die Entwicklergruppe geht davon aus, dass aufgrund der Ausweitung der tatsächlichen Token-Verbrauchsbasis nach dem Aktionszeitraum die tatsächliche Anrufrechnung zwangsläufig höher sein wird als die historische Version.
Hinter dieser Geschäftsentscheidung steht der finanzielle Druck, dem Anthropic vor dem Börsengang ausgesetzt war. Wenn die Wall Street hochmoderne KI-Labore bewertet, achtet sie nicht mehr nur auf die Anzahl der Benutzer (MAU), sondern konzentriert sich auch auf die Prüfung des ARPU (durchschnittlicher Umsatz pro Benutzer) und der Bruttogewinnspanne. Verglichen mit dem Top-Flaggschiff Opus, das teuer ist und ein begrenztes Anrufvolumen hat, erzielt das Low-End-Modell Haiku dürftige Gewinne. Das Sonnet-System der Mittelklasse kann die komplexesten Dienste verarbeiten und erhöht so die Kerngeschäftsflussrate des Unternehmens.
Es ist erwähnenswert, dass sich in der Zeit, als Fable 5 und Mythos 5 zuvor eingeschränkt waren, die Zeitspanne auf dem globalen KI-Markt in Richtung chinesischer Hersteller beschleunigte. In dieser Zeit löste der von Zhipu, einem großen chinesischen Modellunternehmen, auf den Markt gebrachte GLM-5.2 aufgrund seiner kosteneffizienten Argumentation breite Diskussionen in ausländischen Open-Source- und Entwickler-Communities aus. Ausländische Entwickler zeigen einen Trend, sich auf diversifizierte Technologie-Stacks zu verlassen, und große chinesische Modelle haben in der globalen Welle der Agentenentwicklung eine größere Substitutionsflexibilität gezeigt.