Das Claude 1M-Kontextfenster ist vollständig geöffnet, die Preise sind vereinheitlicht und die Medienkontingente sind stark erhöht

Anthropic gab bekannt, dass das 1-Millionen-Token-Kontextfenster für seine Flaggschiffmodelle Claude Opus 4.6 und Sonnet 4.6 offiziell vollständig geöffnet ist und auf der Claude-Plattform zu Standardpreisen abgerechnet wird, ohne zusätzliche Prämie für lange Kontexte.Unter dem neuen Preissystem behält Opus 4.6 einen Input von 5 US-Dollar und einen Output von 25 US-Dollar pro Million Token bei, während Sonnet 4.6 einen Input von 3 US-Dollar und einen Output von 15 US-Dollar pro Million Token beibehält. Selbst wenn es sich um eine Anfrage über 900.000 Token handelt, ist die Einheits-Token-Gebühr genau die gleiche wie bei einer Anfrage über 9.000 Token.

In dieser umfassenden Eröffnung hat Anthropic seine Long-Context-Fähigkeiten und sein Benutzererlebnis systematisch verbessert. Zunächst gilt für alle Anfragen, die 1-Millionen-Fenster unterstützen, das gleiche Ratenlimit wie für normale Anfragen. Entwickler müssen in Szenarien mit hoher Parallelität oder langen Konversationen keine zusätzlichen Strategien zur Aufteilung des Datenverkehrs oder zur Herabstufung des Datenverkehrs implementieren. Zweitens hat der Beamte den Beta-Tag-Header gestrichen, der zuvor beim Zugriff auf Kontexte mit mehr als 200.000 Token erforderlich war. Jetzt können Anfragen mit mehr als 200.000 Token direkt aufgerufen werden. Bestehende Anwendungen, die noch Beta-Header senden, können einen reibungslosen Übergang durchführen, ohne ihren Code zu ändern.

Auch die Medienverarbeitungsfähigkeiten sind einer der Schwerpunkte dieses Upgrades. Die Anzahl der Bilder oder PDF-Seiten, die Claude in einer einzigen Anfrage erhalten kann, wurde von 100 auf 600 erhöht und deckt komplexe multimodale Szenarien wie Codeüberprüfung, juristische Dokumente, wissenschaftliche Forschungsarbeiten, Betriebs- und Wartungsprotokolle usw. ab und wurde gleichzeitig auf der Claude-Plattform, Microsoft Azure Foundry, Google Cloud Vertex AI und anderen Kanälen eingeführt. Anthropic sagte, diese Anpassung soll es Entwicklern ermöglichen, Hunderte von Seiten Material gleichzeitig zu kontextualisieren, ohne dass eine häufige Segmentierung und Komprimierung erforderlich ist, wodurch die technische Komplexität und der Informationsverlust verringert werden.

In Unternehmens- und Berufsszenarien ist der Einfluss des 1M-Kontexts besonders ausgeprägt. Beamte betonen, dass langer Kontext nur dann sinnvoll ist, wenn er sich „gut merken und nutzen lässt“. Daher wurden bei Opus 4.6 und Sonnet 4.6 spezielle Optimierungen für das Langstreckengedächtnis und die Denkfähigkeit vorgenommen. In Benchmarks von Drittanbietern erreichte Opus 4.6 eine Punktzahl von 78,3 % auf MRCR v2 und Sonnet 4.6 erreichte 68,4 % auf GraphWalks BFS (1 Mio. Token) und führte damit unter den Spitzenmodellen mit der gleichen Kontextlänge an.

Dies bedeutet, dass Entwickler ein komplettes Code-Repository, Zehntausende Seiten Vertragstext oder die Tool-Call-Traces, Beobachtungsdatensätze und Zwischenbegründungsprozesse von Agenten mit langer Laufzeit in eine einzige Sitzung laden können, ohne sich auf komplexe „Fensterverschiebungen“, „mehrere Zusammenfassungsrunden“ oder häufige Bereinigung des historischen Kontexts verlassen zu müssen. Mehrere Partner wiesen in Zitaten darauf hin, dass der 1M-Kontext es dem Agenten ermöglicht, stundenlang ohne Detailverlust zu laufen, was nicht nur den durch die Komprimierung verursachten Verlust wichtiger Informationen reduziert, sondern auch die Kosten für wiederholte Ergänzungen und Erklärungen in mehreren Debugging-Runden, Codeüberprüfungen und umfangreichen Betriebs- und Wartungsanalysen reduziert.

Im Bereich der Codeentwicklung wurde das 1M-Fenster von Opus 4.6 vollständig in die Claude Code-Produktlinie integriert und steht Max-, Team- und Enterprise-Benutzern standardmäßig ohne zusätzliche Konfiguration offen. Entwickler berichteten, dass der Agent nach der Erweiterung des Kontexts von 200.000 auf 500.000 oder sogar 1 Million Token in der Lage war, Aufgaben mit einem geringeren Gesamt-Tokenverbrauch zu erledigen, wenn es um große Codeänderungen und dateiübergreifende Abhängigkeiten ging, wodurch die durch die Aufteilung des Kontexts verursachten zusätzlichen Runden und wiederholten Anfragen reduziert wurden.

Auch Betriebs- und Sicherheitsteams gelten als direkte Nutznießer der Long-Context-Fähigkeiten. Angesichts riesiger Produktionssysteme und komplexer Alarmereignisse können Ingenieure alle Einheiten, Signale und Fehlerbehebungshypothesen in einer Sitzung speichern und so eine vollständige Informationsverbindung vom ersten Alarm bis zur Problembehebung aufrechterhalten. Partner sagen, dass sie mit 1M-Kontext nicht mehr häufig den Speicher „komprimieren“ müssen, wenn sie große Protokolle verarbeiten, Daten überwachen und den Systemstatus mehrerer Quellen überwachen, was das Risiko, subtile Anomalien zu übersehen, erheblich verringert.

Für Anwaltskanzleien, wissenschaftliche Forschungseinrichtungen und datenintensive Unternehmen stellen lange Kontextfenster ein neues Paradigma der Wissensverarbeitung dar. Juristen können mehrere Versionen von Hunderten von Vertragsseiten gleichzeitig einreichen, um Änderungen in mehreren Verhandlungsrunden vollständig zu überprüfen; Wissenschaftliche Forschungsteams können gleichzeitig Hunderte von Arbeiten, mathematischen Formeln und Simulationscodes in einen Argumentationsprozess integrieren, um eine umfassende Analyse über Dokumente und Modelle hinweg zu erstellen. Einige kooperierende Institutionen geben an, dass diese Fähigkeit zur „einzigen Integration“ das iterative Tempo der Grundlagen- und angewandten Forschung erheblich beschleunigt.

Was die Zugriffskanäle betrifft, wurde 1M-Kontext auf Claudes nativer Plattform aktiviert und über Cloud-Dienste wie Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry bereitgestellt und steht Unternehmen und Entwicklern gleichzeitig offen. Anthropic stellt entsprechende technische Dokumentation und Preisseiten zur Verfügung, um dem Team die Bewertung der Integrationskosten und Bereitstellungsstrategien zu erleichtern, und betont, dass alle aktuellen Anfragen zur Unterstützung des 1M-Fensters weiterhin die bestehenden Abrechnungsstandards verwenden werden.

Anthropic sagte, dass das Team, sobald der 1M-Kontext in die Phase der vollständigen Verfügbarkeit eintritt, weiterhin an der Stabilität des langfristigen Denkens, dem modalübergreifenden Verständnis und den Integrationsfähigkeiten auf Unternehmensebene arbeiten wird, in der Hoffnung, Benutzern dabei zu helfen, von „technischen Kompromissen rund um die Eingabelänge“ zum „Entwerfen von Agenten rund um das Geschäftsproblem selbst“ überzugehen. Entwickler und Unternehmensanwender können diese Funktion über die Claude-Plattform und große Cloud-Partner sofort aktivieren, um bestehende Anwendungen reibungslos auf die Long-Context-Ära zu aktualisieren.