Am Abend des 29. Juni berichteten viele Entwickler, dass sie E-Mails erhalten hätten, in denen es hieß, DeepSeek werde die offizielle Version von V4 veröffentlichen und die Abrechnung anpassen. In der E-Mail wurde erwähnt, dass die offizielle Version von DeepSeek V4 Mitte Juli offiziell veröffentlicht werden soll, was weitere Funktionsoptimierungen und Leistungsverbesserungen mit sich bringen wird. Gleichzeitig wird DeepSeek gleichzeitig seine API-Preisstrategie anpassen und einen Peak-and-Valley-Preismechanismus einführen, „um Ressourcen vernünftiger zuzuteilen und die Servicestabilität zu verbessern“.

Ein Reporter von China Business News sah auf der offenen Plattform DeepSeek, dass der Beamte auch eine Mitteilung an die Benutzer auf der Homepage verschickte, in der es hieß, dass der API-Dienst voraussichtlich ab Mitte Juli eine Spitzen- und Talpreisstrategie einführen werde und „der Preis während der Spitzenzeiten doppelt so hoch sein wird wie der übliche Preis“.

Konkret sind die Spitzenzeiten täglich von 9:00 bis 12:00 Uhr und von 14:00 bis 18:00 Uhr Pekinger Zeit definiert, was nahezu die wichtigsten Arbeitszeiten inländischer Entwickler und Unternehmensanwender abdeckt.
Preislich beträgt der V4 Pro-Cache-Hit-Eingabepreis während der Spitzenzeiten 0,05 Yuan/Million Token, der Cache-Miss-Eingabepreis 6 Yuan/Million Token und der Ausgabepreis 12 Yuan/Million Token. Während der Spitzenzeiten von V4 Flash beträgt der Eingabepreis für Cache-Treffer 0,04 Yuan/Million Token, der Eingabepreis für Cache-Miss 2 Yuan/Million Token und der Ausgabepreis 4 Yuan/Million Token.
Zuvor, am 24. April, gab DeepSeek bekannt, dass die V4-Vorschauversion gleichzeitig offiziell veröffentlicht und als Open Source bereitgestellt wurde. Seitdem kam es zu mehreren Preisanpassungen. Am 22. Mai kündigte DeepSeek an, den ursprünglich zeitlich begrenzten Rabatt von 25 % des DeepSeek-V4-Modells in eine dauerhafte Preissenkung umzuwandeln. Der ermäßigte Preis für die Vorschauversion entspricht dem dieses Mal angekündigten Preis außerhalb der Spitzenzeiten.
Dies bedeutet, dass der Gesamtpreis der offiziellen Version von DeepSeek V4 nicht gestiegen ist. Wenn Benutzer jedoch die Modell-API während der Spitzenzeiten aufrufen, verdoppeln sich die Kosten direkt.
Nachdem die Nachricht veröffentlicht wurde, löste sie bei vielen Entwicklern heftige Diskussionen aus. Einige Entwickler glauben, dass diese Zeitaufteilung für inländische Benutzer nicht geeignet ist, aber für Benutzer in Zeitzonen wie Europa und den Vereinigten Staaten fallen die meisten Anrufzeiten in Talstunden, was in gewisser Weise eher einem „Vorteil für ausländische Benutzer“ gleichkommt.
Auch viele Entwickler äußerten Verständnis. Ein Entwickler, der die DeepSeek-API schon seit langem verwendet, sagte Reportern, dass die aktuellen Preise von DeepSeek in der Branche bereits auf einem niedrigen Niveau seien. Selbst wenn sich der Preis während der Hauptverkehrszeiten auf das Zweifache erhöht, sind die Gesamtkosten immer noch wettbewerbsfähig. „Der eigentliche Schlüssel ist nicht der Preis, sondern die Funktionserweiterung der offiziellen Version von V4.“
Weitere Benutzer freuen sich darauf, ob die offizielle Version von DeepSeek V4 ihre Leistung in den Bereichen Post-Training, Multimodalität, Programmierung, Agent usw. verbessern kann, während die Spitzen- und Talpreise gelten.
Aus Branchensicht können Spitzen- und Talpreise bedeuten, dass KI-Cloud-Dienste ausgereift sind. Einige Entwickler erwähnten, dass die Rechenleistung nicht mehr zu einem festen Preis vereinheitlicht wird und die Kosten für Token künftig näher am Strompreismodell liegen werden. Zukünftig werden wahrscheinlich auch andere große inländische Modelle der flexiblen Preisgestaltung folgen, und eine gestaffelte Abrechnung der Rechenleistung nach Zeit wird in der Branche zur Norm werden, was jedoch die Planungskosten für kleine und mittlere Entwickler erhöht.
Das bedeutet auch, dass sich die Nutzungsgewohnheiten der Entwickler in Zukunft verändern werden. Durch Spitzen- und Talpreise werden Entwickler gezwungen, Caching und Aufgabenplanung durchzuführen. Für die Ausführung außerhalb der Spitzenzeiten können möglicherweise weitere Batch-Aufgaben geplant werden. Aufgabenorchestrierungsfunktionen werden für Entwickler zu einer neuen Wettbewerbsfähigkeit bei der Kostenkontrolle.