Kürzlich gab DeepSeek bekannt, dass es die API-Preise Mitte Juli anpassen und den Anrufpreis wochentags von 9:00 bis 12:00 Uhr und von 14:00 bis 18:00 Uhr verdoppeln wird. Der Ausgabepreis des V4-Pro-Modells ist von 6 Yuan auf 12 Yuan pro Million Token gestiegen. Gleichzeitig traten am 1. Juli in der Provinz Zhejiang offiziell die neuen nutzungszeitabhängigen Strompreise für Industrie und Gewerbe in Kraft, mit 16:00 bis 23:00 Uhr als Spitzenzeit und einer zusätzlichen „Spitzenzeit“ von 18:00 bis 22:00 Uhr im Sommer und Winter, wobei sich das Spitzen-Tal-Preisverhältnis auf 2,05 bis 0,2 erhöhte.

Ein KI-Unternehmen verdoppelte den Anrufpreis im Laufe des Tages, und ein provinzielles Stromnetz wurde nach 16:00 Uhr ausgewiesen. als „teure Stromperiode“. Die beiden Branchen nutzten die gleiche Logik, um die Preise im selben Monat anzupassen – beide verließen sich auf den Preis, um Spitzennachfrage abzuwehren. DeepSeek verwaltet die zeitliche Verteilung der Rechenleistung und Zhejiang verwaltet die zeitliche Verteilung der Elektrizität.
Die zeitliche Verteilung der Rechenleistung ist im Wesentlichen die zeitliche Verteilung der Elektrizität.
Die „Stromrechnung“ von AI wird langsam teuer
Werfen wir zunächst einen Blick auf die globalen Rechnungen.
Laut Daten von Gartner wird der weltweite Stromverbrauch von Rechenzentren im Jahr 2026 565 TWh erreichen, was einem Nettoanstieg von 118 TWh gegenüber 447 TWh im Jahr 2025 entspricht. Der jährliche Anstieg von 118 TWh entspricht fast dem jährlichen Stromverbrauch der Niederlande. Unter anderem stieg der Stromverbrauch KI-optimierter Server von 95 TWh auf 175 TWh, was einem Anstieg von 84 % entspricht. Bis 2027 wird der Stromverbrauch von KI-Servern offiziell den von herkömmlichen Servern übersteigen.
Das Urteil von Gartner-Forschungsdirektor Linglan Wang lautet: „Die heutige KI-Rechenleistung wird durch die Stromversorgung begrenzt.“
Microsoft-Chef Nadella sagte im Podcast: „Das größte Problem, mit dem wir derzeit konfrontiert sind, ist nicht mehr ein Überschuss an Rechenressourcen, sondern die Frage, ob dort, wo es Datenanlagen gibt, schnell Strom installiert werden kann. Wenn uns das nicht gelingt, liegen vielleicht ein paar Chips im Lager, die aber nicht angeschlossen sind.“
Der Stromverbrauch eines GPU-Servers ist drei- bis fünfmal so hoch wie der eines herkömmlichen Servers, und der Stromverbrauch einer einzelnen GPU mit NVIDIA-Blackwell-Architektur beträgt 1 kW, was 40 % mehr ist als die 700 W des Hopper der vorherigen Generation. Das von OpenAI in Texas gebaute „Stargate“-Rechenzentrum hat einen maximalen Strombedarf von 1,4 GW und setzt mehr als 400.000 GPUs ein. Was ist das Konzept von 1,4 GW? Genug für eine kleine Stadt.
Das Ergebnis ist, dass KI-Unternehmen am Ende Milliarden für den Kauf von Chips ausgeben, nur um dann festzustellen, dass die Leistung möglicherweise nicht ausreicht.
Die Spitzen- und Talpreise von DeepSeek sind im Wesentlichen die gleichen Vorgänge in der Energiebranche: Sie sind tagsüber teurer und nachts günstiger, wobei die Preise genutzt werden, um die Nachfrage in schwache Zeiten zu lenken. Tatsächlich hat DeepSeek die Regeln des Stromnetzes auf den Markt für Rechenleistung verlagert.
Der Ausgabepreis des V4-Pro-Modells beträgt in Spitzenzeiten 6 Yuan pro Million Token und in Spitzenzeiten 12 Yuan pro Million Token. Der Eingabepreis für Cache-Treffer stieg von 0,025 Yuan auf 0,05 Yuan. Im Mai dieses Jahres senkte DeepSeek seinen Preis dauerhaft um 75 %, was einen Preiskampf um große Modelle auslöste. Vor einem Monat haben wir noch den „Mindestpreis“ berechnet, jetzt berechnen wir den „Peak Surcharge“.
Warum dreht es sich so schnell? Der Engpass auf der Angebotsseite der Rechenleistung ist größer als erwartet. Öffentliche Überwachungsdaten der Branche zeigen, dass die Nachfrage nach Rechenleistung im vergangenen Jahr um ein Vielfaches gestiegen ist, während die Expansionsrate des Angebots bei weitem nicht mithalten konnte und die Lücke zwischen Angebot und Nachfrage etwa die Hälfte beträgt. Tencent Cloud stieg im April um 5 %, Alibaba Cloud stieg im März um 5 % auf 34 %, Baidu Smart Cloud stieg um 5 % auf 30 %, AWS stieg um 15 % und einige Google Cloud-Dienste stiegen im Mai um bis zu 100 %. Preiserhöhungen sind keine Wettbewerbsstrategie, sondern weil die Angebotsseite das wirklich nicht ertragen kann.
Die Spitzen- und Talpreise von DeepSeek zeigen, dass es bei seinem GPU-Cluster ebenso wie beim Stromnetz zu Spitzenüberlastungen kam.
Zhejiang hat den Zeitraum nach 16 Uhr festgelegt. als „teure Stromperiode“.Wozu dient es?
Die neue Version der Strompreise für Industrie und Gewerbe in der Provinz Zhejiang, die am 1. Juli in Kraft trat, senkt den Strompreis den ganzen Tag über in fünf Stufen: Spitzenwert, Spitzenwert, Flachabschnitt, Tiefpunkt und tiefes Tal. Das Verhältnis beträgt 2,05 zu 1,85 zu 1 zu 0,4 zu 0,2. Die Gipfel sind zehnmal teurer als die tiefen Täler. Die ursprünglichen Hauptverkehrszeiten am Morgen wurden gestrichen und die meisten Stunden tagsüber wurden auf Pauschaltarife umgestellt. Alle Hauptverkehrszeiten sind von 16:00 bis 23:00 Uhr, eine zusätzliche Hauptverkehrszeit ist im Sommer und Winter von 18:00 bis 22:00 Uhr.
In den letzten Jahren wurde die installierte Photovoltaikkapazität in Zhejiang erweitert. Die Photovoltaik-Stromerzeugung ist zur Mittagszeit groß und der Strom ist günstig oder sogar im Überschuss vorhanden. Doch am Abend sinkt die Photovoltaik-Leistung auf Null. Der Nachhauseweg von der Arbeit, das Einschalten der Klimaanlage, das Kochen und das Aufladen sind dicht gedrängt und die Belastung des Stromnetzes steigt stark an. Dies nennt die Energiewirtschaft die „Entenkurve“ – tagsüber ist zu viel Strom vorhanden und nachts zu teuer.
Die Anpassung von Zhejiang besteht darin, Fabriken und Rechenzentren zu ermöglichen, die Arbeit auf die Mittagszeit zu verlegen. In dem Dokument heißt es, dass ein Stahlunternehmen mit einem jährlichen Stromverbrauch von 1 Milliarde Kilowattstunden 10 % seines Spitzenstromverbrauchs auf Tiefstzeiten verlagert, es jedes Jahr mehr als 20 Millionen Yuan an Stromrechnungen einsparen kann, was ausreicht, um ein Energiespeichersystem aufzubauen.
In dem Dokument wurde auch deutlich erwähnt, dass Branchen wie Lagerlogistik und Rechenzentren mit „stabilen Lasten und großem anpassbarem Raum“ die Vorteile niedriger Strompreise voll ausnutzen können. Indem Sie Rechenaufgaben auf die Mittagszeit oder spät in die Nacht verlegen, können Sie viel Strom sparen.
DeepSeek verwaltet die zeitliche Verteilung der Rechenleistung und Zhejiang verwaltet die zeitliche Verteilung der Elektrizität. Die zeitliche Verteilung der Rechenleistung ist im Wesentlichen die zeitliche Verteilung der Elektrizität – hinter jedem Token steckt Elektrizität.
Laut Daten von Gartner ist der Stromverbrauch KI-optimierter Server innerhalb eines Jahres um 84 % gestiegen. Je höher der Rechenleistungsbedarf, desto höher der Stromverbrauch. Je knapper die Stromversorgung, desto stromähnlicher wird die Kostenstruktur der Rechenleistung.
Der Regierungsarbeitsbericht 2026 umfasst erstmals „Computing und Computing-Zusammenarbeit“ und enthüllt den obersten Designplan des Landes für die Rechenleistung. Das Rechenzentrum und das Stromnetz sollten gemeinsam geplant werden. Die Rechenleistung folgt der Leistung und die Leistungsverteilung hängt von der Rechenleistung ab. Dies ist keine Vision, sondern wird durch die Realität verdrängt. Gartner prognostiziert, dass der Stromverbrauch von Rechenzentren bis 2030 1.200 TWh übersteigen wird und das Stromnetz den Bedarf nicht decken kann. Wenn Rechenleistung und Strom nicht auf der Planungsebene verknüpft werden, wird es später problematischer.
Nach dem kostenlosen MittagessenBeginnen wir mit der Berechnung der Details
Obwohl DeepSeek den Preis der API angepasst hat, entspricht der Preis in Spitzenzeiten tatsächlich genau dem Preis nach der dauerhaften Preissenkung im Mai. DeepSeek hat den Preis nicht erhöht, sondern nur einen Aufpreis für Anrufe tagsüber erhoben.
Aber für die meisten Entwickler ist der Tag Arbeitszeit. 9 bis 12 Uhr und 14 bis 18 Uhr sind die beste Zeit, um Code zu schreiben, Schnittstellen anzupassen und Tests durchzuführen. Eine Verdoppelung des Preises in diesem Zeitraum bedeutet für die meisten Menschen eine Erhöhung der täglichen Kosten.
Foresight Energy ist sich bewusst, dass unter diesen Bedingungen die Kosten für interaktive Echtzeitanwendungen in die Höhe schnellen können und Offline-Rechneraufgaben nur auf die Nacht verlagert werden können. In der Vergangenheit nutzten Hunderttausende kleiner Teams nahezu kostenlose APIs zur Prototypenverifizierung, und die Kosten lagen nahezu bei Null. Wenn das Geschäftsmodell nach Spitzen- und Talpreisen auf Echtzeitanrufen wie Kundendienst, Suche und Codevervollständigung basiert, muss die Kostenstruktur neu berechnet werden.
Der Bericht von OpenRouter zeigt, dass die Lücke zwischen Open-Source- und Closed-Source-Modellen in den letzten 18 Monaten stabil zwischen drei und sechs Monaten geblieben ist. Die Kosteneffizienz des Open-Source-Modells verschlingt den Markt für Closed-Source-APIs. Wenn DeepSeek sich weiterhin auf Preiskämpfe einlässt, wird es ihm nicht gelingen, ein Geschäft mit geschlossenem Kreislauf zu erreichen. Bei der Preiserhöhung handelt es sich nicht um „kein Geld mehr“, sondern um die Abrechnung nach „kein Geld mehr“.
Die Strompreisanpassung in Zhejiang und die Spitzen- und Talpreise von DeepSeek erfolgten in derselben Woche. Einer ist für die Elektrizität zuständig, der andere für die Rechenleistung. Rechenleistung wird zu einer neuen Art der Stromnutzung – nicht Klimaanlagen, Fabriken oder Elektrofahrzeuge. Es ist der GPU-Cluster, der spät in der Nacht brüllt, Token, die zwischen Servern fließen, und eine Kilowattstunde Strom, die hinter jedem Codestück verbrennt.
Gartner sagt, dass die KI-Rechenleistung durch die Stromversorgung begrenzt wird. Nadella sagte, der Chip könnte sich möglicherweise nicht einstecken lassen. DeepSeek sagte, dass Anrufe tagsüber zusätzliche Kosten verursachen würden. Zhejiang sagte, dass man für den nächtlichen Stromverbrauch extra bezahlen müsse. Zusammengenommen weisen diese Stimmen in die gleiche Richtung: Bei der Rechenleistung geht es nicht mehr darum, „man kann so viel haben, wie man will“. Es gibt Kosten, es gibt Engpässe, es gibt Höhen und Tiefen, es erfordert Terminplanung, es erfordert Planung.
Das „kostenlose Mittagessen“ der KI-Branche wird zu einer Stromrechnung, die sorgfältig kalkuliert werden muss.