Der weltweite Token-Verbrauch steigt weiter, das große DeepSeek-Modell steht an der Spitze der Anrufliste

Angetrieben durch Anwendungen wie AI Agent ist der weltweite Wortverbrauch weiter gestiegen. Den neuesten Daten von OpenRouter zufolge belief sich die Gesamtzahl der globalen KI-Großmodellaufrufe letzte Woche (18. bis 24. Mai) auf 28,9 Billionen Token, ein Anstieg von 7,4 % gegenüber der Vorwoche. Die Zahl der Aufrufe ist in fünf aufeinanderfolgenden Wochen gestiegen, und die Nachfrage nach großen Modellaufrufen nimmt weiterhin zu.

Bildquelle: OpenRouter

Unter den großen KI-Modellen auf der Liste erreichte das wöchentliche Nutzungsvolumen der großen KI-Modelle Chinas 9,22 Billionen Token, ein Anstieg von 19,89 % gegenüber dem Vormonat; Im gleichen Zeitraum betrug das wöchentliche Nutzungsvolumen großer amerikanischer KI-Modelle 4,93 Billionen Token, ein Anstieg von 16,27 % gegenüber dem Vormonat.Chinas wöchentliche Ausschreibungen für große Modelle haben die Vereinigten Staaten vier Wochen in Folge überholt und liegen weltweit an erster Stelle.

Bisher stand DeepSeek-V4-Flash an der Spitze der OpenRouter-Anrufliste für globale KI-Großmodelle.

OpenRouter ist eine KI-Modell-Aggregations- und Aufrufplattform, die ein transparentes Überwachungs- und Abrechnungssystem auf Token-Ebene bietet und darauf abzielt, die Probleme der Schnittstellenfragmentierung, der komplexen Schlüsselverwaltung und der Kostenkontrolle zu lösen, mit denen Entwickler beim Aufruf mehrerer KI-Modelle konfrontiert sind. Die Nutzer sind hauptsächlich ausländische Entwickler, wobei chinesische Entwickler nur etwa 6 % ausmachen.

Im Land ist der erhebliche Anstieg der Zahl der Token-Anrufe nichts Neues. Nach Angaben des National Bureau of Statistics im März 2026Allein in China belaufen sich die durchschnittlichen täglichen Token-Anrufe auf über 140 Billionen.; Der durchschnittliche tägliche Verbrauch von Sitzsäcken verdoppelte sich innerhalb von drei Monaten auf 120 Billionen.

CICC schätzt, dass in moderaten Nutzungsszenarien, wenn die Penetrationsrate des Agenten 8 % erreicht, der gesamte Token-Verbrauch des Agenten dem von Chatbot entspricht; Die Popularität des Agenten zeigt einen Multiplikatoreffekt auf den Token-Verbrauch. Durch die synergistische Verbesserung der Komplexität einzelner Aufgaben, der Nutzungsdauer und der Durchdringungsrate wird erwartet, dass der durchschnittliche tägliche Token-Verbrauch um mehr als das Fünffache steigt.

Da der Verbrauch von Wortelementen von Tag zu Tag zunimmt, wurden nacheinander Token-Fabriken und Token-Betreiber gegründet.

Den offiziellen Websites der einzelnen Unternehmen zufolge hat China Mobile am 21. April ein Token-Computing-Serviceprodukt für einzelne Benutzer auf den Markt gebracht, das gängige große Sprachmodelle wie DeepSeek und Qwen unterstützt. Ein Unterpaket kann für nur 5,99 Yuan erworben werden; China Telecom hat am 17. Mai offiziell eine Reihe kommerzieller Token-Testpakete mit einem Basisversionspreis von 39,9 Yuan/Monat für kleine, mittlere und Kleinstkunden eingeführt; China Unicom Shanghai Branch gab am 16. Mai bekannt, dass es Token-Dienste für OPC-Kunden in Shanghai anbieten wird.

Gleichzeitig hat China Telecom eine Ausschreibung für das zentralisierte Beschaffungsprojekt für „Token Factory“-Generierungskapazitätsdienste veröffentlicht. Tianfeng Securities wies darauf hin, dass sich KI-Rechenzentren zu „Token-Fabriken“ entwickeln, und betonte den Bedarf an groß angelegten Datenverarbeitungskapazitäten.

CITIC Securities erklärte:Das Aufkommen von Token-Fabriken und Token-Betreibern markiert den Wandel der Token-Generierungsfähigkeiten von einer Hilfsleistung zu einem standardisierten Dienst, der bepreist werden kann.wird dazu beitragen, dass der Markt für die Vermietung von Rechenleistung vom derzeitigen festen monatlichen Mietmodell, das auf der Mietzeit von „Bare-Metal“-Servern basiert, zu einem Modell übergeht, das auf der Grundlage der tatsächlichen Token-Nutzung abgerechnet wird.

Die Agentur betonte, dass, wenn Token zur Berechnungseinheit für Rechenleistung wird, Anbieter von Rechenleistungs-Leasingdiensten die Dividenden aus der anhaltenden Ausweitung der Token-Nachfrage und der schnellen Durchdringung aller KI-Anwendungsszenarien voll ausschöpfen können. Der derzeit hohe Wohlstand der Rechenleistungs-Leasingbranche ist hauptsächlich auf das Missverhältnis zwischen Angebot und Nachfrage auf dem inländischen Rechenleistungsmarkt zurückzuführen, wodurch die Vorteile führender Leasingunternehmen mit High-End-Rechenleistungs-Chipressourcen stärker hervorgehoben werden. Angesichts des Wohlstands der Branche und des aktuellen Trends, dass sich die Branche allmählich aufklärt und sich nach oben konzentriert, sind wir hinsichtlich der Wachstumselastizität der Top-Hersteller von Rechenleistungsvermietungen im Rahmen der neuen Wachstumsrunde des Token-Nutzungstrends optimistisch.