Doubao testet das Wasser und zahlt. Wird DeepSeek weitermachen? Countdown zum vollständigen Aufladen von AI Assistant

Während des Maifeiertags, der gerade vergangen ist, entdeckten einige Benutzer, dass Doubao drei neue kostenpflichtige Mitgliedschaftsabonnementoptionen auf der App Store-Anwendungshomepage hinzugefügt hat: Die Standardversion kostet 80 Yuan pro Monat, die erweiterte Version kostet 200 Yuan pro Monat für ein kontinuierliches Monatsabonnement und die professionelle Version kostet 599 Yuan pro Monat, mit einer Jahresgebühr von 6.088 Yuan. Zum Vergleich: Die jährlichen Kosten für ChatGPT Pro, das ebenfalls im professionellen Lager angesiedelt ist, betragen etwa 2.400 US-Dollar (ca. 16.366 RMB).

Doubao antwortete später, dass der kostenlose Dienst weiterhin bereitgestellt werde und die kostenpflichtige Version hauptsächlich für komplexe Aufgaben und Produktivitätsszenarien gedacht sei und die Lösung sich noch in der Testphase befinde. Zum Zeitpunkt der Drucklegung ist nicht bekannt, wann der kostenpflichtige Eintritt offiziell eingeführt wird.

Die Reaktion der Branche auf diesen Schritt ist nicht einheitlich, aber alle Parteien haben eine grundlegende Tatsache bemerkt: Dies ist der bislang teuerste Versuch unter den inländischen C-End-Universal-KI-Assistentenprodukten.

Die Kosten für die Rechenleistung sind der intuitivste Anreiz. Laut zuvor von Volcano Engine veröffentlichten Daten überstiegen die durchschnittlichen täglichen Token-Aufrufe des Doubao-Modells im März 2026 120 Billionen, fast doppelt so viel wie vor drei Monaten und mehr als 1.000 Mal so viel wie im Mai 2024, als es veröffentlicht wurde. Berichten Dritter zufolge werden die Investitionsausgaben von ByteDance im Jahr 2025 etwa 160 Milliarden Yuan betragen, wovon ein großer Teil in die Beschaffung von KI-Rechenleistung und den Aufbau der Infrastruktur fließen wird. Diese Zahl wurde in Berichten mehrerer Maklerfirmen überprüft.

In einer in der Technologie-Community verbreiteten Kostenschätzung beträgt der Hardware-Wertverlust einer einzelnen Inferenz etwa 58 % und die Stromkosten etwa 29 %. 120 Billionen tägliche Token bedeuten riesige Hardware-Cluster und steigende Stromrechnungen. Diese Kostenstruktur macht groß angelegte kostenlose Dienste unhaltbar und es ist fast nur eine Frage der Zeit.

Doubao ist nicht der erste Spieler, der Anpassungen vornimmt. Im Februar 2026 erhöhte Zhipu den Preis seines GLM-Codierungsplans um mehr als 30 %; im März stieg der Preis für GLM-5-Turbo API erneut um 20 %; Im April erhöhte GLM-5.1 den Preis weiter um 10 %. Auch Cloud-Anbieter streichen nach und nach Rabatte. Tencent Cloud gab bekannt, dass ab dem 9. Mai 2026 die Preise für Produkte und Dienstleistungen im Zusammenhang mit KI-Rechenleistung um 5 % steigen werden.

DeepSeek hat die Anwendungsseite zum ersten Mal vor der offiziellen Einführung des V4-Modells geschichtet und den Schnellmodus und den Expertenmodus aktiviert. Damals glaubten einige Brancheninsider, dass DeepSeek sich mit diesem Schritt auf Anpassungen des späteren kostenpflichtigen Abonnementsystems vorbereitete. Nach der offiziellen Einführung von V4 wurden jedoch umfangreiche Rabatte eingeführt, zeitlich begrenzte Rabatte auf APIs eingeführt und die Abrechnungsregeln für Cache-Treffer angepasst.

Wenn der größte kostenlose Benutzerpool beginnt, einen Zahlungsschwellenwert festzulegen, handelt es sich nicht mehr um eine finanzielle Überlegung eines bestimmten Unternehmens, sondern um eine kollektive Änderung des Bereitstellungsmodells.

Bezahltes Modell, für Produktivität gedacht?

Das von Doubao eingeführte dreistufige Zahlungssystem beginnt dieses Mal nicht mit dem Gespräch selbst.

Den Informationen auf der Produktseite und den Personen in der Nähe des Unternehmens zufolge konzentrieren sich die Zahlungsmöglichkeiten auf Szenarien mit hohem Rechenverbrauch wie PPT-Erstellung, eingehende Datenanalyse sowie Film- und Fernsehproduktion. Funktionen wie Basisdialog und Textpolieren bleiben kostenlos.

Die Logik dieses Designs liegt in der Benutzerschichtung. Daten von QuestMobile zeigen, dass die monatlichen aktiven Nutzer von Doubao im ersten Quartal 2026 etwa 345 Millionen betragen werden. Bei einer so großen Benutzerskala verbraucht nur ein kleiner Teil der Deep-Benutzer viele Rechenressourcen, aber ihr Token-Verbrauch ist viel höher als der Durchschnitt. Die drei Preisstufen blenden diese Nutzer aus und stellen einen entsprechenden Zusammenhang zwischen hohem Konsum und Bezahlung her.

Gleichzeitig bleiben die kostenlosen Grundfunktionen erhalten, sodass die überwiegende Mehrheit der Light-User nicht betroffen ist. Dadurch bleiben der Umfang und die grundlegende Basis von Doubao als Anwendung auf nationaler Ebene erhalten.

Aus Sicht des Produktwettbewerbs hat diese Anpassung eine andere Absicht. Um die Kosten zu kontrollieren, wurden in der kostenlosen Version lange Zeit viele Kompromisse bei der Modellversion, der Kontextlänge und der Inferenztiefe eingegangen, was zu einigen Marktrückmeldungen führte, dass die Obergrenze der Fähigkeiten von Doubao begrenzt sei.

Zuvor sagte ein KI-Experte eines großen Herstellers gegenüber Phoenix.com, dass Doubao beim Testen professioneller Modelle viele Bedenken habe. „Die größte intuitive Schwierigkeit besteht bei großen Nutzerzahlen. Es ist sehr schwierig, die ultimative Leistung zu erzielen und eine große Nutzerbasis zu betreuen.“

Aber tatsächlich hat die Leistung des von ByteDance im Februar dieses Jahres veröffentlichten Seed 2.0 Pro-Modells in mehreren Benchmark-Tests die erste Stufe erreicht; Das Videogenerierungsmodell Seedance 2.0 hat auch Sora von OpenAI direkt verglichen. Einer der Zwecke der kostenpflichtigen Version besteht darin, eine Bereitstellungsmöglichkeit für diese technischen Funktionen bereitzustellen, die nicht durch Kosten eingeschränkt ist.

Ein anderer Brancheninsider sagte gegenüber Phoenix Technology: „Die aktuelle Priorität der Rechenleistung innerhalb von Byte liegt bei Seedance, und die innovativste Forschung muss Seedance weichen.“

Auf der Anwendungsseite wurde die schrittweise Mission der Doubao-App erreicht. Seit dem KI-Anwendungskrieg während des diesjährigen Frühlingsfestes ist die DAU der stärksten Konkurrenten von Doubao deutlich gesunken. Doubaos Aufstieg geht jedoch ungebrochen weiter. Der neueste „2025 AI Application Layer Development Core Report“ von QuestMobile zeigt, dass der Umfang der monatlich aktiven Nutzer (MAU) inländischer nativer KI-Apps ab Dezember 2025 eine offensichtliche schrittweise Differenzierung aufweist. Unter ihnen belegten Doubao und DeepSeek mit einer monatlichen Aktivität von 226 Millionen bzw. 135 Millionen den ersten und zweiten Platz, bildeten ein „Duopol“-Muster und waren diskontinuierlich führend in der gesamten Branche.

Nach März vergrößerte sich Doubaos DAU-Vorsprung weiter und bildete einen Vorsprung. Ein anderer Brancheninsider gab an, dass Daten von Drittplattformen zeigen, dass die maximale DAU von Doubao bei etwa 150 Millionen lag.

Aber gleichzeitig wies der QuestMobile-Bericht darauf hin, dass die Zahl der neuen Nutzer von KI-Anwendungen im ersten Quartal einen zweiseitigen Erweiterungstrend von „Sinken + Silberhaar“ aufwies. Die durchschnittliche monatliche Nutzung von Doubao beträgt 54,8 Mal und die Benutzeraktivitätsrate beträgt 33,5 %. Beide Indikatoren sind deutlich höher als Qianwen und DeepSeek.

Die oben genannten Brancheninsider sagten, dass die Doubao App grundsätzlich viele silberhaarige und junge Leute auf dem Markt hat. Dies ist weit entfernt von der aktuellen Produktivitätsszene, die Doubao ausrauben möchte. Das Bezahlmodell soll dabei helfen, der Produktivitätsmasse den Garaus zu machen.

Die Rechenleistung explodiert zuerst?

In gewisser Weise bedeutet Doubaos Zahlungsversuch, dass der größte kostenlose Spieler auf dem chinesischen Markt die Initiative ergriffen hat, die Kosten für Token zu berechnen. Der Hintergrund wird wieder auf die Betrachtung der Token-Ökonomie zurückgeführt.

Um eine beliebte Metapher zu verwenden: Das kostenlose Modell der KI-Anwendungen in den letzten zwei Jahren entspricht einer Wasserpflanze. Es erhebt nicht nur keine Wassergebühren, sondern verspricht auch eine unbegrenzte Wasserversorgung, wobei die Kosten vollständig vom Unternehmen selbst getragen werden. Je mehr Token verbraucht werden, desto schneller wird das Geld des Unternehmens verbrannt.

Aber das Wesentliche der „Token-Ökonomie“ ist die Neubewertung des oben erwähnten nicht nachhaltigen Modells der „kostenlosen Wasserversorgung“ durch die KI-Industrie.

Auf der diesjährigen GTC-Konferenz erklärte Huang Renxun die Token-Ökonomie: Token ist eine neue Ware. Wenn sie mehr Kapazität erhalten, können sie mehr Token generieren und ihr Einkommen wird steigen.

Volcan Engine-Präsident Tan Dai machte ebenfalls eine ähnliche Aussage. Der Preisunterschied von Token spiegelt im Wesentlichen den Unterschied in den Fähigkeiten wider. Das Modell der nächsten Generation verfügt über stärkere Fähigkeiten und die Kosten für einen einzelnen Token können steigen, aber der marginale wirtschaftliche Wert wird auch höher sein.

Man kann sagen, dass Doubaos Ladeversuch eine Bestätigung dieser „Token-Ökonomie“ im größten Benutzerpool in China ist.

Der Kapitalmarkt hat begeistert reagiert. Am 6. Mai, dem ersten Handelstag nach dem Feiertag, legte der Sektor der Computerchips insgesamt zu. Das Volumen von Haiguang Information (688041) stieg nach der Eröffnung sprunghaft an und erreichte das Tageslimit, wobei der Gesamtmarktwert einmal 820 Milliarden Yuan überstieg. Cambrian (688256) stieg um mehr als 9 %. In Richtung Speicherchips haben viele Aktien wie Netac Technology, Longsys, Montage Technology und Demingli ihr Tageslimit erreicht oder sind um mehr als 10 % gestiegen. Der Science and Technology Innovation 50 Index stieg an diesem Tag stark an.

In dieser Wachstumsrunde lautet eine immer wieder erwähnte Logik: Wenn die wichtigsten kostenlosen Player der Branche beginnen, Paywalls einzurichten, bedeutet dies, dass die Knappheit von KI-Computing durch den Preismechanismus bestätigt wird. Danach werden die Erwartungen an die Geschäftsrendite von Hardware, Cloud-Diensten und Modellebenen entsprechend neu bewertet.

AMD-CEO Su Zifeng erklärte in der jüngsten Telefonkonferenz zum Finanzbericht auch intuitiv, dass der CPU-Markt für Rechenzentren mit einer jährlichen Wachstumsrate von mehr als 35 % wachsen wird und die Größenordnung bis 2030 120 Milliarden US-Dollar überschreiten wird und es in Zukunft zu „äußerst schwerwiegenden Kapazitätsengpässen“ kommen könnte. Der Aktienkurs von AMD stieg im nachbörslichen Handel nach der Veröffentlichung des Gewinnberichts um mehr als 16 %.

Doubao ist keine Ausnahme mehr. Der gesamte KI-Bereich tritt in die Phase der Neupreisgestaltung ein.

Die zeitliche Überlagerung der oben genannten Ereignisse bildet eine Preisübertragungskette vom Software-Ende zum Hardware-Ende. Kaiyuan Securities gab in einem Forschungsbericht an, dass die Zahl inländischer Token-Aufrufe weiterhin neue Höchststände erreicht, was darauf hindeutet, dass sich die industrielle Umsetzung inländischer großer KI-Modelle in einem umfassenden Fortschrittsstadium befindet. Soochow Securities wies ferner darauf hin, dass es in der Rechenleistungsleasingbranche im ersten Quartal 2026 „quantitative Veränderungen“ bei steigenden Bestellungen und Preiserhöhungen sowie „qualitative Veränderungen“ bei der Modernisierung des Token-Sharing-Geschäftsmodells gegeben habe, und kam daher zu dem Schluss, dass „2026 das erste Jahr ist, in dem inländische KI-Rechenleistung vollständig ausgeschöpft wird.“

Volcano Engine-Daten zeigen auch, dass die Zahl der Firmenkunden mit einer kumulierten Token-Nutzung von mehr als einer Billion von etwa 100 Ende 2025 auf 140 gestiegen ist.

Von der Preisanpassung einer Anwendung auf nationaler Ebene bis zum kollektiven Aufstieg des Chipsektors ereigneten sich diese Ereignisse unabhängig voneinander, bildeten jedoch innerhalb desselben Zeitfensters eine vollständige Erzählung. Das freie Zeitalter der KI-Industrie erlebt einen systematischen Rückgang. Unter Wasser verändert sich das Verhältnis zwischen Angebot und Nachfrage an Rechenleistung grundlegend.