Am Nachmittag des 29. Mai entdeckten viele Internetnutzer, dass DeepSeek nur begrenzt oft regeneriert und geändert werden kann. Nach mehrmaligem Ändern oder Neugenerieren hintereinander wird auf der Seite angezeigt, dass die Obergrenze erreicht wurde. Einige Internetnutzer berichteten, dass bei normalen Gesprächen die Obergrenze nach drei- bis sechsmaliger Regeneration erreicht wird; Im Expertenmodus gibt es möglicherweise nur drei Möglichkeiten. Die Obergrenze der Änderungseingabezeiten beträgt im Allgemeinen das Sechsfache.

Derzeit hat DeepSeek weder eine offizielle Ankündigung gemacht noch eine feste Quotentabelle veröffentlicht, aber diese Angelegenheit hat in der Community heftige Diskussionen ausgelöst – schließlich hat DeepSeek eine große Anzahl treuer Benutzer, darunter auch mich. Gelegentlich kommt es zu ausgelasteten Servern und Seitenabstürzen, was für jeden verständlich ist, aber wir können nicht einfach stillschweigend Einschränkungen hinzufügen, was die Leute in Panik versetzt.
Die API ist überhaupt nicht betroffen, daher handelt es sich höchstwahrscheinlich um ein Infrastrukturproblem, ein bekanntes Rezept.

01
Temporäre Strombegrenzung bei Rechenleistungsmangel?
Zu dieser Einschränkung sagte der „halboffizielle Bericht“ Baiqiang über Xiaohongshu: Keine Panik, dies ist vorübergehend.

Demnach wurden „Nachricht ändern“ und „Neu generieren“ plötzlich eingeschränkt. Es war nicht so, dass DeepSeek die sogenannte „negative Optimierung“ durchführte, es war nur dasVorübergehende Maßnahmen, die ergriffen werden, wenn der Druck auf die Rechenleistung zu groß ist.
Da die Zahl der Nutzer von DeepSeek in diesem Zeitraum, insbesondere ab dem Nachmittag des 29. Mai, rasant gestiegen ist, war der Anfragedruck auf der App-Seite offensichtlich. Um Prioritäten zu setzen und sicherzustellen, dass die grundlegendsten Textkonversationen weiterhin normal genutzt werden können, kann das Team zunächst nur hochfrequente Vorgänge wie „Nachrichten ändern“ und „Neu generieren“ einschränken.
Obwohl auf der Benutzeroberfläche „Neu generieren“ nur ein Klick auf eine Schaltfläche ist und „Nachricht ändern“ lediglich eine Änderung der ursprünglichen Frage ist. Für den Server handelt es sich bei diesen beiden Dingen jedoch nicht um einfache Aktualisierungen, sondern um eine neue Inferenzanforderung. Jedes Mal, wenn der Benutzer auf „Neu generieren“ klickt, muss das Modell den Kontext erneut verarbeiten und die Antwort generieren. Das Gleiche gilt für das Ändern der Nachricht. Solange sich die ursprüngliche Frage ändert, muss das Modell sie basierend auf der neuen Eingabe erneut beantworten.
Wenn daher eine große Anzahl von Benutzern wiederholt gleichzeitig klickt und „Regenerieren“ als Schaltfläche zum unendlichen Kartenziehen behandelt, stellen diese Anforderungen eine starke Belastung für den Server dar.
Diese Angelegenheit kann zusammen mit einigen kürzlichen Änderungen in DeepSeek angezeigt werden. Der Grund für das Hochladen und Entfernen von Dateien im Expertenmodus, das Ausschalten der intelligenten Suchfunktion und die gelegentliche Meldung „Server ausgelastet“ ist beispielsweise tatsächlich der Mangel an Rechenressourcen.Der allgemeine Servicedruck ist so hoch geworden, dass Kompromisse eingegangen werden müssen.

DeepSeek ist so einfach zu bedienen, dass die zugrunde liegende Infrastruktur mithalten muss.
In Bezug auf die Situation, in der „Nachricht ändern“ oder „Neu generieren“ die Obergrenze erreicht, empfiehlt Baiqiang, nicht kontinuierlich und schnell zu klicken. Sie können zunächst anhalten und 15 bis 30 Minuten warten, bevor Sie es erneut versuchen. Dem Konto zufolge wird die Einschränkung in den meisten Fällen nach dem Warten automatisch wiederhergestellt; Wenn Sie wiederholt und schnell klicken, erkennt das System möglicherweise eine ungewöhnlich häufige Anfrage, wodurch sich die Sperrzeit verlängert.
Bai Qiang erwähnte auch, dass die neuen Ascend-Superknotenkarten von Huawei im Einsatz sind und voraussichtlich in der zweiten Jahreshälfte online gehen werden. Bis dahin wird die Rechenleistung deutlich ausgeweitet und diese vorübergehenden Beschränkungen werden aller Voraussicht nach aufgehoben.
Allerdings hat DeepSeek noch keine offizielle Ankündigung zu diesem Thema herausgegeben. Einschließlich der Anzahl der Limits, der Wiederherstellungszeit und spezifischer Änderungen nach der Erweiterung der Rechenleistung in der zweiten Jahreshälfte müssen wir noch auf weitere offizielle Bestätigungen warten.
02
DeepSeek ist kein Einzelfall
Tatsächlich ist DeepSeek nicht das erste KI-Unternehmen, das dies tut.
Wenn die Rechenleistung großer Produktmodelle knapp ist, die Benutzer stark ansteigen oder der Druck in Spitzenzeiten zu hoch ist, besteht die übliche Vorgehensweise darin, den Stromfluss zu begrenzen, ein Downgrade durchzuführen, in die Warteschlange zu stellen oder einige Funktionen mit hohem Verbrauch separat einzuschränken.
ChatGPT hatte schon immer ein Nachrichtenlimit, und selbst zahlende Benutzer können in Zeiten hoher Nachfrage auf Nutzungsbeschränkungen stoßen. Sobald kostenlose Benutzer das Kontingent für das erweiterte Modell erreicht haben, werden sie auch auf ein leichteres Modell umgestellt, um es weiterhin verwenden zu können.
Es kann als eine Art „Service-Downgrade“ verstanden werden, was nicht bedeutet, dass es nicht verwendet werden darf, sondern dass nicht jeder die teuersten und ressourcenintensivsten Funktionen uneingeschränkt nutzen kann.

Ähnlich wie Claude legt Anthropic Nutzungsbudgets für verschiedene Benutzer fest, und Hochfrequenzszenarien wie Claude Code und API passen die Obergrenze ebenfalls an Kapazitätsänderungen an. Wenn die Rechenleistung reichlich vorhanden ist, kann die Quote erhöht werden; Wenn der Nachfragedruck zunimmt, werden die Einschränkungen deutlicher.
Am 6. Mai veröffentlichte Anthropic außerdem ein spezielles Dokument, in dem es heißt, dass mit der neuen Rechenleistungskooperation und der erhöhten Kapazität das Nutzungslimit von Claude Code und Claude API erhöht wurde. Das wiederum zeigt es auchDas Nutzungslimit ist direkt mit der Rechenleistungskapazität verknüpft. Sie wird verschärft, wenn die Rechenleistung knapp ist, und gelockert, wenn die Rechenleistung erweitert wird.

Allerdings hat Anthropic inzwischen detailliertere Nutzungslimits für verschiedene Abonnementkontingente festgelegt, und Szenarien mit hohem Verbrauch wie Claude Code nähern sich der Logik der Token-Messung und -Abrechnung an.
Typischer sind Produkte zur Bild- und Videogenerierung. Die Bildgenerierungsfunktionen von Sora und Gemini sowie andere KI-Videotools erlebten Zeiten, in denen die Anzahl der Generationen verkürzt, die Warteschlangenzeiten verlängert und die kostenlosen Kontingente reduziert wurden, als die Nachfrage stieg.
Man kann sagen, dass „jede Schlussfolgerung ihren Preis hat“ für KI-Produkte zu einer unvermeidlichen Realität geworden ist.
Vor einiger Zeit löste das Aufladen von Sitzsäcken eine Diskussionsrunde aus. „Doubao, teuer und schwer zu bedienen“ wurde einst zu einer heißen Suchanfrage auf Weibo. Diesmal unterscheidet es sich von den eingeschränkten Funktionen von DeepSeek, aber die Logik hinter den Benutzerreaktionen ist dieselbe: Jeder ist es gewohnt, dass KI-Produkte günstig und einfach zu bedienen sind. Sobald die Plattform mit dem Laden beginnt oder beginnt, bestimmte Funktionen einzuschränken, wird sich die Stimmung der Nutzer leicht erholen.
Tatsächlich ist es bei KI-Unternehmen eine weit verbreitete Praxis, grundlegende Funktionen kostenlos zur Verfügung zu stellen, komplexe Funktionen in Rechnung zu stellen, Quoten für kostenintensive Funktionen festzulegen und den Datenfluss in Spitzenzeiten vorübergehend zu begrenzen.
DeepSeek begrenzt die Anzahl der „Regenerations“- und „Änderungsmeldungen“, was in der gesamten KI-Branche nicht ungewöhnlich ist. Was es einschränkt, ist nicht der Chat-Eingang oder das Modell selbst, sondern nur die Vorgänge, auf die Benutzer häufig klicken können, aber jeder Klick verbraucht erneut Argumentationsressourcen.
Da der grundlegende Dialog so weit wie möglich erhalten bleiben muss, ist dies die Voraussetzung dafür, dass Benutzer das Produkt verwenden können. Funktionen wie Neugenerierung, wiederholte Änderungen, Datei-Uploads, Internetsuche, langer Kontext und multimodale Generierung werden jedoch bei hohem Druck eher eingeschränkt oder herabgestuft.
Ich habe das Gefühl, dass es bei dieser Kontroverse nicht darum geht, „wie viel man einschränkt“, sondern darum, wie man einschränkt.
Wenn der Beamte früher erklären könnte, dass es sich hierbei um eine vorübergehende aktuelle Beschränkung handelt, wie lange die Wiederaufnahme dauern wird und welche Vorgänge davon betroffen sind, würden die Benutzer dies höchstwahrscheinlich eher akzeptieren.Wenn es aber ohne Ankündigung plötzlich nicht mehr verfügbar ist, wird sich natürlich jeder sofort fragen, ob die Funktionen schrumpfen und ob in Zukunft Gebühren anfallen.
Wenn sich KI-Produkte von Early-Adopter-Tools zu Tools für den täglichen Gebrauch wandeln, legen Benutzer zunehmend Wert auf Stabilität und Transparenz. Die Einschränkungen an sich sind verständlich, aber es ist am besten, Benutzer nicht zum ersten Mal in einem Popup-Fenster darauf aufmerksam zu machen.
DeepSeek muss wissen, dass, wenn die Anzahl der Nutzungen so stark zunimmt, dass sie begrenzt werden müssen, dies auch bedeutet, dass viele Benutzer auf Sie warten.
Auch wenn es nur ein Genehmigungsschreiben ist.