Laut den exklusiven Nachrichten von „Moby Lab“ sollen DeepSeek V4 und Hunyuans neues Modell unter der Leitung von Yao Shunyu am 12. März nächsten Monat (April 2026) veröffentlicht werden.Am 11. März brachte OpenRouter zwei neue mysteriöse Modelle auf den Markt: Healer Alpha und Hunter Alpha.


Laut der OpenRouter-Seite wird Healer Alpha als visionär beschrieben.Anhörung, hochmodernes vollmodales Modell der Denk- und Handlungsfähigkeiten;


Die Community verknüpfte es daher schnell mit einer neuen Generation inländischer Modelle, die noch nicht veröffentlicht wurden, und erfasste angeblich „das System, das die strikte Einhaltung chinesischer Gesetze und Vorschriften erfordert“.


https://x.com/chetaslua/status/2031983459057672455

Und am 12. März, laut den exklusiven Nachrichten von „Moby Dick Labs“ (Exklusiv | Liang Wenfeng wird DeepSeek V4 auf Yao Shunyu bringen):

DeepSeek V4 wird im April offiziell eingeführt.

Als großes multimodales Modell, an dem Liang Wenfeng lange Zeit gefeilt hat, wird DeepSeek V4 nicht nur seine Codierungsfunktionen verbessern, sondern auch Durchbrüche im Langzeitgedächtnis erzielen.

Diese Richtung steht im Wesentlichen im Einklang mit der öffentlichen Forschung des DeepSeek-Teams in den letzten Monaten.

Im Januar 2026 schlug Liang Wenfeng in seinem unterzeichneten Papier „Conditional Memory via Scalable Lookup“ den „Conditional Memory“-Mechanismus vor;

„mHC: Manifold-Constrained Hyper-Connections“ im Dezember 2025 weist weiterhin auf die Optimierung der zugrundeliegenden Architektur hin.

In beiden Artikeln wird versucht, mit Transformers Engpässen in Bezug auf Speicher, Trainingsstabilität und langen Kontext umzugehen.

Laut den exklusiven Nachrichten von „Moby Lab“ (Exklusiv|Liang Wenfeng wird DeepSeek V4 auf Yao Shunyu bringen):

Liang Wenfengs Hauptarbeit in den letzten sechs Monaten bestand darin, die Mängel von DeepSeek bei der Verarbeitung visueller Inhalte und der KI-Suche auszugleichen.

Um die KI-Suchfunktionen zu stärken, hat DeepSeek bereits im letzten Jahr mit Baidu zusammengearbeitet.

Die wichtigste Iterationsrichtung, die Liang Wenfeng dieses Mal für DeepSeek V4 festgelegt hat, ist die Fähigkeit zum Langzeitgedächtnis.

DeepSeek V4 wird auch stark an inländische Chips angepasst und wird voraussichtlich das erste große Modell sein, das vollständig auf dem heimischen Rechenleistungs-Ökosystem läuft.

Eine weitere öffentlich bestätigte Tatsache ist, dass das Volumen der DeepSeek-Produkte die Markterwartungen erhöht hat.

Seit der Einführung der DeepSeek-App bis zum 9. Februar 2025 haben die kumulierten Downloads die 110-Millionen-Marke überschritten und die Zahl der wöchentlichen aktiven Nutzer hat einen Höchstwert von fast 97 Millionen erreicht.

Yao Shunyus neues Hunyuan-Modell

Die Veröffentlichung ist ebenfalls für April geplant

Neben DeepSeek bereitet Tencent auch neue Aktionen für April vor.

Yao Shunyu fungierte im Dezember 2025 als leitender KI-Wissenschaftler im Tencent General Office und ist außerdem Leiter der KI-Infra-Abteilung und der Abteilung für große Sprachmodelle.


Im Februar 2026 wurde CL-bench veröffentlicht, ein von Yao Shunyu unterzeichnetes Papier, das einen neuen Bewertungsmaßstab für „Kontextlernen“ vorschlägt und den Forschungsschwerpunkt von Tencent Hunyuan weiterhin auf langen Kontext und Agentenverfügbarkeit legt.


https://arxiv.org/abs/2602.03587

Laut den exklusiven Nachrichten von „Moby Lab“ (Exklusiv|Liang Wenfeng wird DeepSeek V4 auf Yao Shunyu bringen):

Yao Shunyu wird im April außerdem ein neues Hunyuan-Modell mit einer Skala von etwa 30 Milliarden Parametern herausbringen.

Bereits Anfang 2025 hatte Yao Shunyu die Einladung zur Rückkehr nach China angenommen; Tatsächlich hatten Yao Shunyus Vorbereitungen für das neue Modell bereits begonnen, nicht einmal ein halbes Jahr nach der offiziellen Ankündigung.

Ende Januar dieses Jahres brachte auch „LatePost“ die Nachricht (vollständiger Bericht über den KI-Krieg zwischen Byte, Alibaba und Tencent: ein Krieg, der das Schicksal beeinflusst):

Innerhalb von Tencent forderte Yao Shunyu das Team auf, sich nicht an der Rangliste zu orientieren.


Der öffentlichen Entwicklung nach zu urteilen, wird diese Aktualisierungsrunde im April nicht nur ein Parameterwettbewerb sein.

Die bekannte Forschung von DeepSeek erstreckt sich auf das Langzeitgedächtnis, die Multimodalität und die zugrunde liegende Architektur, während Tencent Hunyuan seine Ergänzungskurse zum kontextuellen Lernen und zur Bewertung realer Aufgaben beschleunigt.

Die beiden Wege sind sehr unterschiedlich, aber sie versuchen beide, die gleiche Frage zu beantworten: Wie gelangt man tatsächlich in die Produktionsumgebung für die nächste Stufe großer Modelle?