ChatGPT-5 wurde veröffentlicht, sodass ein großes Versionsupdate des inländischen Großmodells DeepSeek nicht mehr weit entfernt ist.Den Fragen der Internetnutzer an DeepSeek nach zu urteilen, lautet die Antwort des Modells, dass DeepSeek-R2 voraussichtlich zwischen dem 15. und 30. August 2025 veröffentlicht wird.

Vor diesem Hintergrund sind die Aktienkurse vieler Unternehmen in der heimischen Rechenleistungskette stark gestiegen. Beispielsweise hat Cambrian heute ein Tageslimit von 20 cm erreicht, sein Aktienkurs erreichte ein Rekordhoch und sein Marktwert übersteigt 355 Milliarden Yuan.

Nach früheren Aussagen wird das DeepSeek-R2-Großmodell ein fortschrittlicheres Hybrid-Expertenmodell (MoE) verwenden, das mit einer intelligenteren Gating-Netzwerkschicht (Gating Network) kombiniert wird, um die Leistung von Inferenzaufgaben mit hoher Auslastung zu optimieren.

Einige Analysten gehen davon aus, dass die Preise für DeepSeek-R2 deutlich niedriger sein könnten als für ähnliche Produkte von OpenAI, was darauf hindeutet, dass es das Preismodell bestehender KI-Dienste untergraben könnte.

Darüber hinaus zeigen relevante Nachrichten, dass DeepSeek-R2 voraussichtlich 97 % weniger kosten wird als GPT-4; und es ist auf der Ascend-Karte geschult und konzentriert sich auf eine umfassende und unabhängige Kontrolle der gesamten Industriekette.

Relevanten Quellen zufolge könnte die Gesamtzahl der Parameter von DeepSeek-R2 1,2 Billionen erreichen, was etwa dem Doppelten der 671 Milliarden Parameter von DeepSeek-R1 entspricht.

DeepSeek-R2 ist ein Modell, das auf Basis des Ascend 910B-Chipclusters von Huawei trainiert wurde. Es verfügt über eine Rechenleistung von 512 PetaFLOPS bei FP16-Genauigkeit und eine Chipnutzungseffizienz von 82 %.

Laut Statistiken von Huawei Labs entspricht diese Leistung etwa 91 % der Leistung des A100-Trainingsclusters der vorherigen Generation von NVIDIA. Ob diese real sind oder nicht, bleibt abzuwarten, aber es scheint mächtiger und autonomer zu sein.