Quick Technology berichtete am 3. Mai, dass die DeepSeek V4-Serie großer Modelle offiziell am 24. April veröffentlicht wurde. Seit dem DeepSeek R1-Update im letzten Jahr sind 15 Monate vergangen. Die Leistung von V4 hat auch im In- und Ausland Diskussionen ausgelöst, und auch die Amerikaner sind sehr besorgt.

Es wurden viele Tests durchgeführt, um die Leistungsfähigkeit von DeepSeek V4 zu bewerten. Ein früherer Forschungsbericht, der von drei leitenden Forschern des Council on Foreign Relations erstellt wurde, zeigte, dass es etwa sieben Monate hinter den führenden amerikanischen Großmodellen zurückbleibt.

Jetzt ist auch das Center for Artificial Intelligence Standards and Innovation (CAISI), eine Tochtergesellschaft des National Institute of Standards and Technology (NIST), gekommen, um DeepSeek V4 zu evaluieren. Ihre Schlussfolgerung ist, dass DeepSeek V4 etwa acht Monate hinter den Vereinigten Staaten zurückbleibt, was dem vorherigen Abstand ähnelt.

In den Ergebnissen der KI-Fähigkeitsbewertung erzielte DeepSeek V4 800 Punkte, und der derzeit stärkste ist GPT-5.5 mit einem Wert von mehr als 1200 Punkten, GPT-5.4 und Opus 4.6 liegen ebenfalls darüber 1000 Punkte.

Die Gesamtleistung von DeepSeek V4 ähnelt der von GPT-5 vor 8 Monaten, aber DeepSeek-Verantwortliche betrachteten es zuvor in einem Veröffentlichungsbericht als ähnlich zu GPT-5.4.

CAISI gab jedoch auch zu, dass DeepSeek V4 das leistungsstärkste große KI-Modell in China ist, das sie evaluiert haben, und in neun Tests in den fünf Bereichen Netzwerk, Softwareentwicklung, Naturwissenschaften, abstraktes Denken und Mathematik sehr stark abschneidet.

Noch wichtiger ist, dass DeepSeek V4 kostengünstiger ist. Selbst im Vergleich mit dem kostengünstigsten GPT-5.4-Mini-Großmodell in den USA weist DeepSeek V4 in 4 von 7 Benchmarks bessere Testkosten auf, die zwischen 41 % und 53 % höher liegen.