DeepSeek gab offiziell bekannt, dass es ein neues großes Modell testet, bei dem es sich möglicherweise um V4 Lite

In den letzten Tagen kam es zu einem explosionsartigen Anstieg der heimischen KI. GLM-5, Minimax 2.5 und DeepSeek brachten alle am selben Tag, dem 11., neue große Modelle heraus, von denen DeepSeek natürlich die meiste Aufmerksamkeit auf sich zog. Wir haben zuvor berichtet, dass dieses Update hauptsächlich die Kontextfähigkeit verbessert und 1 Mio. erreicht, während die vorherige DeepSee V3-Serie 128 KB betrug, was siebenmal mehr ist als das große Modell der vorherigen V3-Serie.

DeepSeek hat dies heute Abend auch offiziell in der offiziellen Gruppe bestätigt.Zeigt an, dass die Webseite und die APP-Version eine neue Langtextmodellstruktur testen und 1M-Kontext unterstützen.

Gleichzeitig betonte DeepSeek auch, dass sich der API-Dienst nicht geändert habe. Es handelt sich immer noch um ein großes Modell der V3.2-Serie, das nur 128K-Kontext unterstützt.

Nach der Einführung von DeepSeek zu urteilen, handelt es sich bei diesem neuen Modell immer noch um ein Textmodell. Die wichtigste Verbesserung ist die Kontextfähigkeit, die in vielen Bereichen ebenfalls sehr wichtig ist. Bei langen Gesprächen kommt es bei großen Models leicht dazu, dass sie sich aufgrund unzureichenden Kontexts nicht an frühere Inhalte erinnern können.

Obwohl es viele tatsächliche Tests im Internet gibt, die zeigen, dass sich dieses DeepSeek-Großmodell in Bezug auf Programmierung, Ausgabegeschwindigkeit usw. erheblich verbessert hat., aber im Vergleich zu den bisherigen Erwartungen ist dieses Update zwangsläufig etwas enttäuschend.

Das große Modell ist dieses Mal offensichtlich nicht V4, sondern eher V4 Lite, da die Anzahl der Parameter angeblich nur 200 Milliarden beträgt, was viel weniger ist als die 670 Milliarden der V3-Serie, sodass es normal ist, dass einige Funktionen schlechter als V3 sind.

Es wird spekuliert, dass es sich bei diesem Modell um V4 Lite handelt. Es ist unwahrscheinlich, dass DeepSeek in Zukunft nur ein großes V4-Modell veröffentlichen wird. Stattdessen wird es unterschiedliche Versionen geben. Jede Serie hat unterschiedliche Richtungen und Designs. Das aktuelle V4 Lite ist nur ein Wegbereiter, daher gibt es keine großen Verbesserungen. Darüber hinaus haben die Verantwortlichen von DeepSeek die technische Architektur nicht detailliert beschrieben und weitere Informationen müssen noch veröffentlicht werden.

Die angebliche Vollversion von DeepSeek V4 hat 1,5 Billionen Parameter, mehr als das Doppelte der V3-Serie.Auch neue Technologien wie Engram und mHC, die zuvor von DeepSeek untersucht wurden, werden zum Einsatz kommen.Die Leistung wird umfassend verbessert, während die Kosten immer noch niedrig sind. Diese Erwartung ist immer noch sehr hoch.