NVIDIA wird im Land einen neuen LPU-Chip auf den Markt bringen: kein Downgrade, kein Sonderangebot, 40PB/s performance

Auf der gestrigen GTC-Konferenz stellte NVIDIA eine Reihe von KI-Systemen vor und stellte offiziell einen neuen LPU-Chip vor – Groq 3 LPU, der das Produkt der 20-Milliarden-Dollar-Übernahme der Groq-Technologie im letzten Jahr ist. Im Vergleich zu KI-GPU-Chips, die sich auf umfangreiches Modelltraining konzentrieren, ist Groq 3 LPU für KI-Inferenz konzipiert und bietet die Vorteile einer geringen Latenz und eines langen Kontexts. Es kann in Verbindung mit Vera Rubin verwendet werden, um den gesamten KI-Prozess zu unterstützen.

Die gute Nachricht ist, dass dieser LPU-Chip voraussichtlich auch in China zum Einsatz kommen wird.Ausländische Medien zitierten Quellen mit der Aussage, dass NVIDIA die Einführung eines Groq-Chips vorbereitet, der auf dem heimischen Markt verkauft werden kann.

Im Gegensatz zu früheren GPU-Chips, deren Leistung vor dem Export reduziert werden musste,Diesmal wird der Groq-Chip keine kastrierten Spezifikationen haben und es handelt sich nicht um eine inländische Sonderversion wie der H20.

Ohne Kastration oder besondere Versorgung werden solche Groq-Chips beim Verkauf auf dem heimischen Markt offensichtlich einen großen Widerstand vermindern. Das größte Problem besteht jedoch darin, ob es die US-Prüfung bestehen kann. Es hängt davon ab, wie Huang Renxun den US-Präsidenten überzeugt.

Aber selbst wenn NVIDIA keine Groq-Chips speziell nach China liefert, ist es schwer zu sagen, dass es sich bei den künftig in China eingeführten Groq-Chips um die gestern veröffentlichte Groq 3 LPU handeln wird, da letztere auch über eine sehr starke aktuelle Leistung und Spezifikationen verfügen.

Der einzelne Chip dieses Produkts heißt LPU30, hergestellt von Samsung OEM, integriert 500 MB SRAM-Cache, 98 Milliarden Transistoren, FP8-Zeichen 1,2 PFLOPS, AI-Rechenleistung ist weit schlechter als die Rubin-GPU, aber die Bandbreite von 150 TB/s ist viel höher als die 22 TB/s von HBM4.

Der Groq 3 LPU-Chip wird in Form des Groq 3 LPX-Racks erscheinen, das 256 LPU30-Chips mit einer Cache-Kapazität von 128 GB integrieren kann.Die Gesamtspeicherbandbreite wurde auf 40PB/s erhöhtDie Verbindungsbandbreite beträgt ebenfalls 640 TB/s.

Im Allgemeinen kann die LPU in Bezug auf die KI-Rechenleistung nicht mit der GPU mithalten, aber die Bandbreite von SRAM übertrifft zweifellos HBM4 und die Latenz ist geringer. Die beiden Chips eignen sich für unterschiedliche Situationen. Es kommt nicht darauf an, wer den anderen ersetzt. Die LPU-Verkäufe werden in Zukunft explodieren.