NVIDIAs Grafikkarte der nächsten Generation kommt mit dem 1,6-nm-A16-Prozess auf den Markt, zu wenig Produktionskapazität, um 3nm

Auf der GTC-Konferenz letzte Woche hat NVIDIA die Roadmap für die GPU-Architektur der nächsten Generation Feynman weiter präzisiert, die voraussichtlich im Jahr 2028 veröffentlicht wird. Feynman wird nicht nur kundenspezifische HBM-Chips verwenden, sondern erstmals auch Die Stack, einen 3D-Stack-Packaging-Prozess, verwenden.Unter anderem wird der GPU-Kern den 1,6-nm-Prozess A16 von TSMC auf den Markt bringen.

Dies ist auch NVIDIAs erste Einführung des neuen Prozesses von TSMC seit vielen Jahren. Der letzte Start erfolgte in der 55-nm-Ära. Nach dem Aufkommen des mobilen Zeitalters dominierte Apple beinahe die Einführung des neuen Prozesses von TSMC. Diesmal ist es mit dem Aufkommen der KI-Ära erneut passiert.

Der A16-Prozess ist eine verbesserte Version des 2-nm-Prozesses N2. Es wird dem GAA-Transistor eine zusätzliche neue Technologie hinzufügen – die SRP-Rückstromversorgung, die die Dichte und Leistung sowie die Stromversorgungskapazität verbessert. Er eignet sich daher für HPC-Computing, ist aber kein Low-Power-Chip und Apple wird nicht der erste sein, der ihn auf den Markt bringt.

Laut TSMC kann der A16-Prozess die Leistung im Vergleich zum 2nn-Enhanced-N2P-Prozess um 8–10 % verbessern, den Stromverbrauch um 15–20 % senken und die Transistordichte um 7–10 % erhöhen.

Obwohl NVIDIA zum ersten Mal den A16-Prozess erhalten hat, steht das Unternehmen vor vielen Herausforderungen.Der Hauptgrund liegt darin, dass die Produktionskapazität begrenzt ist und die Verbesserung nicht den Erwartungen entspricht.Die Produktionskapazität von A16 wird bis Ende nächsten Jahres nur 20.000 Wafer pro Monat betragen und sich bis 2028 auf 40.000 Wafer verdoppeln. Die Produktionskapazität der gesamten 2-nm-Prozessfamilie wird voraussichtlich 200.000 Wafer pro Monat erreichen, sodass die Produktionskapazitätsquote von A16 nicht hoch ist.

Dies führte auch dazu, dass die Feynman-GPU Änderungen vornehmen musste und den A16-Prozess nur auf dem Kern-GPU-Chip nutzen konnte, der am empfindlichsten auf Leistung und Stromverbrauch reagiert.Weniger wichtige Teile werden den N3P-Prozess von TSMC verwenden, was ebenfalls zur Kostensenkung beitragen wird.

Tatsächlich hat NVIDIA schon lange erkannt, dass es zu riskant und den Preisverhandlungen nicht förderlich wäre, sich bei erweiterten Produktionskapazitäten ausschließlich auf TSMC zu verlassen, und sucht daher auch aktiv nach anderen Gießereien. Die dieses Mal veröffentlichten LPU-Chips werden von Samsung hergestellt, und es ist möglich, die EMIB-T-Technologie von Intel in Zukunft zum Verpacken von Chips zu verwenden. Wenn die Zusammenarbeit reibungslos verläuft, ist es nicht unmöglich, Intels 14A-Verfahren zur Herstellung von GPU-Chips zu nutzen.