Die jüngste Zusammenarbeit zwischen Kioxia und NVIDIA gilt als ein weiterer technologischer Fortschritt in der KI-Rechenzentrumsinfrastruktur. Die beiden Unternehmen arbeiten gemeinsam an der Entwicklung von SSDs, die bis zu 100 Millionen IOPS (Eingabe- und Ausgabevorgänge pro Sekunde) leisten können. Diese Leistung liegt weit über dem aktuellen SSD-Spitzenniveau von etwa 3 Millionen IOPS und zielt darauf ab, den Datenübertragungsengpass bei der Schulung und Bereitstellung groß angelegter KI-Modelle zu überwinden.

Wenn das Projekt erfolgreich ist, wird es nicht nur das Tempo der generativen KI (GenAI)-Innovation beschleunigen, sondern auch die Rechenzentrumsarchitektur neu definieren, die Wettbewerbslandschaft von Cloud Computing und Enterprise-Class-Speicher verändern und neue Standards für das gesamte Hardware-Ökosystem setzen.

Der Halbleiterspeicherhersteller Kioxia entwickelt eine neue Generation der SSD-Technologie, um den hochintensiven Lese- und Schreibanforderungen der KI gerecht zu werden. Das Unternehmen gab bekannt, dass es die Kommerzialisierung im Jahr 2027 erreichen will, sodass die zufälligen IOPS von SSDs das 100-Millionen-fache erreichen werden. Dieser Leistungsindikator ist etwa 30- bis 35-mal höher als bei bestehenden High-End-Produkten. Kioxia kooperiert dieses Mal mit NVIDIA, um die Umsetzung des Projekts voranzutreiben.

Bei einer Medienbesprechung in Tokio sagte Kioxia, dass die neue SSD direkt mit NVIDIA-GPUs verbunden sein wird, ohne den Umweg über einen herkömmlichen Server-Zentralprozessor. Diese „Punkt-zu-Punkt“-Verbindungsmethode verbessert die Geschwindigkeit des Datenflusses zwischen Speicher- und Recheneinheiten erheblich. Es eignet sich besonders für das Training großer KI-Modelle, die auf häufigem, kleinem Zufallsdatenlesen basieren, beispielsweise dem Abrufen eingebetteter Darstellungen und Modellparameter. Mit herkömmlichen SSD-Systemen ist es schwierig, diese Anforderungen effizient zu erfüllen.

NVIDIA hat sich ein anspruchsvolleres Ziel gesetzt: 200 Millionen IOPS durch zwei solcher SSDs mit Unterstützung des kommenden PCI Express 7.0-Standards zu erreichen. PCIe 7.0 bietet schnellere Punkt-zu-Punkt-GPU-Kommunikationsfunktionen. Im Vergleich dazu erreicht die aktuelle Hochleistungs-SSD etwa 3 Millionen IOPS in 4K-Blöcken. Wenn sie auf 100 Millionen IOPS ansteigt, wird dies sowohl für den NAND-Flash-Speicher als auch für die Schnittstellenarchitektur große technische Herausforderungen mit sich bringen.

Die vielversprechendste Technologie von Kioxia ist der proprietäre XL-Flash Single-Layer Cell (SLC) NAND-Speicher, der sich durch hohe Ausdauer, geringe Latenz und starke Leistung auszeichnet. Jeder XL-Flash-Chip unterstützt bis zu 16 „Ebenen“, während gewöhnliches 3D-NAND für Verbraucher im Allgemeinen über 3 bis 6 Ebenen verfügt.

Obwohl Kioxia nicht alle technischen Spezifikationen veröffentlicht hat, können die vorhandenen Testdaten einen Einblick in das Ausmaß der Herausforderung geben: Eine 400 GB große XL-Flash-SSD, die mit 32 NAND-Chips ausgestattet ist und die PCIe 5.0-Schnittstelle verwendet, hat eine Leistung von etwa 3,5 Millionen zufälligen Lese-IOPS gezeigt. Wenn die Leistung perfekt linear skaliert werden kann, kann eine SSD mit 915 Chips theoretisch 100 Millionen IOPS erreichen. Aufgrund von Faktoren wie Controller-Bandbreite, Firmware-Overhead und Systemarchitektur lässt sich dieses Ziel jedoch oft nur schwer durch einfaches Stapeln von Chips erreichen und erfordert möglicherweise die Verwendung mehrerer Controller oder modularer SSD-Lösungen.

Angesichts der Einschränkungen der herkömmlichen 3D-NAND-Erweiterung erforscht Kioxia außerdem eine neue Speichertechnologie namens High-Bandwidth Flash (HBF), die darauf abzielt, die Geschwindigkeit von Speicher mit hoher Bandbreite mit größerer Speicherkapazität zu kombinieren. Die HBF-Lösung nutzt eine fortschrittliche Verpackung, um bis zu 16 NAND-Chips und einen Logikchip zu stapeln und so ein extrem hohes Maß an Parallelität und Bandbreite zu erreichen. Obwohl noch ungewiss ist, ob HBF im Endprodukt dieses Kooperationsprojekts verwendet wird, zeigt diese Forschung und Entwicklung, dass Kioxia im KI-Zeitalter ultrahochleistungsfähige Speicherlösungen entwickelt.