Gestern gab Arm bedeutende Fortschritte bei seinem „Total Design“-Plan bekannt. Das vor einem Jahr gestartete Programm zielt darauf ab, die Entwicklung maßgeschneiderter Chips für Rechenzentren durch die Förderung der Zusammenarbeit zwischen Industriepartnern zu beschleunigen. Das Ökosystem ist auf fast 30 teilnehmende Unternehmen angewachsen, mit den jüngsten Neuzugängen AlcorMicro, Egis, PUFSecurity und SEMIFIVE.

Eine bemerkenswerte Entwicklung ist, dass Arm, Samsung Foundry, AD Technology und Rebellions zusammengearbeitet haben, um eine CPU-Chip-Plattform für künstliche Intelligenz zu entwickeln. Ziel der Zusammenarbeit ist es, Lösungen für Cloud-, HPC- und KI/ML-Workloads bereitzustellen, indem die KI-Beschleuniger von Rebellions mit den Computerchips von AD Technology kombiniert und mithilfe der 2-nm-Gate-All-Around-FET-Technologie (GAA) von Samsung Foundry implementiert werden.


Es wird erwartet, dass die Plattform erhebliche Effizienzsteigerungen bei generativen künstlichen Intelligenz-Workloads mit sich bringt, und es wird geschätzt, dass die Effizienz eines LLM wie Llama3.1 mit 405 Milliarden Parametern zwei- bis dreimal höher sein wird als bei Standard-CPU-Designs.

Der Ansatz von Arm betont die Bedeutung des CPU-Computings für die Unterstützung des gesamten KI-Stacks, einschließlich fortschrittlicher Technologien wie Datenvorverarbeitung, Orchestrierung und Retrieval Augmentation Generation (RAG). Das Compute Subsystem (CSS) des Unternehmens ist darauf ausgelegt, diese Anforderungen zu erfüllen und Partnern eine Grundlage für die Entwicklung verschiedener Chipsatzlösungen zu bieten. 

Mehrere Unternehmen, darunter AlcorMicro und Alphawave, haben Pläne zur Entwicklung von CSS-basierten Chips für eine Vielzahl von Anwendungen für künstliche Intelligenz und Hochleistungsrechnen angekündigt. Das Programm konzentriert sich auch auf die Software-Bereitschaft und stellt sicher, dass wichtige Frameworks und Betriebssysteme mit Arm-basierten Systemen kompatibel sind. Zu den jüngsten Bemühungen gehört die Einführung der ArmKleidi-Technologie, die CPU-basierte Inferenz für Open-Source-Projekte wie PyTorch und Llama.cpp optimiert. 

Es ist erwähnenswert, dass, wie Google behauptet, die meisten KI-Arbeitslasten auf der CPU abgeleitet werden, sodass es sehr sinnvoll ist, die effizienteste und leistungsstärkste CPU für KI zu bauen.