Der neue Cortex-A320 von Arm ist die erste hocheffiziente CPU mit der fortschrittlichen Armv9-Architektur, die speziell für die Anforderungen von IoT- und künstlichen Intelligenzanwendungen entwickelt wurde. Im Vergleich zum Cortex-A520 erreicht dieser Prozessor eine Effizienzsteigerung von mehr als 50 % durch mehrere Optimierungen der Mikroarchitektur sowie schmale Datenpfade zum Abrufen und Dekodieren, eine dichte L1-Cache-Bank und eine Port-reduzierte Ganzzahlregisterdatei.
Cortex-A320 verbessert außerdem die Skalarleistung um 30 % gegenüber dem Cortex-A35 der vorherigen Generation durch effiziente Verzweigungsprädiktoren, Prefetcher und Verbesserungen des Speichersystems.
Der Cortex-A320 ist eine einkanalige Out-of-Order-CPU mit 32-Bit-Befehlsabrufen und einer 8-stufigen Pipeline. Der Prozessor unterstützt Single-Core- bis Quad-Core-Konfigurationen und ist skalierbar. Es verfügt über die DSU-120T, eine vereinfachte DynamIQ Shared Unit (DSU), die Clustering nur für Cortex-A320 ermöglicht.
Cortex-A320 unterstützt 64 KB L1-Cache und bis zu 512 KB L2-Cache und bietet eine 256-Bit-AMBA5AXI-Schnittstelle zur Verbindung mit externem Speicher. Der L2-Cache und der L2-TLB können von Cortex-A320-CPUs gemeinsam genutzt werden. Die Vektorverarbeitungseinheit implementiert NEON- und SVE2SIMD-Technologie (Single Instruction, Multiple Data) und kann einzeln in einem Single-Core-Verbundprozessor verwendet oder von verschiedenen Kernen in einer Dual-Core- oder Quad-Core-Implementierung gemeinsam genutzt werden.
Cortex-A320 zielt nicht nur auf den IoT-Markt, sondern auch auf den Bereich der künstlichen Intelligenz ab und erreicht dies durch die Integration von Armv9-Architekturverbesserungen in die NEON- und SVE2-Vektorverarbeitung. Die ML-Verarbeitungskapazitäten des Prozessors sind im Vergleich zum Cortex-A35 zehnmal höher, und die ML-Gesamtleistung ist sechsmal höher als die des weit verbreiteten Cortex-A53. ArmCortex-A320 unterstützt neue Datentypen wie BF16 und erweiterte Punktmultiplikations- und Matrixmultiplikationsanweisungen und ist damit die effizienteste Cortex-ACPU für ML-Anwendungen.