Amazons Cloud-Computing-Plattform AWS kündigte am Dienstag die Einführung eines neuen Produkts namens „AI Factories“ an, das es großen Unternehmen und Regierungsbehörden ermöglicht, die künstlichen Intelligenzsysteme von Amazon in ihren eigenen Rechenzentren zu betreiben. Kunden stellen Computerräume und Strom zur Verfügung, und AWS ist für die Bereitstellung der gesamten KI-Infrastruktur und die Durchführung einheitlicher Betriebs- und Wartungsarbeiten verantwortlich. Es kann auch mit bestehenden AWS-Cloud-Diensten verbunden werden.

Dieses Modell richtet sich an Organisationen, die äußerst sensibel auf die Datensouveränität achten und hoffen, dass ihre Daten nicht an Drittanbieter von Modellen hochgeladen werden müssen oder die zugrunde liegenden Hardwareressourcen mit anderen teilen müssen.
Das Konzept der „KI-Fabrik“ im neuen Produktnamen stammt von Nvidias gleichnamigem bestehenden Hardwaresystem, das einen kompletten Satz an Komponenten integriert, die für den Betrieb großer Modelle erforderlich sind, wie etwa GPU-Chips und Netzwerkgeräte. Die AI Factory von AWS ist eigentlich ein tiefgreifendes Kooperationsprojekt mit NVIDIA. Beide Unternehmen bestätigten, dass die Lösung die technischen Fähigkeiten beider Parteien kombinieren wird, um Kunden integrierte KI-Rechenleistung und Plattform-Stack zu bieten.
In Bezug auf die spezifische Konfiguration können Unternehmen wählen, ob sie die Blackwell-GPU der neuesten Generation von NVIDIA installieren oder den neuen selbst entwickelten Trainium3-Trainingschip von Amazon verwenden möchten, um unterschiedliche Anforderungen an Rechenleistung und Kosten zu erfüllen. Zusätzlich zur Rechenleistung wird das System die AWS-eigenen Netzwerk-, Speicher-, Datenbank- und Sicherheitskomponenten integrieren und kann direkt auf Amazon Bedrock, einen Modellauswahl- und Hosting-Service, und SageMaker, eine Modellkonstruktions- und Trainingsplattform, zugreifen und so eine einheitliche Umgebung von der zugrunde liegenden Hardware bis zu den Entwicklungstools der oberen Schicht bilden.
Es ist erwähnenswert, dass AWS nicht der einzige Cloud-Computing-Riese ist, der auf „KI-Fabriken“ setzt. Bereits im Oktober stellte Microsoft seine auf der NVIDIA AI Factory-Technologie basierende KI-Infrastruktur vor, die zum Hosten von OpenAI und anderen Workloads in globalen Rechenzentren verwendet wird, und baute auf der Grundlage dieser Architektur eine neue Generation von Rechenzentren auf „AI Super Factory“-Niveau in Wisconsin und Georgia auf. Allerdings legte Microsoft zu diesem Zeitpunkt nicht Wert auf die direkte Bereitstellung ähnlicher Systeme in Kundenräumen in Form lokaler privater Clouds, sondern konzentrierte sich stattdessen auf die Fähigkeit, eine eigene Cloud-Infrastruktur aufzubauen.
Im Hinblick auf den Umgang mit der Datensouveränität hat Microsoft bereits Pläne für den lokalen Aufbau von Rechenzentren und Cloud-Diensten in verschiedenen Ländern angekündigt und verschiedene Lokalisierungslösungen vorgeschlagen, darunter „Azure Local“. Microsoft stellt die Hardware bereit, hostet sie und stellt sie dann an Kundenstandorten bereit, um behördliche und Compliance-Anforderungen zu erfüllen. Im Gegensatz dazu hat AWS eindeutig ein Modell von kundeneigenen Rechenzentren vorgeschlagen und AWS hat dieses Mal „die KI-Fabrik verlegt“, wodurch die Grenzen zwischen traditionellen privaten Unternehmensrechenzentren und öffentlichen Clouds weiter verwischt werden und Hybrid-Clouds und Enterprise-Hosting-Räume erneut in den Mittelpunkt der Branchenbühne gerückt sind.
Aus der Sicht der Außenwelt veranlasst die Welle der generativen KI mehrere große Cloud-Dienstleister dazu, ihre Investitionen in unternehmenseigene Rechenzentren und Hybrid-Cloud-Architekturen wieder zu erhöhen, was deutlich an die Ära erinnert, als vor mehr als einem Jahrzehnt „Unternehmenscomputerräume König“ waren. Da Hardwarelieferanten wie NVIDIA zunehmend an Cloud-Giganten gebunden sind, dürfte die lokale und souveräne Bereitstellung rund um „KI-Fabriken“ in den nächsten Jahren zu einer der wichtigsten Optionen für große Unternehmen bei der Planung der KI-Infrastruktur werden.