Microsoft gab kürzlich bekannt, dass seine erste Charge selbst entwickelter KI-Chips „Maia 200“ offiziell in einem Rechenzentrum eingesetzt wurde, und plant, den weltweiten Einsatz in den kommenden Monaten weiter auszubauen. Dieser Chip wird von Microsoft als „AI Reasoning Power Engine“ für Argumentationsszenarien positioniert und ist hauptsächlich für hochintensive Arbeitslasten auf Produktionsebene optimiert, wie z. B. das Online-Argumentieren großer Modelle. Von Microsoft veröffentlichte Leistungsindikatoren zeigen, dass Maia 200 den neuesten Trainium-Chip von Amazon und Googles TPU der neuesten Generation in Bezug auf die Verarbeitungsgeschwindigkeit übertreffen kann. Es soll die technologische Spitzenposition im Wettbewerb um selbst entwickelte KI-Beschleunigungschips von Cloud-Herstellern erobern.

Ein wichtiger Hintergrund für die selbst entwickelten KI-Chips des Cloud-Computing-Riesen sind die derzeit hohen Kosten und das knappe Angebot an neuesten High-End-GPUs von Herstellern wie Nvidia. Dieser Versorgungsengpass wird kurzfristig weiterhin schwer zu beheben sein. Doch selbst wenn Microsoft über selbst entwickelte Hochleistungs-KI-Chips verfügt, wird es nicht aufhören, Chips von Nvidia und AMD zu kaufen. Satya Nadella, CEO von Microsoft, sagte, dass das Unternehmen eine „großartige Partnerschaft“ mit Nvidia und AMD unterhält und beide Parteien weiterhin Innovationen in ihren jeweiligen Bereichen fördern. Seiner Ansicht nach ist die Marktmeinung oft daran interessiert, zu vergleichen, „wer die Nase vorn hat“, aber der eigentliche Schlüssel besteht darin, einen Vorsprung über einen langen Zeitraum zu behalten.
Nadella betonte auch, dass Microsoft über die Fähigkeit zur vertikalen Integration verfüge, was jedoch nicht bedeute, dass das Unternehmen nur seine eigene Technologie von oben bis unten nutzen und vollständig auf die Lösungen ökologischer Partner verzichten werde. Mit anderen Worten: Microsoft wird neben selbst entwickelten Chips weiterhin auf ein diversifiziertes Hardware-Portfolio von Zulieferern wie Nvidia und AMD zurückgreifen, um seinen schnell wachsenden Bedarf an KI-Cloud-Computing zu decken.
Gemäß der Vereinbarung von Microsoft wird Maia 200 vorrangig dem unternehmensinternen „Superintelligence“-Team zugewiesen. Das Team unter der Leitung des ehemaligen Google DeepMind-Mitbegründers Mustafa Suleiman ist für den Aufbau einer neuen Generation hochmoderner Großmodelle für Microsoft verantwortlich. Es wird allgemein angenommen, dass die Investition von Microsoft in den Aufbau eigener hochmoderner Modelle darauf abzielt, die Abhängigkeit von Drittanbietern von Modellen wie OpenAI und Anthropic in Zukunft bis zu einem gewissen Grad zu verringern. Suleiman hat auf der sozialen Plattform gepostet
Gleichzeitig wird Maia 200 auch OpenAI-Modelle unterstützen, die auf der Cloud-Plattform Microsoft Azure laufen, wodurch Cloud-Kunden mehr Optionen für die KI-Rechenleistung erhalten. Die Rückmeldungen aller Beteiligten zeigen jedoch, dass die Beschaffung der fortschrittlichsten KI-Hardwareressourcen immer noch ein häufiges Problem für die gesamte Branche darstellt. Diese angespannte Situation betrifft nicht nur zahlende Kunden, sondern auch die internen KI-Forschungs- und Entwicklungsteams der Cloud-Anbieter. In einem solchen Lieferumfeld beschleunigt Microsoft einerseits die Implementierung selbst entwickelter KI-Beschleunigungschips und erhöht andererseits weiterhin die Einkäufe bei NVIDIA und AMD, um den doppelten Bedarf seiner KI-Infrastruktur im Hinblick auf Skalierungserweiterung und Leistungsoptimierung sicherzustellen.