Microsoft lockert eine „harte Linie“, die es zuvor in Bezug auf Copilot+-PCs gezogen hat, und ermöglicht mehr Windows 11-Geräten die Ausführung nativer KI-Workloads, wenn sie über die richtige GPU verfügen.Das neueste Update zeigt, dass Systeme mit einer NVIDIA GeForce RTX 30-Serie oder einer neueren Grafikkarte mit mindestens 6 GB Videospeicher die lokale Sprachmodell-API von Windows unterstützen. Oberflächlich betrachtet ist dies nur eine kleine Änderung für Entwickler, aber es deutet darauf hin, dass Microsoft darüber nachdenkt, seine nativen KI-Funktionen eng unter der Marke Copilot+ zu bündeln.

Als Copilot+ PC am 18. Juni 2024 offiziell veröffentlicht wurde, war die Botschaft von Microsoft sehr klar: Dedizierte KI-Hardware ist eine Voraussetzung. Zu den charakteristischen Merkmalen dieses Gerätetyps gehören integrierte neuronale Verarbeitungseinheiten (NPUs) sowie Grundkonfigurationen wie 16 GB Arbeitsspeicher und Solid-State-Laufwerke. Unter anderem ist NPU bewusst als Schlüssel zur Erschließung der nativen KI-Funktionen von Windows konzipiert.
NPUs sind jedoch nicht die einzigen, die KI-Arbeitslasten bewältigen können. Insbesondere moderne GPUs sind für massiv paralleles Rechnen konzipiert und werden seit langem zur Ausführung von Modellen für maschinelles Lernen verwendet. In der Praxis können GPUs für viele KI-Workloads oft einen höheren Durchsatz bieten als aktuelle NPUs, oft auf Kosten eines höheren Stromverbrauchs.
Vor dieser Anpassung hatte Microsoft die meisten integrierten KI-Funktionen auf Geräte mit NPUs beschränkt. Dies verhindert, dass viele PCs mit ausreichender Rechenleistung, die ausschließlich auf GPUs angewiesen sind, die lokale Text- und Bildgenerierung sowie eine Reihe von KI-Tools wie Windows Recall verwenden. Heute beginnt man, diese Lücke zu schließen. Microsoft bestätigte in einem aktualisierten technischen Dokument und einem GitHub-Beitrag, dass Entwickler die Sprachmodell-API jetzt auf Nicht-Copilot+-PCs mit unterstützten GPUs ausführen können.
In seiner Einführung nennt Microsoft diese Funktion „Sprachmodell-APIs, die auf GPUs ausgeführt werden (experimentell)“ und weist darauf hin, dass diese APIs jetzt auf Nicht-Copilot+-PCs mit unterstützten GPUs ausgeführt werden können, wodurch native Sprachmodellfunktionen für eine breitere Palette von Windows 11-Geräten bereitgestellt werden. Der Beamte stellte außerdem klar, dass derzeit unterstützte Hardware die NVIDIA GeForce RTX 30-Serie und neuere Produkte mit mehr als 6 GB Videospeicher umfasst.
Zum jetzigen Zeitpunkt ist diese Funktion noch hauptsächlich auf Entwicklerebene verfügbar und steht normalen Endbenutzern nicht direkt zur Verfügung. Um diese APIs aufzurufen, müssen Sie eine Anwendung entwickeln oder verwenden, die das Windows AI Framework integriert. Dies hat jedoch den Grundstein für die massive Ausweitung nativer KI-Funktionen auf mehr Windows-Geräte gelegt.
Das Herzstück dieses Frameworks ist ein kleines lokales Sprachmodell namens Phi Silica. Anstatt auf allen Systemen vorinstalliert zu sein, wird Phi Silica bei Bedarf über Windows Update verteilt: Das Modell wird nur heruntergeladen, wenn eine App es anfordert. Sobald das Modell installiert ist, kann es auf lokaler Hardware ausgeführt werden. Wenn eine verfügbare GPU erkannt wird, wird die GPU zuerst verwendet, um die Inferenz zu beschleunigen.
Die derzeit offengelegten Funktionen konzentrieren sich hauptsächlich auf textbezogene Aufgaben. Über die Windows.AI.Text-API können Apps Vorgänge wie die Zusammenfassung von Inhalten, das Umschreiben von Text, das Konvertieren von Text in ein strukturiertes Format und das Generieren von Eingabeaufforderungen ausführen. Aus Benutzersicht ähneln diese Funktionen der Erfahrung, die Cloud-KI-Tools bieten, mit der Ausnahme, dass die Berechnungen vollständig lokal durchgeführt werden.
Das Laufen vor Ort bringt einige praktische Vorteile mit sich. Durch die Verringerung der Abhängigkeit von Cloud-Computing-Leistung wird erwartet, dass die Reaktionsgeschwindigkeit des Systems verbessert wird. Gleichzeitig müssen die Daten nicht auf externe Server hochgeladen werden, was dazu beiträgt, dass die Daten auf dem lokalen Computer bleiben. Dieses Modell ist sowohl für Entwickler als auch für Unternehmensanwender im Hinblick auf Latenz, Bandbreitenkosten und Datenschutzkonformität potenziell attraktiv, was sich auf die Art und Weise auswirken könnte, wie sie KI-Funktionen nutzen.
Es sei darauf hingewiesen, dass diese Öffnung nicht bedeutet, dass das Copilot+-System vollständig „entriegelt“ ist. Einige der sichtbareren Copilot+-Funktionen, wie Windows Recall und Click to Do, sind derzeit noch an NPU-basierte Systeme gebunden. Derzeit ist die GPU-Unterstützung in erster Linie auf die API-Ebene des Sprachmodells beschränkt und nicht vollständig in das gesamte KI-Erlebnis integriert.
Obwohl Einschränkungen bestehen bleiben, ist der Trend bereits klar: Microsoft sieht die NPU nicht mehr als einzigen Einstiegspunkt für die native Windows-KI. Dadurch, dass die GPU diesen Teil der Arbeitslast bewältigen kann, wird die Auswahl an kompatibler Hardware erheblich erweitert und das „Nur-native-KI“-Image, das Copilot+ PC bei der Markteinführung hatte, wird geschwächt.