Die neue Generation der erweiterten KI-Diktierfunktionen, die Apple in der ersten Entwickler-Beta von iOS 27 für iPhone 17 Pro und iPhone Air eingeführt hat, ist derzeit nicht standardmäßig aktiviert. Benutzer müssen es manuell in den Systemeinstellungen aktivieren, wenn sie es erleben möchten.

Apple sagte, dass dieses neue KI-Diktiersystem eine „erhebliche Verbesserung“ der Erkennungsgenauigkeit aufweist. Es ist zuverlässiger als das bestehende Diktiersystem bei der automatischen Verarbeitung von Groß- und Kleinschreibung, Zeichensetzung usw. in Echtzeit und zielt darauf ab, das gesamte Spracheingabeerlebnis deutlich zu verbessern. Diese Funktion wird von Apples neuestem AFM 3 Core Advanced-Modell angetrieben, einem nativen multimodalen System mit einer spärlichen Architektur mit 20 Milliarden Parametern, das jeweils nur etwa 1 bis 4 Milliarden Parameter auf der Grundlage spezifischer Anforderungen aktiviert, um ein Gleichgewicht zwischen Leistung und Rechenleistungsverbrauch zu erreichen.

Um ein Modell dieser Größe auf einem Smartphone unterzubringen, speichert Apple das komplette Modell im Flash-Speicher statt im DRAM und verwendet ein leichtgewichtiges Routing-Modul, um während der anfänglichen Verarbeitungsphase einen festen Satz „Experten“-Subnetzwerke auszuwählen und ihn während des Generierungsprozesses regelmäßig erneut auszuwählen. Diese Technologie wird von Apple „Instruction-Following Pruning“ genannt. In der Apple-internen parallelen manuellen Bewertung wurde AFM 3 Core Advanced in sieben Qualitätsdimensionen mit dem bisherigen Massendiktiersystem verglichen. Die Ergebnisse zeigten, dass das neue Modell in der Gesamtqualitätsdimension einen Präferenzvorteil in einem Verhältnis von 44,7 % zu 17,6 % erlangte. Dieser Vorteil war im Wesentlichen auch in den verbleibenden sechs Dimensionen Interpunktion, Groß- und Kleinschreibung, Format, semantische Erfassung, gesprochene Redundanzverarbeitung und Stil konsistent.

Aufgrund der hohen Modellgröße und der Anforderungen an die Rechenleistung ist die verbesserte Diktierfunktion derzeit auf einige neue Geräte beschränkt, darunter iPhone 17 Pro, iPhone 17 Pro Max, iPhone Air, Apple Vision Pro mit M5-Chips, iPads mit M4-Chips und höher und mindestens 12 GB laufendem Speicher sowie Macs, die mit M3-Chips und höher und mindestens 12 GB laufendem Speicher ausgestattet sind. Es ist erwähnenswert, dass das Standard-iPhone 17 von der Supportliste ausgeschlossen ist, da es nur über 8 GB Arbeitsspeicher verfügt, was nicht den von Apple für diese Funktion festgelegten Schwellenwert von 12 GB erreicht. Gleichzeitig basiert auch Apples neue Generation der Siri-Stimme mit anpassbaren Ausdrucksstilen auf diesem AFM Core Advanced-Modell. Derzeit ist es auch als optionale Vorschaufunktion verfügbar, die eine aktive Aktivierung durch Benutzer erfordert.

Apple betont, dass das neue Diktiermodell vollständig auf dem lokalen Gerät läuft, sodass die Transkriptionsqualität unabhängig davon bleibt, ob das iPhone mit dem Netzwerk verbunden ist oder nicht. Dies bedeutet auch, dass die Sprachdaten des Benutzers nicht in die Cloud hochgeladen werden müssen, was zu einem besseren Schutz der Privatsphäre beiträgt. Ob diese erweiterte KI-Diktierfunktion bei Veröffentlichung der offiziellen Version von iOS 27 standardmäßig deaktiviert bleibt oder ob sie in nachfolgenden Beta-Zyklen automatisch aktiviert wird, hat Apple noch nicht klar erklärt.