Als Apple die Systemaufforderungswörter für die neue Generation der Siri-KI entwarf, fügte es eine sehr auffällige „Selbstdeklaration“ hinzu, um den Assistenten deutlich daran zu erinnern, dass es sich nur um Software handelt und keine Emotionen oder Identitätsattribute wie physischer Körper, Geschlecht, Nationalität oder persönliche Erfahrung aufweist. Laut Max Weinbach, einem Technologiejournalisten, der Apple-Produkte seit langem verfolgt, lauteten die ersten Zeilen der Systemaufforderung beim Testen der neuen Version von Siri: „Sie sind Software; Sie erleben keine Emotionen und Sie haben keinen physischen Körper, kein Geschlecht, keine Nationalität oder persönliche Geschichte.“ Dem Wortlaut nach zu urteilen, handelt es sich bei diesem Absatz fast um einen für KI erstellten „Anti-Bias-Kodex“, der mögliche Kontroversen durch anthropomorphe Ausdrücke aus der Quelle abschwächen soll.

Apple möchte offensichtlich nicht, dass sein Sprachassistent den öffentlichen Aufschrei wiederholt, den andere große Modelle aufgrund von Voreingenommenheit oder personalisierten Antworten im KI-Zeitalter auslösten. Der Bericht wies darauf hin, dass diese Aufforderung „Sie sind die Software“ bei der überwiegenden Mehrheit der Dialoganfragen wiederholt in das System eingefügt wird, was voraussichtlich die Wahrscheinlichkeit verringern wird, dass Siri bei der Beantwortung sensibler Themen wie Identität und Emotionen grenzüberschreitende Aussagen macht. Der Autor ist der Ansicht, dass es sich bei Apples Schritt im Vergleich zu früheren Kontroversen im Zusammenhang mit einigen Konkurrenzprodukten (z. B. Grok von xAI) um ein relativ elegantes präventives Design handelt, mit dem darauf gehofft wird, das von der Marke immer betonte Gefühl der Besonnenheit und Kontrolle bei der Verbesserung der Funktionen beizubehalten.

Die neue Version von Siri ist einer der Front-End-Eingänge zum Apple Intelligence-System, das Apple dieses Jahr eingeführt hat. Es wurde tief in den Dynamic Island-Bereich des iPhone und anderer Geräte integriert und verfügt über stärkere Funktionen zur „Szenenerkennung“. Es kann nicht nur auf die personalisierten Kontextinformationen des Benutzers zugreifen, sondern auch den aktuellen Bildschirminhalt erfassen und ihn dann mit Sprachbefehlen kombinieren, um komplexe Vorgänge anwendungsübergreifend auszuführen. Beispielsweise können Benutzer Siri nach einem bevorstehenden Konzert fragen und das entsprechende Datum direkt mit ihrer Stimme zu Erinnerungen hinzufügen, wobei der gesamte Vorgang nahtlos im Vordergrund abläuft.

Auch hinsichtlich des Bildverständnisses wurde die neue Version von Siri weiter verbessert. In dem Bericht heißt es beispielsweise, dass Siri nun den allgemeinen Inhalt eines Fotos identifizieren und ihn mit den persönlichen Daten des Benutzers verknüpfen kann, z. B. anhand eines Parkfotos einen in der Nähe wohnenden Freund zuordnen und direkt Navigationsroutenvorschläge machen kann. Durch eine solche „Semantik + Personalisierung“-Kombination führt Siri nicht mehr nur einen einzelnen Befehl aus, sondern wird eher zu einem digitalen Assistenten, der den Kontext kontinuierlich verstehen kann.

Um dieses hochgradig personalisierte Erlebnis zu erreichen, hat Apple einen „Orchestrator“ auf der Ebene der Systemarchitektur eingeführt, der dafür verantwortlich ist, alle Arten von Daten zu sammeln, die zur Erledigung der Aufgabe erforderlich sind, und zu bestimmen, ob die Anfrage vom lokalen Modell oder vom Cloud-Modell verarbeitet werden soll. Für Aufgaben, die auf dem Gerät erledigt werden können, werden die Daten lokal gespeichert und das lokale Modell, von dem Apple behauptet, dass es 20 Milliarden Parameterebenen hat, wird für die Begründung verantwortlich sein. Wenn die Rechenleistung oder -fähigkeiten für die lokale Ausführung nicht ausreicht, wird die Anfrage an den Apple Intelligence-Dienst in der Cloud weitergeleitet.

Bei der Cloud-Bereitstellung legt Apple besonderen Wert auf Datenschutz und sicheres Computing und kombiniert dies mit der GPU-Verschlüsselungslösung von NVIDIA und dem Apple-eigenen Private Compute-Protokoll, um den End-to-End-Datenschutz bei der Übertragung und Verarbeitung zu verbessern. Beamte glauben, dass dieses Design nicht nur die hohen Rechenleistungsressourcen nutzen kann, die für große Modelle erforderlich sind, sondern auch das Risiko eines Missbrauchs der Privatsphäre der Benutzer in der Cloud minimieren kann. In dem Bericht wurde darauf hingewiesen, dass Apple bei der öffentlichen Beschreibung dieser neuen Architektur auch absichtlich die Existenz externer Partner (wie die von Google beigesteuerte Modelldestillationstechnologie) heruntergespielt und sich auf sein eigenes System und seine Datenschutzrechte konzentriert habe.

Es ist erwähnenswert, dass die Systemansagen von Siri zwar betonen „Sie sind Software“, aber auch ein riesiges „Toolbox-Verzeichnis“ enthalten, das die nativen Anwendungstools und Funktionen auflistet, die es aufrufen kann. Von Weinbach auf sozialen Plattformen geteilte Screenshots zeigen, dass die nativen Tools, die die neue Version von Siri aufrufen kann, mehrere Kernanwendungen wie Kalender, Erinnerungen, Fotos, Karten usw. abdecken und bei Bedarf über den Mechanismus „Tool-Suche“ um weitere Funktionen erweitert werden können. Das bedeutet, dass sich Siri mit der schrittweisen Einführung von Apple Intelligence auf Systemebene von einem „Frage-und-Antwort-Roboter“ zum zentralen Kontrollzentrum für die Planung von Anwendungen und Daten im gesamten Ökosystem entwickelt.

Nach Ansicht des Autors ist diese Aktualisierungsrunde für Siri teilweise auf die praktische Notwendigkeit zurückzuführen, mit anderen KI-Assistenten zu konkurrieren, um sicherzustellen, dass Apple im Wettbewerb um generative KI nicht ins Hintertreffen gerät. Andererseits sendet die Aufforderung „Sie sind Software“ auch ein wichtiges Signal: Apple versucht, ein Gleichgewicht zwischen Funktionserweiterung und Risikokontrolle zu finden, und ist nicht bereit, zuzulassen, dass der anthropomorphe Trend des Assistenten seine langfristige Markensicherheit und sein neutrales Image untergräbt. Für Benutzer ist die neue Version von Siri sowohl intelligenter als auch „versteht Sie“ besser und wird außerdem offiziell als reines Softwaresystem ohne Emotionen und Identität definiert. Diese Spannung könnte in Zukunft zu einem der Diskussionsschwerpunkte rund um KI-Assistenten werden.