Das singapurische Startup Acti hat kürzlich eine „Smart Agent Keyboard“-Anwendung für iOS und Android veröffentlicht und versucht, KI-Assistenten direkt in die Benutzeroberfläche zu integrieren, die Benutzer täglich am häufigsten verwenden – Smartphone-Tastaturen. Diese Tastatur kann nicht nur das nächste Wort vorhersagen, sondern auch aktiv Vorgänge in verschiedenen Anwendungen wie E-Mail, Messaging, sozialen Medien usw. ausführen und so eine Vielzahl von KI-Tools direkt in bestehende Anwendungsszenarien integrieren.

Wang Yang, Gründer und CEO von Acti, sagte, dass Benutzer bei der Verwendung von KI häufig zwischen mehreren Anwendungen wechseln müssen – chatten oder E-Mails schreiben und gleichzeitig eine separate KI-Anwendung öffnen, um Hilfe zu erhalten. Seiner Ansicht nach schränkt diese fragmentierte Erfahrung die tatsächliche Effizienz des KI-Agenten ein. Die Idee von Acti besteht darin, die Tastatur „über alle Anwendungen hinweg“ zu machen und eine Kontextschicht aufzubauen, die wirklich dem Benutzer und nicht der Plattform gehört. Dies ist seiner Meinung nach „die Grundlage der gesamten KI-Agenten-Ära“.
Im Gegensatz zum traditionellen Modell, das auf unabhängigen Chatbots oder KI-Apps basiert, zeigt Acti eine andere Möglichkeit für Benutzer auf, KI zu nutzen: die tiefe Einbettung von KI in bestehende Schnittstellen, anstatt eine neue Schnittstelle hinzuzufügen. Wenn beispielsweise ein Freund in einem Chat nach einem Restaurant in der Nähe fragt, kann Acti anrufen und lokale Empfehlungen direkt über die Tastatur senden; Wenn jemand in der Konversation eine Aktie erwähnt, kann der Benutzer direkt über die Tastatur Echtzeit-Aktienkurse teilen, ohne die Chat-Anwendung für die Suche verlassen zu müssen.
Hinsichtlich der zugrunde liegenden Technologie wird Acti vom Gemini-Modell von Google unterstützt. Wang Yang sagte, dass er sich für dieses Modell entschieden habe, weil es ein ausgewogenes Verhältnis zwischen Intelligenzniveau, Reaktionsgeschwindigkeit, Zuverlässigkeit, mehrsprachiger Leistung und Kosteneffizienz biete. Gemini ist auch an eine der Kernfunktionen von Acti, „Skills“, angepasst, einen Mechanismus, der dem Anpassen von Tastenkombinationen ähnelt. Benutzer können mehrstufige Aufgaben für einen bestimmten Schlüssel festlegen, z. B. die Übersetzung von Nachrichten mit einem Klick oder die Freigabe von Besprechungslinks mit einem Klick. Der entsprechende automatisierte Prozess kann durch Beschreibung in natürlicher Sprache generiert werden.

Acti betont, dass sein Design dem „Local-First“-Prinzip folgt und der persönliche Kontext des Benutzers standardmäßig auf dem lokalen Gerät gespeichert wird, um die Privatsphäre zu schützen. Beamte gaben an, dass die Anwendung nicht auf private Informationen, Gespräche oder persönlichen Kontext des Benutzers zugreift oder diese speichert, es sei denn, der Benutzer ruft aktiv eine Funktion auf, die eine Cloud-Verarbeitung erfordert. Zu diesem Zeitpunkt werden die relevanten Daten hochgeladen und im erforderlichen Umfang verarbeitet.
Zuvor arbeitete Wang Yang zehn Jahre lang bei Baidu, wo er an der Entwicklung der Facemoji-Tastatur beteiligt war und diese voranbrachte. Die Zahl der aktiven Benutzer pro Tag übersteigt die 300-Millionen-Marke. Diese Erfahrung veranlasste ihn auch dazu, die Rolle der Tastatur im KI-Zeitalter zu überdenken. Er glaubt, dass das Aufkommen großer Modelle bedeutet, dass „Text nicht mehr nur Eingabeinhalt, sondern Träger von Absichten“ ist. In vielen Alltagsszenarien können diese Absichten direkt in Taten umgesetzt werden. Daher ist es an der Zeit, dieses grundlegende Produkt, das Benutzer auf der ganzen Welt täglich verwenden – die Tastatur – „neu zu erfinden“.


Was das Geschäftsmodell betrifft, befindet sich Acti noch in der Entstehungsphase. Das Unternehmen plant, Einnahmen durch Abonnementgebühren zu generieren und zahlenden Benutzern eine leistungsfähigere Modellunterstützung, ein höheres tägliches Nutzungslimit und andere erweiterte Funktionen zu bieten. Derzeit sind einige Grundkenntnisse in der App voreingestellt. Durch langes Drücken des Buchstabens „T“ kann beispielsweise die aktuelle Nachricht in eine andere Sprache übersetzt werden, durch langes Drücken von „C“ kann schnell ein Besprechungslink gesendet werden usw., wodurch die Schwelle für normale Benutzer zur Nutzung komplexer Automatisierungsfunktionen gesenkt wird.

Es ist erwähnenswert, dass Benutzer keine Programmierkenntnisse benötigen, um ihre eigenen Fähigkeiten zu erstellen. Sie müssen nur natürliche Sprache verwenden, um die Vorgänge zu beschreiben, die die Tastatur ausführen soll, und Acti kann automatisch die entsprechenden mehrstufigen Aufgaben erstellen. Während der geschlossenen Betaphase vor dem offiziellen Start haben frühe Benutzer in weniger als zwei Wochen mehr als 1.000 Fertigkeiten erstellt. Diese Fertigkeiten können nur für den persönlichen Gebrauch verwendet oder öffentlich auf Actis Skill Market geteilt werden, damit andere Benutzer sie finden und nutzen können, z. B. um auf Echtzeit-WM-Daten zuzugreifen, Polymarket-Links zu erhalten usw.