Google Gemini 3.5 Flash veröffentlicht: Agentenmodell für „Computerbetrieb“

Google hat kürzlich Gemini 3.5 Flash auf den Markt gebracht, das sich auf die „Computernutzung“-Fähigkeiten konzentriert und Modelle besser in die Lage versetzt, Computerschnittstellen direkt zu manipulieren, mehrstufige Aufgaben auszuführen und als aktivere Agenten bei Codierung, Forschung und komplexen Arbeitsabläufen zu fungieren. Dieses Update bedeutet, dass sich die Positionierung von Gemini weiter von einem traditionellen Frage-und-Antwort-Tool zu einer Führungs-KI gewandelt hat, die es tatsächlich „für Sie tun“ kann.

Gemini 3.5 Flash wird von Google als eines seiner bisher stärksten Modelle für Codierung und autonome Agentenaufgaben beschrieben. Beamte betonen, dass es geringe Latenz mit hoher Qualität verbindet und in mehreren Benchmark-Tests besser abschneidet als 3.1 Pro. Google sagte außerdem, dass diese Version die Ausgabegeschwindigkeit erheblich verbessert habe und für Szenarien geeignet sei, die schnelles Feedback und kontinuierliche Abläufe erfordern, wie etwa Programmierung, Tool-Aufrufe und automatisierte Büroarbeit.

Was die praktischen Fähigkeiten angeht, kann Gemini 3.5 Flash langkettige Aufgaben besser bewältigen, wie etwa die unabhängige Ausführung von Codierungsprozessen, die Verwaltung von Forschungsprojekten und sogar die Teilnahme an der komplexen Arbeit, ein Betriebssystem von Grund auf in internen Tests zu erstellen. Google sagte, dass dieses Modell nicht nur „schneller“ sei, sondern durch die optimierte Flash-Architektur auch Qualität und Geschwindigkeit verbessere, wodurch es besser für KI-Agent-Szenarien geeignet sei, die eine kontinuierliche Interaktion erfordern.

Google hat diese Fähigkeit auch in seine eigenen Produkte und Plattformen integriert. Der KI-Modus für Gemini-Apps und -Suche verwendet bereits standardmäßig Gemini 3.5 Flash und ist auch über die Gemini-API, Gemini Enterprise und zugehörige Entwicklertools verfügbar. Google erwähnte außerdem, dass durch dieses Modell auch suchorientierte Agentenfunktionen und eine neue Generation persönlicher KI-Agenten, Gemini Spark, unterstützt werden, mit dem Ziel, Benutzern die Erledigung täglicher digitaler Aufgaben mit weniger menschlichem Eingreifen zu ermöglichen.

In Bezug auf die Sicherheit sagte Google, dass mit der Verbreitung stärkerer autonomer Agentenfähigkeiten gleichzeitig auch die Risikokontrolle gestärkt wurde, insbesondere die Netzwerksicherheit und der CBRN-bezogene Sicherheitsschutz. Wenn diese Art von Modell auf sensible Probleme stößt, verweigert es nicht einfach die Antwort, sondern verarbeitet die Anfrage lieber in einem kontrollierbaren Rahmen und wartet bei Bedarf auf die Bestätigung des Benutzers. Insgesamt stellt Gemini 3.5 Flash einen wichtigen Fortschritt von Google in der Richtung dar, „Aufgaben direkt von der KI ausführen zu lassen“.