OpenAI kündigte mehrere wichtige Updates für seinen KI-Programmieragenten Codex an, die sich auf die Verbesserung der Automatisierung, Bildgenerierung und personalisierten Speicherfunktionen auf der Mac-Plattform konzentrieren. Codex kann jetzt Desktop-Mac-Anwendungen direkt über seinen eigenen Cursor steuern, sodass Sie Bildschirminhalte „sehen“ und Klicks, Eingaben usw. ausführen können, um verschiedene Aufgaben auszuführen.

Nach dem Update kann Codex mehrere Agenteninstanzen parallel auf demselben Mac ausführen, ohne die tägliche Nutzung der Benutzer zu beeinträchtigen. OpenAI gab an, dass diese Funktion Entwicklern beim Testen von Anwendungen, der Iteration der Front-End-Schnittstelle usw. helfen wird. Codex hat außerdem eine stärkere Speicherfunktion hinzugefügt, die sich die Vorlieben, allgemeinen Arbeitsabläufe, Technologie-Stacks und andere Informationen jedes Benutzers merken kann, wodurch es besser für persönliche tägliche Entwicklungsprozesse geeignet ist.
Im Hinblick auf die Automatisierung kann Codex nun die Arbeit nach einer Unterbrechung auf der Grundlage vorhandener Konversationsthreads wieder aufnehmen und sich selbst für zukünftige Arbeitsaufgaben einplanen, um über Tage oder sogar Wochen hinweg am selben Projekt weiterzuarbeiten. Es schlägt außerdem proaktiv umsetzbare Arbeiten vor, die auf dem Projektkontext, dem Speicherinhalt und den verbundenen Plug-Ins basieren.
Das Update führt außerdem einen integrierten Browser in Codex ein, der es Benutzern ermöglicht, direkt auf Webseiten Anmerkungen zu machen, um den Agenten präzisere Anweisungen zu geben. In Zukunft wird Codex auch die vollständige Kontrolle über den Browser erlangen, einschließlich des Öffnens von Websites, der Manipulation von Seiten durch Benutzerflüsse, der Erstellung von Screenshots und der Überprüfung der Ausgabeergebnisse.
Im Hinblick auf die generativen Fähigkeiten wurde Codex aktualisiert, um das gpt-image-1.5-Modell zum Generieren von Bildern innerhalb der Anwendung zu verwenden. Laut OpenAI wird dies dazu beitragen, schnell visuelle Assets für Produktkonzepte und Schnittstellenprototypen zu erstellen. Gleichzeitig unterstützt Codex jetzt mehrere Terminal-Registerkarten, kann GitHub-Code-Review-Kommentare verarbeiten und Dateien direkt in der Seitenleiste öffnen, wodurch umfangreiche Vorschauen für PDFs, Tabellenkalkulationen und andere Dokumente bereitgestellt werden.
In Verbindung mit diesen Funktionsaktualisierungen hat Codex außerdem mehr als 90 neue Plug-ins zur Kombination mehrerer Fähigkeiten, Anwendungsintegrationen und MCP-Server hinzugefügt, um seine Fähigkeit zu verbessern, kontextbezogene Informationen zu erhalten und tatsächlich zu arbeiten.
OpenAI sagte, dass diese Updates von nun an für Codex-Desktop-Benutzer bereitgestellt werden, die sich mit ChatGPT-Konten anmelden. Allerdings sind personalisierungsbezogene Funktionen für Benutzer in Unternehmen, im Bildungswesen sowie in der EU und im Vereinigten Königreich noch nicht verfügbar und werden voraussichtlich zu einem späteren Zeitpunkt eingeführt. Gleichzeitig ist die Computersteuerungsfunktion in der Europäischen Union und im Vereinigten Königreich vorübergehend nicht verfügbar.
Download-Adresse:
https://persistent.oaistatic.com/codex-app-prod/Codex.dmg