OpenAI hat einen großen Job gemacht: ChatGPT Codex

Man kann sagen, dass dieses Jahr das Jahr ist, in dem der Einsatz intelligenter Agenten explodiert. Von Gesprächsassistenten, die nur chatten können, bis hin zu digitalen Mitarbeitern, die selbstständig Code ausführen, PPT erstellen und sogar Videos im Hintergrund bearbeiten können – die Entwicklungsgeschwindigkeit von KI ist in der Tat lächerlich schnell. In diesem Kontext, in dem jeder intelligente Agenten entwickelt, hat OpenAI erneut einen Blockbuster veröffentlicht.

Bei der Live-Veranstaltung „Intelligence at Work“ gestern Abend gab OpenAI offiziell eine wichtige Entscheidung bekannt:

Sie planen, die Kernfunktionen von Codex in den nächsten Wochen direkt in die ChatGPT-Anwendung zu integrieren, wobei der bestehende Codex weiterhin als eigenständiges Programmiertool bestehen bleibt.

Sobald diese Nachricht herauskam, diskutierten viele ausländische Internetnutzer: Warum hat OpenAI dieses Killerprodukt in ChatGPT integriert?

Tatsächlich ist der Grund sehr einfach.

Auf dem Unternehmensmarkt kennen die meisten Unternehmen nur ChatGPT, sind jedoch mit Codex nicht vertraut, der stark entwicklerorientiert ist und einen besonderen Zugang erfordert. Viele Unternehmen wissen nicht einmal, in welchen Szenarien sie es einsetzen sollen.

Durch die nahtlose Integration der Agent-Ausführungsfunktionen von Codex in ChatGPT können Benutzer diese Funktionen direkt in einer vertrauten Chatbox aufrufen. Darüber hinaus hat OpenAI sechs wichtige Branchen-Plug-ins auf den Markt gebracht, darunter Vertrieb, Datenanalyse und kreative Produktion, die komplexe technische Tools direkt in tägliche Helfer für kleine und mittlere Unternehmen verwandeln.

Ich muss sagen, dass die bisherige Leistung von Codex auf den Mac- und Windows-Versionen äußerst erstaunlich war.

Erst letzten Monat hat OpenAI die Funktion zur Fernsteuerung des Computercodex über das mobile ChatGPT-Terminal implementiert. Die Realisierung dieser terminalübergreifenden Verknüpfung bedeutet, dass Benutzer ihren Heimcomputer automatisch Code ausführen, Dateien ändern und sogar eine kompakte Webseite erstellen können, indem sie einen Befehl an ihr Mobiltelefon senden.

Diese weitere Integration bedeutet, dass dieses plattformübergreifende Superagenten-Erlebnis für die Computersteuerung vollständig und nahtlos für alle verfügbar ist.

Werden also andere große Modellhersteller diesem Beispiel folgen?

Die Antwort ist ja.

Derzeit hat Microsoft verschiedene Copilot-Agenten tief in Windows-Systeme integriert. Tatsächlich beschleunigen auch inländische Unternehmen wie DingTalk und Feishu die Integration der zugrunde liegenden Ausführungsfunktionen großer Modelle in ein einheitliches Benutzerportal.

Schließlich ist die Energie der Nutzer begrenzt und niemand möchte Dutzende von KI-Tools für verschiedene Szenarien auf seinem Mobiltelefon installieren.

Die leistungsstarken zugrunde liegenden Fähigkeiten großer Modelle mit dem Agenten spezifischer Szenarien mit einem Klick zu kombinieren und die Komplexität dem System und die Einfachheit dem Benutzer zu überlassen, ist der allgemeine Trend zukünftiger KI-Anwendungen.

Normale Menschen müssen nicht verstehen, was Code oder Entwicklungstools in der Zukunft sind. Sie müssen Ihre Ideen nur in einfachem Englisch in ChatGPT ausdrücken, und der Rest der Drecksarbeit wird dem zugrunde liegenden Codex überlassen.

Dieser Sturm der Popularisierung von Agent-Anwendungen kommt tatsächlich schneller, als wir es uns vorgestellt haben.