NVIDIA Research gab heute bekannt, dass es einen neuen Agenten für künstliche Intelligenz namens „Eureka“ entwickelt hat, der auf GPT-4 von OpenAI basiert und Robotern autonom komplexe Fähigkeiten beibringen kann.
Besuchen Sie die Kaufseite:
Produktübersicht der NVIDIA-Serie von JD.com
Das Unternehmen sagte in einem Blogbeitrag, dass Eureka, das eigene Belohnungsalgorithmen schreiben kann, das erste Unternehmen ist, das einer Roboterhand beibringt, wie Menschen schnelle Stiftdrehfähigkeiten auszuführen. Eureka hat dem Roboter außerdem fast 30 Aufgaben beigebracht, darunter das Öffnen von Schubladen und Schränken, das Werfen und Fangen eines Balls sowie das Bedienen einer Schere.
„Reinforcement Learning hat in den letzten zehn Jahren beeindruckende Siege errungen, aber es bleiben noch viele Herausforderungen bestehen, wie zum Beispiel das Belohnungsdesign, das nach wie vor ein Versuch-und-Irrtum-Prozess ist“, sagte Anima Anandkumar, leitende Direktorin für künstliche Intelligenzforschung bei NVIDIA und Autorin des Eureka-Artikels, in einem Blogbeitrag. „Eureka ist ein erster Schritt bei der Entwicklung neuer Algorithmen, die generative und verstärkende Lernmethoden integrieren, um schwierige Aufgaben zu lösen.“
NVIDIA Research hat außerdem die Eureka-Bibliothek für künstliche Intelligenzalgorithmen veröffentlicht, damit Menschen Experimente mit NVIDIA AIsaacGym durchführen können, einer Referenzanwendung für physikalische Simulationen für die Forschung zum verstärkten Lernen. IsaacGym basiert auf NVIDIA Omniverse, einer Entwicklungsplattform zum Erstellen von 3D-Tools und -Anwendungen basierend auf dem OpenUSD-Framework.
Die Begeisterung für künstliche Intelligenz-Agenten hält schon seit Monaten an, einschließlich des Aufstiegs autonomer künstlicher Intelligenz-Agenten wie Auto-GPT, BabyAGI und AgentGPT im April dieses Jahres.
Die aktuelle Arbeit von NVIDIA Research baut auf früheren Arbeiten auf, darunter zuletzt auf Voyager, einem auf GPT-4 basierenden Agenten für künstliche Intelligenz, der Minecraft autonom spielen kann. Diese Woche veröffentlichte die New York Times einen Artikel über die Umwandlung von Chatbots in Online-Agenten. Jeff Clune, Informatikprofessor an der University of British Columbia und ehemaliger Forscher bei OpenAI, sagte: „Dies ist eine riesige Geschäftsmöglichkeit mit dem Potenzial, Einnahmen in Billionenhöhe zu erzielen. Das hat enorme Vorteile und enorme Auswirkungen auf die Gesellschaft.“
In einem neuen Forschungspapier mit dem Titel „Eureka: Belohnungsdesign auf menschlicher Ebene durch Kodierung großer Sprachmodelle“ sagen die Autoren: „Eureka nutzt die außergewöhnlichen Nullpunktgenerierungs-, Code-Schreib- und Kontextverbesserungsfähigkeiten hochmoderner LLMs wie GPT-4, um den Belohnungscode weiterzuentwickeln.“
Die resultierenden Belohnungen können zum Erwerb komplexer Fähigkeiten durch verstärkendes Lernen genutzt werden. „In Ermangelung aufgabenspezifischer Eingabeaufforderungen oder vordefinierter Belohnungsvorlagen übertreffen die von Eureka generierten Belohnungsfunktionen die von Menschen entwickelten Expertenbelohnungen. In einer Reihe von 29 Open-Source-RL-Umgebungen mit 10 verschiedenen Robotermorphologien übertraf Eureka menschliche Experten bei 83 % der Aufgaben, mit einer durchschnittlichen normalisierten Verbesserung von 52 %.“
„Eureka ist eine einzigartige Kombination aus großen Sprachmodellen und der GPU-beschleunigten Simulationstechnologie von NVIDIA“, sagte Jim Fan, leitender Forschungswissenschaftler bei NVIDIA und Mitwirkender am Projekt, in einem Blogbeitrag. „Wir glauben, dass Eureka eine geschickte Robotersteuerung ermöglichen und Künstlern eine neue Möglichkeit bieten wird, physisch realistische Animationen zu erstellen.“