Das Toyota Research Institute (TRI) nutzte im „Robotic Kindergarten“ generative künstliche Intelligenz, um Robotern beizubringen, Frühstück zuzubereiten – oder zumindest die einzelnen Aufgaben, die zum Zubereiten des Frühstücks erforderlich sind –, ohne Hunderte von Stunden Programmierung und Fehlerbehebung zu erfordern. Stattdessen erreichten Forscher dies in kurzer Zeit, indem sie Robotern einen Tastsinn gaben, sie in ein Modell der künstlichen Intelligenz einschlossen und ihnen dann beibrachten, was sie tun sollten, genau wie sie es einem Menschen tun würden.
Die Forscher sagen, Berührung sei „ein Schlüsselfaktor“. Indem der Roboter den kissenartigen Daumen ausstreckt, den Sie im Video unten sehen (meine Worte, nicht ihre), kann das Modell „fühlen“, was es tut, und mehr Informationen gewinnen. Dadurch lassen sich schwierige Aufgaben leichter bewältigen als durch bloßes Sehen.
„Es ist aufregend zu sehen, wie sie mit ihrer Umgebung interagieren“, sagte Ben Burchfiel, Leiter der Abteilung für geschickte Operationen im Labor. Zuerst demonstriert ein „Lehrer“ eine Reihe von Fähigkeiten, und dann „über ein paar Stunden“ lernt das Modell im Hintergrund. „Wir unterrichten einen Roboter oft nachmittags, lassen ihn über Nacht lernen und sehen dann am nächsten Morgen sein neues Verhalten“, fügte er hinzu.
Die Forscher sagen, dass sie versuchen, „Große Verhaltensmodelle“ (LargeBehaviorModels) oder LBMs für Roboter zu erstellen. „Ähnlich wie LLMs durch das Aufzeichnen menschlicher Schreibmuster trainiert werden, lernen die LBMs von Toyota durch Beobachtung und verallgemeinern sie dann, indem sie eine neue Fähigkeit ausführen, die ihnen noch nie beigebracht wurde“, sagte Russ Tedrake, Professor für Robotik am MIT und Vizepräsident für Robotikforschung am TRI.
Mit diesem Verfahren haben die Forscher nach eigenen Angaben mehr als 60 anspruchsvolle Fähigkeiten trainiert, etwa „Flüssigkeiten ausgießen, Werkzeuge verwenden und verformbare Objekte manipulieren“. Sie hoffen, diese Zahl bis Ende 2024 auf 1.000 zu erhöhen.
Google und Tesla haben mit ihrem RoboticTransformerRT-2 ähnliche Forschungen durchgeführt. Ähnlich dem Ansatz der Toyota-Forscher nutzt ihr Roboter seine eigenen Erfahrungen, um daraus zu schließen, wie Dinge zu tun sind. Theoretisch könnten KI-geschulte Roboter irgendwann Aufgaben fast ohne Anweisungen ausführen, außer einem Menschen eine allgemeine Anweisung zu geben (z. B. „Eine verschüttete Flüssigkeit beseitigen“).
Aber wie die New York Times in ihrer Berichterstattung über die Forschung des Suchriesen feststellte, haben die Bots von Google zumindest noch einen langen Weg vor sich. Diese Art von Arbeit ist oft „langsam und arbeitsintensiv“, und die Bereitstellung ausreichender Trainingsdaten ist viel schwieriger, als ein KI-Modell mit großen, aus dem Internet heruntergeladenen Datenmengen zu versorgen.