Untersuchungen zeigen, dass die generative KI-Kreativität die von gewöhnlichen Menschen übertroffen hat, aber Top-Ersteller liegen immer noch weit vorne

Eine groß angelegte Studie unter der Leitung der Abteilung für Psychologie der Universität Montreal in Kanada zeigt, dass generative künstliche Intelligenzsysteme bei einigen standardisierten Kreativitätstests normale menschliche Teilnehmer übertroffen haben, die kreativsten Menschen jedoch immer noch deutlich vorne liegen, was bedeutet, dass KI eher eine leistungsstarke kreative Hilfe als ein Ersatz für menschliche Schöpfer ist.

Die Forschung wurde von Karim Jerbi, einem Professor an der Universität Montreal, geleitet. Zu den Teammitgliedern gehörte Yoshua Bengio, ein Pionier des Deep Learning und Professor an der Universität Montreal. Sie führten eine systematische Auswertung einer Reihe gängiger großer Sprachmodelle (einschließlich ChatGPT, Claude, Gemini usw.) durch und verglichen sie mit Daten von mehr als 100.000 menschlichen Probanden. Es handelt sich derzeit um eine der größten Vergleichsstudien zur Mensch-Maschine-Kreativität. Der Artikel wurde in „Scientific Reports“ mit dem Titel „Divergent Creativity in Humans and Large Language Models“ veröffentlicht.

Die Ergebnisse zeigen, dass bei einigen Tests zur Messung der „divergenten Sprachkreativität“ die durchschnittliche Punktzahl einiger großer Sprachmodelle (einschließlich GPT-4) die von normalen Menschen übertraf. Jerbi bemerkte, dass dieser Befund „vielleicht überraschend und sogar beunruhigend“ sei, aber ebenso wichtig: Selbst die stärksten KI-Systeme schneiden immer noch schlechter ab als die kreativsten menschlichen Individuen.

Weitere Analysen ergaben, dass die durchschnittliche Leistung dieser Gruppe bereits besser war als die aller getesteten KI-Systeme, als die Forscher nur die Hälfte der Teilnehmer betrachteten, deren Kreativitätsniveau in der „oberen Hälfte“ der Menschen lag, und dass bei den besten 10 % der kreativen Menschen die Kluft zwischen Menschen und KI noch deutlicher war. Die Co-Erstautoren Antoine Bellemare-Pépin, Postdoktorand an der Universität Montreal, und François Lespinasse, Doktorand an der Concordia University, wiesen darauf hin, dass dies zeige, dass „das höchste Maß an Kreativität immer noch ein einzigartiger menschlicher Vorteil ist“.

Um Mensch und KI fair zu vergleichen, nutzte das Team verschiedene Methoden. Das Kernwerkzeug war die „Divergent Association Task“ (DAT), die vom Mitarbeiter Jay Olson, einem Forscher an der University of Toronto in Kanada, entwickelt wurde. Bei diesem psychologischen Test müssen die Teilnehmer – egal ob Mensch oder KI – in einer Antwort 10 Wörter nennen, die sich semantisch möglichst voneinander unterscheiden, wie zum Beispiel „Galaxie, Gabel, Freiheit, Alge, Mundharmonika, Quantum, Nostalgie, Samt, Hurrikan“ usw., und misst die Fähigkeit zum divergierenden Denken, indem der semantische Abstand zwischen Wörtern berechnet wird.

Frühere Untersuchungen haben gezeigt, dass die menschliche Leistung beim DAT stark mit den Ergebnissen anderer traditioneller Kreativitätstests wie kreativem Schreiben, Ideengenerierung, kreativer Problemlösung usw. korreliert und daher als schneller Indikator für umfassendere kreative kognitive Prozesse angesehen werden kann. Ein weiteres Merkmal von DAT ist, dass es einfach zu bedienen und zeitsparend ist (normalerweise dauert es nur zwei bis vier Minuten), und es ist in einem Online-Formular für die Öffentlichkeit zugänglich.

Nach Abschluss des Basisworttests untersuchte das Forschungsteam weiter, ob sich diese „sprachliche Niveau“-Leistung auf komplexere kreative Aufgaben übertragen lässt. Sie sorgten dafür, dass das KI-System in mehreren Schreibszenarien direkt mit menschlichen Teilnehmern konkurrierte, darunter das Erstellen von Haiku (dreizeilige Kurzgedichte), das Verfassen von Zusammenfassungen der Filmhandlungen und das Erstellen von Kurzgeschichten, und bewerteten dann die Qualität der Werke. Die Ergebnisse setzen das bisherige Muster fort: Bei einigen Aufgaben ist die durchschnittliche Leistung der KI besser als die von gewöhnlichen Menschen, aber bei den höherrangigen menschlichen Schöpfern, insbesondere denen, die am besten schreiben und Geschichten erzählen können, ist der menschliche Vorteil immer noch offensichtlich.

Die Forschung untersuchte auch eine Schlüsselfrage: Ist die „Kreativität“ der KI kontrollierbar und anpassbar? Die Antwort ist ja. Der Artikel wies darauf hin, dass ein wichtiger technischer Parameter die „Temperatur“ des Modells ist, die sich auf die Vorhersagbarkeit und Vielfalt des Ausgabeinhalts auswirkt: Wenn die Temperatur niedriger ist, sind die von der KI generierten Antworten konservativer und vorhersehbarer; Wenn die Temperatur höher ist, ist die Ausgabe variabler und sprunghafter, was häufig zu riskanteren, aber auch innovativeren Assoziationen führt.

Darüber hinaus hat auch die Art und Weise, wie die Eingabeaufforderung geschrieben wird, einen erheblichen Einfluss. Die Studie ergab, dass die KI mit größerer Wahrscheinlichkeit unerwartete Assoziationen herstellte und bei Kreativitätsbewertungen besser abschnitt, wenn Anweisungen das Modell dazu ermutigten, den Ursprung und die Struktur von Wörtern etymologisch zu berücksichtigen. Das bedeutet, dass die von KI gezeigte Kreativität stark auf menschliche Eingaben und Anleitungen angewiesen ist und die Gestaltung der Mensch-Computer-Interaktion zu einem der zentralen Bindeglieder im kreativen Prozess wird.

Vor dem Hintergrund weit verbreiteter Bedenken, dass KI kreative Arbeitskräfte „ersetzen“ wird, liefert diese Studie ein relativ vorsichtiges Urteil. Jerbi betonte, dass KI in einigen standardisierten Tests zwar inzwischen das durchschnittliche menschliche Kreativitätsniveau erreicht oder sogar übertrifft, es jedoch irreführend ist, die Mensch-Maschine-Beziehung zu sehr als „Konkurrenz“ zu verstehen. Aus seiner Sicht ist generative KI zunächst einmal ein äußerst mächtiges kreatives Werkzeug. „Es wird die Schöpfer nicht ersetzen, aber die Art und Weise, wie Schöpfer sich etwas vorstellen, erforschen und schaffen, grundlegend verändern – das hängt natürlich davon ab, ob sich die Menschen dafür entscheiden, es zu nutzen.“

Am Ende des Beitrags wird darauf hingewiesen, dass es besser sei, KI als einen „kreativen Assistenten“ zu betrachten, der die Grenzen der Vorstellungskraft erweitert, anstatt das Ende kreativer Karrieren vorherzusagen. Die zukünftige Kreativitätsökologie ist möglicherweise kein einfacher Kampf zwischen Menschen und Maschinen mehr, sondern ein neues Paradigma der Mensch-Maschine-Zusammenarbeit: KI bietet Menschen Inspiration, Variationen und Testgelände, während Menschen Ästhetik, Wert und Bedeutung auf einer höheren Ebene erfassen. Jerbi glaubt, dass diese Art von Forschung, die die Fähigkeiten von Menschen und Maschinen positiv vergleicht, die akademische Gemeinschaft und die Öffentlichkeit dazu zwingt, die grundlegende Frage zu überdenken, „was als Kreativität gilt.“