Es wird erwartet, dass KI als „schlechter Schauspieler“ bis Mitte 2024 eine tägliche Bedrohung für Demokratien darstellen wird

Eine neue Studie prognostiziert, dass bis Mitte 2024 Kampagnen mit künstlicher Intelligenz durch „schlechte Akteure“, die durch die Verbreitung von Desinformationen Schaden im Internet anrichten, an der Tagesordnung sein werden. Die Ergebnisse sind besorgniserregend, wenn man bedenkt, dass dieses Jahr in mehr als 50 Ländern, darunter auch den Vereinigten Staaten, nationale Wahlen abgehalten werden und die Ergebnisse globale Auswirkungen haben werden.

Noch bevor die neueste Version des Generative Pretrained Transformer (GPT)-Systems veröffentlicht wurde, prognostizierten KI-Experten, dass bis 2026 90 % der Online-Inhalte ohne menschliches Eingreifen computergeneriert sein würden, was zur Verbreitung von Fehlinformationen und Desinformationen führen würde.

Es besteht die Annahme, dass die großen Social-Media-Plattformen mit den meisten Nutzern reguliert werden sollten, um Risiken zu kontrollieren. Diese Annahme ist bis zu einem gewissen Grad richtig und macht sie auch zum Ziel von Gesetzen wie dem Digital Services Act und dem Artificial Intelligence Act der EU. Es gibt jedoch auch andere, kleinere „schlechte Akteure“ – Einzelpersonen, Gruppen und Länder, die absichtlich ein Verhalten an den Tag legen, das anderen Schaden zufügt –, die ebenfalls KI missbrauchen.

Eine neue Studie unter der Leitung von Forschern der George Washington University (GW) liefert die erste quantitative wissenschaftliche Analyse, die untersucht, wie schlechte Akteure künstliche Intelligenz und GPT-Systeme missbrauchen, um auf Social-Media-Plattformen auf der ganzen Welt Schaden anzurichten, und was dagegen getan werden kann.

„Alle reden über die Gefahren künstlicher Intelligenz, aber vor unserer Studie gab es keine wissenschaftliche Grundlage“, sagte Neil Johnson, der Hauptautor der Studie. „Ohne ein tiefes Verständnis des Schlachtfeldes kann man keine Schlacht gewinnen.“

Die Forscher begannen mit der Kartierung des dynamischen Netzwerks miteinander verbundener Social-Media-Gemeinschaften, aus denen die globale Online-Bevölkerung besteht. Benutzer – manchmal wenige Menschen, manchmal Millionen – treten diesen Communities aufgrund gemeinsamer Interessen bei, was auch schädlich sein kann. Die Forscher konzentrierten sich auf extreme „Anti-X“-Gemeinschaften, in denen zwei oder mehr der 20 neuesten Beiträge aus jeder Gemeinschaft explizite Hassreden und/oder extremen Nationalismus und/oder Rassismus enthielten. Zu diesen Anti-X-Gemeinschaften gehören antiamerikanische, frauenfeindliche, abtreibungsfeindliche oder antisemitische Gemeinschaften. Im Laufe der Zeit können die Verbindungen zwischen diesen Communities Community-Cluster innerhalb und über verschiedene Social-Media-Plattformen hinweg bilden.

„Jede Community A kann einen Link (d. h. einen Hyperlink) zu jeder Community B erstellen, solange der Inhalt von B für Mitglieder von A von Interesse ist. Der Link lenkt die Aufmerksamkeit von Mitgliedern von A auf B, und Mitglieder von A können Kommentare zu B hinzufügen, ohne dass Mitglieder von B den Link kennen – so können Mitglieder von Community B den Mitgliedern von Community A ausgesetzt und möglicherweise von ihnen beeinflusst werden“, sagten die Forscher.

Mithilfe mathematischer Modelle identifizierten die Forscher mögliche Aktivitäten zwischen schlechten Akteuren und KI und warum. Insbesondere stellten sie fest, dass die einfachsten GPT-Systeme, wie etwa GPT-2, ausreichend waren und mit größerer Wahrscheinlichkeit böswillige Akteure anlockten als ausgefeiltere Versionen, wie etwa GPT-3 oder -4. Dies liegt daran, dass GPT-2 problemlos den menschlichen Stil und die Inhalte in extremen Online-Communities reproduzieren kann und „schlechte Akteure“ grundlegende Tools wie GPT-2 ausnutzen können, um hetzerischere Ergebnisse zu erzeugen, indem sie die Form von Online-Anfragen subtil ändern, ohne deren Bedeutung zu ändern. Im Gegensatz dazu enthalten GPT-3 und -4 einen Filter, der Antworten auf potenziell kontroverse Eingabeaufforderungen überschreibt und so eine solche Ausgabe verhindert.

Die Forscher gehen davon aus, dass die KI-Aktivität bösartiger Schauspieler wahrscheinlich auf dem Online-„Schlachtfeld“ florieren wird, d. Zusammengenommen bilden diese Gemeinschaften ein Online-Ökosystem mit über einer Milliarde Menschen, das es Bösewichten, Schauspielern und künstlicher Intelligenz ermöglicht, auf globaler Ebene zu gedeihen. Um ihren Standpunkt zu veranschaulichen, führten die Forscher nicht durch KI erzeugten Hass und Extremismus im Zusammenhang mit COVID-19 und den jüngsten Kriegen zwischen Russland, der Ukraine und Israel und der Hamas an.

Sie gehen davon aus, dass schlechtes KI-Verhalten bis Mitte 2024 zum Alltag werden wird. Um dies festzustellen, verwendeten sie Proxy-Daten aus zwei historisch ähnlichen Vorfällen, bei denen es um die Manipulation elektronischer Online-Systeme ging: dem automatisierten algorithmischen Angriff auf US-Finanzmärkte im Jahr 2008 und dem chinesischen Cyberangriff auf die US-Infrastruktur im Jahr 2013. Durch die Analyse dieser Datensätze leiteten sie die Angriffshäufigkeit dieser beiden Vorfälle im Kontext der aktuellen Fortschritte in der Technologie der künstlichen Intelligenz ab.

2024 gilt als „das größte Wahljahr der Geschichte“. Mehr als 50 Länder, darunter auch die Vereinigten Staaten, werden dieses Jahr nationale Wahlen abhalten. Von Russland, Taiwan, dem Vereinigten Königreich und Indien bis hin zu El Salvador und Südafrika werden die Ergebnisse einiger Wahlen globale Auswirkungen haben und enorme Folgen für die Menschenrechte, die Wirtschaft, die internationalen Beziehungen und den Weltfrieden haben. Daher sei die Gefahr real, dass böswillige Akteure während dieser Wahlen künstliche Intelligenz nutzen, um Desinformation zu verbreiten und zu verstärken, sagen Forscher.

Sie empfehlen, dass Social-Media-Unternehmen Strategien zur Eindämmung von Desinformation ergreifen, anstatt jeden von böswilligen Akteuren generierten Inhalt zu entfernen.

Angesichts der sich schnell verändernden Natur der künstlichen Intelligenz warnen die Forscher hinsichtlich ihrer Ergebnisse. Dennoch verdeutlicht die Untersuchung einige der erheblichen Herausforderungen, die sich durch die Ausnutzung künstlicher Intelligenz durch böswillige Akteure ergeben.

Die Forscher sagten: „Aufgrund der rasanten Entwicklung der Technologie und der sich schnell verändernden Netzwerkumgebung kann niemand genau vorhersagen, was mit der KI von böswilligen Akteuren in der Zukunft passieren wird. Daher sind die Vorhersagen in diesem Artikel streng genommen spekulativ. Diese Vorhersagen sind jedoch quantifiziert, überprüfbar und verallgemeinerbar und bieten somit einen konkreten Ausgangspunkt für die Intensivierung der Diskussionen über Richtlinien für bösartige KI.“

Die Forschung wurde in der Zeitschrift PNAS Nexus veröffentlicht.